“AI tool’u VPS’e kurarım, çalışır.” Gerçekte işler bu kadar basit değildir.
AI modelleri:
- yüksek RAM ister
- CPU’da yavaş çalışır
- GPU olmadan sınırlıdır
Yanlış beklenti → düşük performans + kaynak tükenmesi + zaman kaybı
Bu rehberde VPS üzerinde AI çalıştırmanın gerçek sınırlarını ve doğru kullanım senaryolarını anlatıyoruz.
1. VPS Üzerinde AI Çalıştırmak Mümkün mü?
Evet, ama sınırlı:
Çalışır:
- küçük model (≤ 7B)
- düşük trafik
- batch kullanım
Çalışmaz:
- gerçek zamanlı chatbot
- yüksek concurrency
- büyük model (13B+)
2. RAM Gereksinimi
Numeric Example #1
| Model | Min RAM | Real RAM |
|---|---|---|
| 3B | 4GB | 8GB |
| 7B | 8GB | 16GB |
| 13B | 16GB | 32GB+ |
RAM yetmezse → swap → crash
3. CPU vs GPU
Numeric Example #2
| Setup | Speed |
|---|---|
| CPU | 1–5 tok/s |
| GPU | 40–120 tok/s |
CPU 8–20x daha yavaş
4. Production Senaryosu
BEFORE:
- VPS
- 12–18s response
- %20 timeout
AFTER:
- API/GPU
- 1.2–2.5s
- %2 timeout
5. Benchmark
| Metric | VPS | GPU | API |
|---|---|---|---|
| Speed | 12s | 1.5s | 1.8s |
| Cost | düşük | yüksek | usage |
| Scale | düşük | orta | yüksek |
6. Maliyet
- VPS: $20–60
- GPU: $400–1500
- API: usage
Karar:
- test → VPS
- production → API/GPU
7. Implementasyon
Docker
version: "3"
services:
ai:
image: ollama/ollama
ports:
- "11434:11434"
Resource Limit
deploy:
resources:
limits:
memory: 8g
cpus: "4"
8. Gerçek vs Hype
Hype:
- kolay
- ucuz
Gerçek:
- RAM limit
- CPU bottleneck
- production uygun değil
9. Riskler
- crash
- yavaşlık
- kullanıcı kaybı
10. Trade-off
| Seçenek | Artı | Eksi |
|---|---|---|
| VPS | ucuz | yavaş |
| GPU | hızlı | pahalı |
| API | kolay | bağımlılık |
11. External Sources
- Hugging Face – Model Hardware Requirements
- NVIDIA – GPU Inference Performance Guide
12. Internal Links
- /blog/vps-vs-dedicated-performans-analizi
- /blog/ram-ve-cpu-ihtiyaci
- /blog/docker-ve-vps-rehberi
13. Sonuç (CTA)
VPS üzerinde AI çalıştırmak mümkündür. Ama çoğu zaman doğru çözüm değildir.
Eğer sisteminizin yeterli olup olmadığını bilmiyorsanız: performans analizi talebi oluşturun.
SELF_CHECK:
intent_match: yes numeric_count: 3 metric_count: 5 implementation_count: 2 sources_count: 2 benchmark_context: provided comparison_strength: strong