LLM API Fiyatlandırması Nasıl Çalışır
LLM'ler, million tokens başına ayrı olarak input (istem + bağlam) ve output (modelin geri yazdıkları) için ücret alır. Çıktı tipik olarak girdiden 3–5 kat daha pahalıdır. Bir token, yaklaşık 4 İngilizce karakter veya bir kelimenin ¾'üdür.
Cost = (input_tokens × input_$ / 1M) + (output_tokens × output_$ / 1M)
2026 Fiyat Manzarası
Üç katman ortaya çıkmıştır:
- Frontier ($10–$75 / 1M tokens): Claude Opus 4.7, GPT-5, Gemini 3.1 Pro — en iyi akıl yürütme, görü, uzun bağlam
- Workhorse ($1–$5 / 1M): Claude Sonnet 4.6, GPT-5 mini, Gemini 2.5 Flash — sınır kalitesinin %90'ı, fiyatın %10–20'si
- Budget ($0.10–$1 / 1M): Claude Haiku 4.5, GPT-5 nano, DeepSeek V3, Llama 3.3 70B (Groq/Together aracılığıyla) — etiketleme, sınıflandırma, basit sohbet için mükemmel
Gerçek Tasarrufların Yaşadığı Yer
Fiyatlandırma kolay kaldıraçtır; architectural levers move 2–10× more cost:
- Prompt caching — Tekrar eden sistem promptları ve RAG bağlamı normal fiyatın yaklaşık %10'unda önbelleğe alınır. Chat / ajan uygulamaları için %70+ önbellek isabet oranı gerçekçidir. Giriş faturasını %75–90 azaltır.
- Batch API — 24 saate kadar bekleyebilen işler için %50 indirim. Arka plan dolguları, değerlendirmeler, belge işleme hatları için idealdir.
- Tiered routing — basit yanıtları ucuz bir modele gönderin ve yalnızca gerektiğinde sınır modeline yükseltin. Tipik asistanlar için karışık maliyeti yarıya indirir.
- Reasoning budgets — o serisi ve Claude genişletilmiş düşünme için düşünme tokenlarını sınırlayın. Varsayılan düşünme çıkış maliyetini 5–10 kat artırabilir.
- Self-hosted open weights — Tek bir H100 üzerinde Llama 3.3 70B, %80'in üzerinde kullanımda ~0,20 $/M tokendır; yalnızca günde ~50M tokenın üzerinde değerlidir.
Karşılaştırma Tablosunu Okuma
Tablo, girdilerinizde aylık harcamaya göre sıralanır. Çoğu uygulama input-heavy türündendir (RAG, uzun belgeler, sistem istemleri), girdi fiyatının toplam maliyete hakim olduğu. Kısa istemler ve uzun tamamlamalar içeren sohbet tarzı uygulamalar output-heavy türündendir — çıktı fiyatı hakimdir.
Diğer Maliyet Hususları
- Context window: daha uzun bağlam = daha iyi alma ama daha fazla giriş token = daha yüksek maliyet
- Vision / image input: görseller token'lara dönüşür (genellikle görsel başına 200–1.200)
- Tool use / function calls: araç tanımları, önbelleğe alınmadıkça her turda giriş olarak sayılır
- Fine-tuning: eğitim ücreti + genellikle temel model fiyatının 2–4 katı çıkarım
Belirli bir promptu tahmin etmek için Prompt Cost Calculator'ımız, proje düzeyindeki senaryolar için AI Model Cost Calculator ve LLM maliyetini değiştirdiği insan-iş gücü maliyetine karşı karşılaştırmak için AI ROI Calculator ile eşleştirin.
İlgili Hesap Makineleri
- AI Model Cost Calculator — GPT-4o, Claude, Gemini ve Llama dahil 100+ LLM için API fiyatlarını karşılaştırın. Kesin token maliyetlerini hesaplayın.
- AI vs Human ROI Calculator — AI araç maliyetlerini insan iş gücüne karşı karşılaştırın. Aylık tasarruf, yıllık ROI ve canlı model fiyatlandırması ile başabaş.
- Prompt Cost Calculator — Promptunuzu yapıştırın, bir model seçin ve hemen kaç token kullandığını ve göndermenin maliyetini görün.