LLM API मूल्य निर्धारण कैसे काम करता है
LLM प्रति million tokens चार्ज करते हैं, input (आपका प्रॉम्प्ट + संदर्भ) और output (मॉडल जो वापस लिखता है) के लिए अलग से। आउटपुट आमतौर पर इनपुट से 3-5× अधिक महंगा होता है। एक टोकन लगभग 4 अंग्रेजी अक्षर या ¾ शब्द होता है।
Cost = (input_tokens × input_$ / 1M) + (output_tokens × output_$ / 1M)
2026 मूल्य परिदृश्य
तीन स्तर उभरे हैं:
- Frontier ($10–$75 / 1M tokens): Claude Opus 4.7, GPT-5, Gemini 3.1 Pro — सर्वोत्तम तर्क, दृष्टि, लंबा संदर्भ
- Workhorse ($1–$5 / 1M): Claude Sonnet 4.6, GPT-5 mini, Gemini 2.5 Flash — फ्रंटियर गुणवत्ता का 90%, कीमत का 10-20%
- Budget ($0.10–$1 / 1M): Claude Haiku 4.5, GPT-5 nano, DeepSeek V3, Llama 3.3 70B (Groq/Together के माध्यम से) — टैगिंग, वर्गीकरण, सरल चैट के लिए बिल्कुल सही
वास्तविक बचत कहाँ है
मूल्य निर्धारण आसान लीवर है; architectural levers move 2–10× more cost:
- Prompt caching — दोहराए गए सिस्टम प्रॉम्प्ट और RAG संदर्भ सामान्य मूल्य के ~10% पर कैश किए जाते हैं। चैट / एजेंट ऐप्स के लिए 70%+ कैश हिट दर यथार्थवादी है। इनपुट बिल को 75-90% तक कम करता है।
- Batch API — 24 घंटे तक प्रतीक्षा कर सकने वाले कार्यों के लिए 50% छूट। बैकफिल, मूल्यांकन, दस्तावेज़-प्रसंस्करण पाइपलाइन के लिए बिल्कुल सही।
- Tiered routing — सरल कार्यों को सस्ते मॉडल पर भेजें और केवल जरूरत पड़ने पर फ्रंटियर मॉडल पर एस्केलेट करें। सामान्य सहायकों के लिए मिश्रित लागत आधी हो जाती है।
- Reasoning budgets — o-series और Claude extended thinking के लिए, सोच टोकन को सीमित करें। डिफ़ॉल्ट सोच आउटपुट लागत को 5-10× बढ़ा सकती है।
- Self-hosted open weights — एकल H100 पर Llama 3.3 70B 80%+ उपयोग पर ~$0.20/M टोकन है; केवल ~50M टोकन/दिन से ऊपर उचित है।
तुलना तालिका पढ़ना
तालिका आपके इनपुट पर मासिक खर्च के अनुसार क्रमबद्ध है। अधिकांश ऐप input-heavy (RAG, लंबे दस्तावेज़, सिस्टम प्रॉम्प्ट) हैं, जहाँ इनपुट मूल्य कुल लागत पर हावी है। छोटे प्रॉम्प्ट और लंबे पूर्णताओं वाले चैट-शैली ऐप output-heavy हैं — आउटपुट मूल्य हावी है।
अन्य लागत विचार
- Context window: लंबा संदर्भ = बेहतर पुनर्प्राप्ति लेकिन अधिक इनपुट टोकन = उच्च लागत
- Vision / image input: छवियाँ टोकन में परिवर्तित होती हैं (सामान्यतः 200–1,200 प्रति छवि)
- Tool use / function calls: टूल परिभाषाएं कैश न होने तक प्रत्येक टर्न पर इनपुट के रूप में गिनी जाती हैं
- Fine-tuning: प्रशिक्षण शुल्क + अनुमान पर सामान्यतः बेस मॉडल मूल्य का 2–4 गुना
एक विशिष्ट प्रॉम्प्ट का अनुमान लगाने के लिए हमारे Prompt Cost Calculator के साथ, प्रोजेक्ट-स्तरीय परिदृश्यों के लिए AI Model Cost Calculator के साथ, और मानव-श्रम लागत के मुकाबले LLM लागत की तुलना करने के लिए AI ROI Calculator के साथ जोड़ें जिसे यह बदलता है।
संबंधित कैलकुलेटर
- AI Model Cost Calculator — GPT-4o, Claude, Gemini और Llama सहित 100+ LLM के लिए API मूल्य निर्धारण की तुलना करें। सटीक टोकन लागतों की गणना करें।
- AI vs Human ROI Calculator — AI उपकरण लागतों की तुलना मानव श्रम से करें। लाइव मॉडल मूल्य निर्धारण के साथ मासिक बचत, वार्षिक ROI और ब्रेक-ईवन।
- Prompt Cost Calculator — अपना प्रॉम्प्ट पेस्ट करें, एक मॉडल चुनें, और तुरंत देखें कि यह कितने टोकन का उपयोग करता है और भेजने में क्या लागत आती है।