🤖 LLM लागत तुलनाकर्ता

सभी प्रमुख LLM API में साइड-बाय-साइड लागत। मूल्य OpenRouter से लाइव प्राप्त किया जाता है और 24 घंटे के लिए कैश किया जाता है — Claude Opus, GPT, Gemini, Llama, DeepSeek और अधिक को कवर करता है।

OpenRouter से मॉडल लोड हो रहे हैं…
बार-बार उपसर्ग? 70%+ यथार्थवादी।
ℹ️ OpenRouter से प्राप्त (24-घंटे ब्राउज़र कैश)। OpenRouter एक छोटा मार्जिन लेता है, इसलिए कीमतें सीधे प्रदाता मूल्य निर्धारण से थोड़ी भिन्न हो सकती हैं। कैश किया गया इनपुट सामान्य इनपुट मूल्य का ~10% है (Anthropic / OpenAI)। बैच API मूल्य निर्धारण मानक का ~50% है। रीज़निंग मॉडल (o-series, Claude with extended thinking) सोच टोकन को आउटपुट के रूप में बिल करते हैं। यदि लाइव फ़ीड अनुपलब्ध है तो हम मई 2026 की सूची कीमतों पर वापस आते हैं।

LLM API मूल्य निर्धारण कैसे काम करता है

LLM प्रति million tokens चार्ज करते हैं, input (आपका प्रॉम्प्ट + संदर्भ) और output (मॉडल जो वापस लिखता है) के लिए अलग से। आउटपुट आमतौर पर इनपुट से 3-5× अधिक महंगा होता है। एक टोकन लगभग 4 अंग्रेजी अक्षर या ¾ शब्द होता है।

Cost = (input_tokens × input_$ / 1M) + (output_tokens × output_$ / 1M)

2026 मूल्य परिदृश्य

तीन स्तर उभरे हैं:

  • Frontier ($10–$75 / 1M tokens): Claude Opus 4.7, GPT-5, Gemini 3.1 Pro — सर्वोत्तम तर्क, दृष्टि, लंबा संदर्भ
  • Workhorse ($1–$5 / 1M): Claude Sonnet 4.6, GPT-5 mini, Gemini 2.5 Flash — फ्रंटियर गुणवत्ता का 90%, कीमत का 10-20%
  • Budget ($0.10–$1 / 1M): Claude Haiku 4.5, GPT-5 nano, DeepSeek V3, Llama 3.3 70B (Groq/Together के माध्यम से) — टैगिंग, वर्गीकरण, सरल चैट के लिए बिल्कुल सही

वास्तविक बचत कहाँ है

मूल्य निर्धारण आसान लीवर है; architectural levers move 2–10× more cost:

  • Prompt caching — दोहराए गए सिस्टम प्रॉम्प्ट और RAG संदर्भ सामान्य मूल्य के ~10% पर कैश किए जाते हैं। चैट / एजेंट ऐप्स के लिए 70%+ कैश हिट दर यथार्थवादी है। इनपुट बिल को 75-90% तक कम करता है।
  • Batch API — 24 घंटे तक प्रतीक्षा कर सकने वाले कार्यों के लिए 50% छूट। बैकफिल, मूल्यांकन, दस्तावेज़-प्रसंस्करण पाइपलाइन के लिए बिल्कुल सही।
  • Tiered routing — सरल कार्यों को सस्ते मॉडल पर भेजें और केवल जरूरत पड़ने पर फ्रंटियर मॉडल पर एस्केलेट करें। सामान्य सहायकों के लिए मिश्रित लागत आधी हो जाती है।
  • Reasoning budgets — o-series और Claude extended thinking के लिए, सोच टोकन को सीमित करें। डिफ़ॉल्ट सोच आउटपुट लागत को 5-10× बढ़ा सकती है।
  • Self-hosted open weights — एकल H100 पर Llama 3.3 70B 80%+ उपयोग पर ~$0.20/M टोकन है; केवल ~50M टोकन/दिन से ऊपर उचित है।

तुलना तालिका पढ़ना

तालिका आपके इनपुट पर मासिक खर्च के अनुसार क्रमबद्ध है। अधिकांश ऐप input-heavy (RAG, लंबे दस्तावेज़, सिस्टम प्रॉम्प्ट) हैं, जहाँ इनपुट मूल्य कुल लागत पर हावी है। छोटे प्रॉम्प्ट और लंबे पूर्णताओं वाले चैट-शैली ऐप output-heavy हैं — आउटपुट मूल्य हावी है।

अन्य लागत विचार

  • Context window: लंबा संदर्भ = बेहतर पुनर्प्राप्ति लेकिन अधिक इनपुट टोकन = उच्च लागत
  • Vision / image input: छवियाँ टोकन में परिवर्तित होती हैं (सामान्यतः 200–1,200 प्रति छवि)
  • Tool use / function calls: टूल परिभाषाएं कैश न होने तक प्रत्येक टर्न पर इनपुट के रूप में गिनी जाती हैं
  • Fine-tuning: प्रशिक्षण शुल्क + अनुमान पर सामान्यतः बेस मॉडल मूल्य का 2–4 गुना

एक विशिष्ट प्रॉम्प्ट का अनुमान लगाने के लिए हमारे Prompt Cost Calculator के साथ, प्रोजेक्ट-स्तरीय परिदृश्यों के लिए AI Model Cost Calculator के साथ, और मानव-श्रम लागत के मुकाबले LLM लागत की तुलना करने के लिए AI ROI Calculator के साथ जोड़ें जिसे यह बदलता है।

⚠️
महत्वपूर्ण नोट: मई 2026 तक सटीक कीमतें जो अक्सर बदलती हैं। किसी अनुबंध के लिए प्रतिबद्ध होने से पहले हमेशा प्रदाता के आधिकारिक मूल्य निर्धारण पृष्ठ (Anthropic, OpenAI, Google AI, Together, DeepSeek) पर पुष्टि करें। वॉल्यूम छूट, क्षेत्रीय मूल्य निर्धारण और Azure/Bedrock मार्जिन प्रभावी दरों को 10–30% तक बदल सकते हैं।

संबंधित कैलकुलेटर

  • AI Model Cost Calculator — GPT-4o, Claude, Gemini और Llama सहित 100+ LLM के लिए API मूल्य निर्धारण की तुलना करें। सटीक टोकन लागतों की गणना करें।
  • AI vs Human ROI Calculator — AI उपकरण लागतों की तुलना मानव श्रम से करें। लाइव मॉडल मूल्य निर्धारण के साथ मासिक बचत, वार्षिक ROI और ब्रेक-ईवन।
  • Prompt Cost Calculator — अपना प्रॉम्प्ट पेस्ट करें, एक मॉडल चुनें, और तुरंत देखें कि यह कितने टोकन का उपयोग करता है और भेजने में क्या लागत आती है।