🤖 LLM成本比较器

所有主流LLM API的并排费用比较。定价从OpenRouter实时获取并缓存24小时——涵盖Claude Opus、GPT、Gemini、Llama、DeepSeek等更多模型。

正在从OpenRouter加载模型……
重复前缀?70%以上可信。
ℹ️ 来源:OpenRouter(24 小时浏览器缓存)。 价格可能与直接提供商定价略有不同,因为OpenRouter收取少量利润。缓存输入约为正常输入价格的10%(Anthropic / OpenAI)。批量API定价约为标准定价的50%。推理模型(o系列、具有扩展思考的Claude)将思考令牌计为输出。如果实时数据源不可用,我们将回退到2026年5月的标价。

大语言模型API定价方式

大语言模型按million tokens收费,分别计算input(您的提示+上下文)和output(模型回写的内容)。输出通常比输入贵3-5倍。一个令牌大约是4个英文字符或4/5个单词。

Cost = (input_tokens × input_$ / 1M) + (output_tokens × output_$ / 1M)

2026 年价格格局

已出现三个层级:

  • Frontier ($10–$75 / 1M tokens): Claude Opus 4.7、GPT-5、Gemini 3.1 Pro — 最强推理、视觉与长上下文
  • Workhorse ($1–$5 / 1M): Claude Sonnet 4.6、GPT-5 mini、Gemini 2.5 Flash — 达到顶级模型90%的质量,仅需10-20%的费用
  • Budget ($0.10–$1 / 1M): Claude Haiku 4.5、GPT-5 nano、DeepSeek V3、Llama 3.3 70B(通过Groq/Together)— 非常适合标注、分类、简单对话

真正的节省在哪里

定价是最容易调整的杠杆;architectural levers move 2–10× more cost

  • Prompt caching — 重复的系统提示和 RAG 上下文以正常价格的约 10% 缓存。聊天/代理应用的 70%+ 缓存命中率是现实的。削减输入费用 75–90%。
  • Batch API — 可等待最多24小时的任务享受50%折扣。非常适合后台填充、评估和文档处理流水线。
  • Tiered routing — 将简单请求发送给廉价模型,仅在需要时升级到前沿模型。可将典型助手的综合成本降低一半。
  • Reasoning budgets — 对于o系列和Claude扩展思考模式,请限制思考令牌数。默认思考模式可能使输出成本增加5–10倍。
  • Self-hosted open weights — 在单台H100上运行Llama 3.3 70B,80%以上利用率约0.20美元/百万令牌;仅在每日超过约5000万令牌时才值得考虑。

读懂对比表

表格按您的输入条件下的月度支出排序。大多数应用程序是input-heavy(RAG、长文档、系统提示),其中输入价格主导总成本。具有简短提示和长补全的聊天类应用程序是output-heavy——输出价格主导。

其他费用考量

  • Context window: 较长的上下文 = 更好的检索,但更多的输入 token = 更高的成本
  • Vision / image input: 图片转换为tokens(通常每张图片200–1,200个)
  • Tool use / function calls: 工具定义在每次对话中均计为输入,除非已缓存
  • Fine-tuning: 训练费用 + 推理通常为基础模型价格的2–4倍

与我们的 Prompt Cost Calculator 配合使用以估算特定提示,AI Model Cost Calculator 用于项目级情景,AI ROI Calculator 用于比较 LLM 成本与其替代的人力成本。

⚠️
重要提示: 价格准确至2026年5月,变动频繁。在签订合同前,请务必在提供商官方定价页面(Anthropic、OpenAI、Google AI、Together、DeepSeek)确认最新价格。批量折扣、区域定价和Azure/Bedrock利润可能使实际费率变动10–30%。

相关计算器

  • AI Model Cost Calculator — 比较 100+ LLM 的 API 价格,包括 GPT-4o、Claude、Gemini 和 Llama。精确计算 token 成本。
  • AI vs Human ROI Calculator — 比较 AI 工具与人力成本。月度节约、年度 ROI 和实时模型定价下的盈亏平衡点。
  • Prompt Cost Calculator — 粘贴您的提示、选择模型,立即查看它使用多少 token 以及发送费用是多少。