LLM API 가격이 작동하는 방식
LLM은 million tokens당 요금을 부과하며, input(프롬프트 + 컨텍스트)와 output(모델이 생성하는 내용)을 별도로 청구합니다. 출력은 일반적으로 입력보다 3~5배 더 비쌉니다. 토큰은 대략 영어 4자 또는 단어의 ¾에 해당합니다.
Cost = (input_tokens × input_$ / 1M) + (output_tokens × output_$ / 1M)
2026년 가격 현황
세 가지 계층이 등장했습니다:
- Frontier ($10–$75 / 1M tokens): Claude Opus 4.7, GPT-5, Gemini 3.1 Pro — 최고의 추론, 비전, 긴 컨텍스트
- Workhorse ($1–$5 / 1M): Claude Sonnet 4.6, GPT-5 mini, Gemini 2.5 Flash — 최고 수준 품질의 90%, 가격의 10~20%
- Budget ($0.10–$1 / 1M): Claude Haiku 4.5, GPT-5 nano, DeepSeek V3, Llama 3.3 70B (Groq/Together를 통해) — 태깅, 분류, 간단한 채팅에 적합
실제 절약이 이루어지는 곳
가격 책정은 쉬운 레버입니다; architectural levers move 2–10× more cost:
- Prompt caching — 반복되는 시스템 프롬프트와 RAG 컨텍스트가 정상 가격의 약 10%로 캐시됩니다. 채팅/에이전트 앱에서는 70% 이상의 캐시 적중률이 현실적입니다. 입력 비용을 75-90% 절감합니다.
- Batch API — 최대 24시간 대기 가능한 작업에 50% 할인. 백필, 평가, 문서 처리 파이프라인에 적합.
- Tiered routing — 간단한 요청은 저렴한 모델로 보내고 필요한 경우에만 프론티어 모델로 에스컬레이션하십시오. 일반적인 어시스턴트의 혼합 비용을 절반으로 줄입니다.
- Reasoning budgets — o 시리즈 및 Claude 확장 사고의 경우, 생각 토큰을 제한하십시오. 기본 사고는 출력 비용을 5–10배 증가시킬 수 있습니다.
- Self-hosted open weights — 단일 H100에서 Llama 3.3 70B는 80%+ 이용률에서 ~$0.20/M 토큰입니다. 하루 ~5000만 토큰 이상에서만 가치가 있습니다.
비교 표 읽는 방법
표는 입력값에 따른 월간 지출을 기준으로 정렬됩니다. 대부분의 앱은 input-heavy(RAG, 긴 문서, 시스템 프롬프트)으로, 입력 가격이 총 비용을 지배합니다. 짧은 프롬프트와 긴 완성을 가진 채팅 스타일 앱은 output-heavy으로 출력 가격이 지배합니다.
기타 비용 고려 사항
- Context window: 더 긴 컨텍스트 = 더 나은 검색이지만 더 많은 입력 토큰 = 더 높은 비용
- Vision / image input: 이미지는 토큰으로 변환됩니다 (이미지당 일반적으로 200~1,200개)
- Tool use / function calls: 도구 정의는 캐시되지 않는 한 모든 턴의 입력으로 계산됩니다
- Fine-tuning: 훈련 비용 + 일반적으로 기본 모델 가격의 2~4배 수준의 추론 비용
특정 프롬프트를 추정하려면 Prompt Cost Calculator와 결합하고, 프로젝트 수준 시나리오는 AI Model Cost Calculator, LLM 비용을 대체하는 인건비와 비교하려면 AI ROI Calculator를 사용하세요.
중요 참고: 가격은 2026년 5월 기준으로 자주 변경됩니다. 계약을 체결하기 전에 해당 공급업체의 공식 가격 페이지(Anthropic, OpenAI, Google AI, Together, DeepSeek)에서 반드시 확인하십시오. 볼륨 할인, 지역별 가격 및 Azure/Bedrock 마진에 따라 실제 요금이 10~30% 변동될 수 있습니다.
관련 계산기
- AI Model Cost Calculator — GPT-4o, Claude, Gemini 및 Llama를 포함한 100개 이상의 LLM에 대한 API 가격을 비교합니다. 정확한 토큰 비용을 계산합니다.
- AI vs Human ROI Calculator — AI 도구 비용을 인건비와 비교합니다. 라이브 모델 가격으로 월간 절약액, 연간 ROI 및 손익분기점.
- Prompt Cost Calculator — 프롬프트를 붙여넣고 모델을 선택하면 사용하는 토큰 수와 전송 비용을 즉시 확인할 수 있습니다.