# LLM API 가격 구조 이해하기
대형 언어 모델 API는 시간이나 요청 수가 아닌 토큰 사용량을 기준으로 요금을 부과합니다. API 호출 한 번에는 두 가지 비용이 발생합니다. 입력 비용(프롬프트 처리)과 출력 비용(응답 생성)입니다. 이 차이를 이해하는 것이 월간 비용을 정확하게 예측하는 핵심입니다.# 입력 토큰과 출력 토큰 비교
입력 토큰
입력 토큰은 모델에 전송되는 모든 내용을 의미합니다. 시스템 프롬프트, 대화 기록, 사용자 메시지가 포함됩니다. 모델이 이를 병렬로 처리하기 때문에 상대적으로 저렴합니다. 200단어 분량의 일반적인 시스템 프롬프트는 약 267개의 입력 토큰에 해당합니다.
출력 토큰
출력 토큰은 하나씩 순서대로 생성되기 때문에 연산 부하가 더 큽니다. 대부분의 제공업체는 출력 토큰에 3~5배 더 높은 요금을 부과합니다. 300단어 분량의 응답은 약 400개의 출력 토큰을 생성합니다. 응답을 간결하게 유지하는 것이 가장 효과적인 비용 절감 전략 중 하나입니다.
# 예산에 맞는 모델 선택하기
GPT-4o mini나 Gemini 1.5 Flash 같은 중급 모델부터 시작하고, 품질이 부족한 경우에만 상위 모델로 업그레이드하세요. 소형 모델과 대형 모델의 비용 차이는 10~100배에 달할 수 있습니다. claude-3-opus나 o1 같은 대형 프론티어 모델은 품질이 결과에 직접적인 영향을 미치는 복잡한 추론 작업을 위해 아껴두세요.