LLM 成本计算器。AI 模型定价估算工具

用于估算 LLM API 调用成本的免费在线工具。使用实际百万代币价格比较 GPT-4o、Claude、Gemini、Llama 等。

~750 单词

~375 单词

每个请求的成本

$0.00
x 1,000

估算总成本

$0.00
输入 输出
工具工作室

想把这个工具添加到你的网站吗?

为 WordPress、Notion 或你自己的网站自定义配色和深色模式。

常见问题

LLM API 成本如何计算?

LLM API 对输入代币(您的提示)和输出代币(响应)分别收费。每个请求的总成本为:(输入代币 × 输入价格 + 输出代币 × 输出价格)/ 1,000,000。乘以请求数得到总月度成本。

什么是代币,它们与单词有什么关系?

代币是语言模型处理的基本文本单位。平均而言,1 个代币等于英文中约 0.75 个单词,因此 1000 个代币 ≈ 750 个单词。价格以百万代币计 ($/1M),这是所有提供商的标准定价单位。

为什么输出代币比输入代币更昂贵?

生成文本(输出)需要模型依次计算每个代币,这在计算上比读取输入更密集。大多数提供商对输出代币的收费是输入代币的 3–5 倍。

如何降低我的 LLM API 成本?

使用满足您质量要求的最小模型。尽可能缓存重复的提示。最小化系统提示长度并避免不必要的上下文。对于简单的分类或提取任务,GPT-4o mini 或 Gemini Flash 等较小的模型可以显著节省成本。

# 理解 LLM API 定价

大型语言模型 API 根据代币使用情况计费,而不是按时间或请求次数计费。每个 API 调用有两项成本:输入成本(处理您的提示)和输出成本(生成响应)。理解这种分割是准确估算您每月账单的关键。

# 输入代币与输出代币

输入代币

输入代币代表发送模型的所有内容:您的系统提示、对话历史和用户消息。由于模型并行处理它们,所以它们更便宜。一个 200 字的典型系统提示大约需要 267 个输入代币。

输出代币

输出代币按顺序逐个生成,使其在计算上更昂贵。大多数提供商对输出代币的收费多出 3–5 倍。一个 300 字的响应会生成大约 400 个输出代币。保持响应简洁是最有效的成本节省策略之一。

# 为您的预算选择合适的模型

从有能力的中等层级模型开始,例如 GPT-4o miniGemini 1.5 Flash,仅在质量不足时升级。小型和大型模型之间的成本差异可能是 10–100×。
并非所有任务都需要相同的模型质量。分类、提取和汇总任务通常在较小、较便宜的模型上表现良好。保留大型前沿模型,如 claude-3-opuso1,用于复杂的推理任务,其中质量直接影响结果。

参考文献