AI Token 是什么？一文搞懂大模型计费原理

什么是 Token？

Token 是大语言模型处理文本的基本单位。你可以把它理解为"文本碎片"——不是字符，也不是单词，而是介于两者之间的一种单位。

对于英文，一个 Token 大约等于 4 个字符或 0.75 个单词。例如，"Hello world" 是 2 个 Token。对于中文，一个汉字通常是 1-2 个 Token。例如，"你好世界"大约是 4-6 个 Token。

大语言模型的计算成本与处理的 Token 数量直接相关。模型需要对每个 Token 进行数学运算，Token 越多，需要的计算资源就越多。因此，按 Token 计费是最公平的计费方式。

AI 模型的计费通常区分输入和输出：

通常输出 Token 的价格是输入的 2-4 倍，因为生成文本比理解文本需要更多计算。

一些经验法则：

每次对话，模型都需要处理完整的对话历史。这意味着随着对话进行，每条消息消耗的 Token 会越来越多。

系统提示词（System Prompt）会在每次请求中被发送，也会消耗 Token。精简你的系统提示词可以节省成本。

不同模型的 Token 价格差异很大。小模型（如 GPT-4o Mini）可能只有大模型价格的 1/20。对于简单任务，使用小模型可以大幅节省成本。

GPTGet 提供灵活的计费方案：

在 GPTGet 的使用统计页面，你可以实时查看 Token 消耗情况，了解每次对话的成本。