快速入门

Token 用量计算

模型服务用量的一个重要概念是 token。在调用模型推理服务时，会将输入内容进行分词（tokenize），转化为模型可以理解的 token ，经过模型处理后，同样输出 token，并转化为您需要的文本或者其他内容载体。

Token 是模型用来表示自然语言文本的基本单位，也是我们的计费单元，一般情况下模型中 token 和字数的换算比例大致如下：

但因为不同模型的分词不同，所以换算比例也存在差异，每一次实际处理 token 数量以模型返回为准，您可以从返回结果的 usage 中查看。

语言大模型推理服务费用的一种较为常见的计算方式如下：

费用 = token 消耗量 × 模型单价