2026年6月11日 · 约 9 分钟

MiMo Credits 和 Token 到底怎么换算？一篇讲清 Token Plan 能用多少

AI
AI
MiMo
大模型
Token
开发工具

先说结论

MiMo 里的 token 是模型真正处理的文本单位；Credits 是 Token Plan 套餐里的额度点数，用来抵扣模型调用消耗。它们不是一个东西。

如果只记一条公式，就是：

消耗 Credits = 输入 token × 输入倍率 + 输出 token × 输出倍率

截至 2026-06-11，小米 MiMo 官方 Token Plan 订阅说明里，mimo-v2.5 的未命中输入是 100 Credits / token，输出是 200 Credits / token；mimo-v2.5-pro 的未命中输入是 300 Credits / token，输出是 600 Credits / token。

所以 4.1B Credits 的 Lite 套餐，不等于 41 亿 token。如果全按 mimo-v2.5 未命中输入算，是 4100 万 token；如果全按 mimo-v2.5 输出算，是 2050 万 token。

MiMo Credits 与 token 关系

Credits 和 token 的区别

可以这样理解：

概念	含义	谁决定消耗
token	模型处理文本的基本单位，输入和输出都会计量	你的提示词、上下文、工具结果、模型回复长度
Credits	Token Plan 套餐里的额度点数	模型档位、输入/输出、缓存是否命中、是否调用语音能力

token 是“工作量”；Credits 是“预算池”。

同样是 1 个 token，用在不同地方，扣的 Credits 不一样。缓存命中的输入 token 最便宜，普通输入 token 贵一些，输出 token 更贵；Pro 模型比普通模型贵。

这也是为什么很多人看到 Lite 套餐的 4.1B Credits 会误会：它不是直接送你 41 亿 token，而是给你 41 亿个扣费点。每处理 1 个 token，要按官方倍率扣掉若干 Credits。

官方扣费倍率

MiMo Token Plan 对语言模型的 Credits 扣费规则如下：

模型	缓存命中输入	缓存未命中输入	输出
`mimo-v2.5` / `mimo-v2-omni`	`2 Credits / token`	`100 Credits / token`	`200 Credits / token`
`mimo-v2.5-pro` / `mimo-v2-pro`	`2.5 Credits / token`	`300 Credits / token`	`600 Credits / token`

语音能力是另一套扣法：ASR 按 30M Credits / 小时 计费，TTS 系列在官方页面里标注为限时免费。这里先只分析大多数人最关心的文本和代码场景。

套餐到底能用多少

Token Plan 月度套餐额度如下：

套餐	Credits / 月
Lite	`4.1B`
Standard	`11B`
Pro	`38B`
Max	`82B`

按纯 token 极限换算，大概是这样：

MiMo Credits 换算速查

套餐	`mimo-v2.5` 未命中输入	`mimo-v2.5` 输出	`mimo-v2.5-pro` 未命中输入	`mimo-v2.5-pro` 输出
Lite `4.1B`	`4100 万` token	`2050 万` token	`1367 万` token	`683 万` token
Standard `11B`	`1.1 亿` token	`5500 万` token	`3667 万` token	`1833 万` token
Pro `38B`	`3.8 亿` token	`1.9 亿` token	`1.27 亿` token	`6333 万` token
Max `82B`	`8.2 亿` token	`4.1 亿` token	`2.73 亿` token	`1.37 亿` token

如果买年度套餐，官方给出的额度是月度的 12 倍。比如 Lite 年度是 49.2B Credits，按 mimo-v2.5 未命中输入折算约 4.92 亿 token，按输出折算约 2.46 亿 token。

为什么官方说的任务轮数更少

官方 Token Plan 页面会给出类似“Lite 适合约 200 轮中等到复杂任务”的参考。这个数字看起来比上面的 token 换算少很多，但并不矛盾。

原因是 Coding Agent 场景不是普通聊天。它通常会反复携带这些内容：

系统提示词和工具说明。
历史对话。
代码文件片段。
搜索结果和命令输出。
模型的思考、回复和工具调用结果。

一次看起来只是“帮我改个 bug”的请求，背后可能消耗几十万甚至上百万 token，尤其是多轮修改、读文件、跑测试、修报错时。Token Plan 的官方轮数更接近真实编程工具里的体验，而不是单次 API 调用的理论上限。

举个实际例子

假设你用 mimo-v2.5 做一次普通文本任务：输入 8000 个未命中 token，输出 2000 个 token。

计算方式是：

8000 × 100 + 2000 × 200 = 1,200,000 Credits

Lite 月度套餐有 4.1B Credits，理论上可以跑：

4,100,000,000 ÷ 1,200,000 ≈ 3416 次

但如果换成代码 Agent，一次任务可能不是 8000 + 2000 token，而是反复带着完整上下文滚动。比如一次任务总消耗到 20M Credits，Lite 就大约只能跑：

4,100,000,000 ÷ 20,000,000 = 205 次

这就接近官方给 Lite 标注的中等到复杂任务轮数。

和普通 API 计费的区别

MiMo 还有普通 API 的按量定价，比如按“元 / 1M tokens”计费。这和 Token Plan 不是一回事。

普通 API 计费看的是现金价格，例如国内定价里 mimo-v2.5 未命中输入是 ¥2.80 / 1M tokens，输出是 ¥14.00 / 1M tokens；mimo-v2.5-pro 未命中输入是 ¥7.00 / 1M tokens，输出是 ¥21.00 / 1M tokens。

Token Plan 则是先买套餐，得到一池 Credits，再按倍率扣。它更像面向编程工具的订阅额度，而不是通用 API 余额。

还有一个重要限制：Token Plan 官方说明主要面向 Claude Code、OpenCode、OpenClaw、Cline、Roo Code、Kilo Code、Qwen Code 这类编程工具场景。套餐 API Key 不适合拿去做自动化脚本、自定义应用后端或非 Coding 产品调用。额度用完后，套餐服务会停止，不会自动继续扣赠金或账户余额。

该怎么选套餐

如果只是轻度试用，Lite 足够看清模型风格和编程工具兼容性。它的 4.1B Credits 在普通文本任务里看起来很多，但在 Agent 编程里会被上下文滚动快速消耗。

如果每天都用 AI 编程工具，Standard 才更接近稳定日用。Pro 和 Max 更适合高频开发、长上下文项目、多人共享或经常让 Agent 读大量代码的场景。

我的判断是：

使用方式	更合理的起点
偶尔问代码、轻量修 bug	Lite
每天用编程 Agent	Standard
大项目、多轮改造、长上下文	Pro
高频重度使用或团队场景	Max

总结

MiMo 的 Credits 不能直接当 token 看。token 是模型处理量，Credits 是套餐额度；真正能用多少，要看模型、输入/输出比例、缓存命中率和任务复杂度。

最容易记的换算是：mimo-v2.5 未命中输入 100 Credits / token，输出 200 Credits / token。所以 Lite 的 4.1B Credits，按纯输入大约是 4100 万 token，按纯输出大约是 2050 万 token。放到编程 Agent 场景里，实际可用轮数会明显低于这个理论 token 上限。

选套餐时，不要只看 Credits 总数。真正要看的是：你每天会不会让 Agent 读项目、跑命令、反复修错、带长上下文。如果会，Credits 消耗速度会比普通聊天快得多。