MiMo Credits 和 Token 到底怎么换算?一篇讲清 Token Plan 能用多少
· 约 9 分钟

MiMo Credits 和 Token 到底怎么换算?一篇讲清 Token Plan 能用多少

  • AI
  • AI
  • MiMo
  • 大模型
  • Token
  • 开发工具

先说结论

MiMo 里的 token 是模型真正处理的文本单位;Credits 是 Token Plan 套餐里的额度点数,用来抵扣模型调用消耗。它们不是一个东西。

如果只记一条公式,就是:

消耗 Credits = 输入 token × 输入倍率 + 输出 token × 输出倍率

截至 2026-06-11,小米 MiMo 官方 Token Plan 订阅说明里,mimo-v2.5 的未命中输入是 100 Credits / token,输出是 200 Credits / tokenmimo-v2.5-pro 的未命中输入是 300 Credits / token,输出是 600 Credits / token

所以 4.1B Credits 的 Lite 套餐,不等于 41 亿 token。如果全按 mimo-v2.5 未命中输入算,是 4100 万 token;如果全按 mimo-v2.5 输出算,是 2050 万 token

MiMo Credits 与 token 关系

Credits 和 token 的区别

可以这样理解:

概念含义谁决定消耗
token模型处理文本的基本单位,输入和输出都会计量你的提示词、上下文、工具结果、模型回复长度
CreditsToken Plan 套餐里的额度点数模型档位、输入/输出、缓存是否命中、是否调用语音能力

token 是“工作量”;Credits 是“预算池”。

同样是 1 个 token,用在不同地方,扣的 Credits 不一样。缓存命中的输入 token 最便宜,普通输入 token 贵一些,输出 token 更贵;Pro 模型比普通模型贵。

这也是为什么很多人看到 Lite 套餐的 4.1B Credits 会误会:它不是直接送你 41 亿 token,而是给你 41 亿个扣费点。每处理 1 个 token,要按官方倍率扣掉若干 Credits。

官方扣费倍率

MiMo Token Plan 对语言模型的 Credits 扣费规则如下:

模型缓存命中输入缓存未命中输入输出
mimo-v2.5 / mimo-v2-omni2 Credits / token100 Credits / token200 Credits / token
mimo-v2.5-pro / mimo-v2-pro2.5 Credits / token300 Credits / token600 Credits / token

语音能力是另一套扣法:ASR 按 30M Credits / 小时 计费,TTS 系列在官方页面里标注为限时免费。这里先只分析大多数人最关心的文本和代码场景。

套餐到底能用多少

Token Plan 月度套餐额度如下:

套餐Credits / 月
Lite4.1B
Standard11B
Pro38B
Max82B

按纯 token 极限换算,大概是这样:

MiMo Credits 换算速查

套餐mimo-v2.5 未命中输入mimo-v2.5 输出mimo-v2.5-pro 未命中输入mimo-v2.5-pro 输出
Lite 4.1B4100 万 token2050 万 token1367 万 token683 万 token
Standard 11B1.1 亿 token5500 万 token3667 万 token1833 万 token
Pro 38B3.8 亿 token1.9 亿 token1.27 亿 token6333 万 token
Max 82B8.2 亿 token4.1 亿 token2.73 亿 token1.37 亿 token

如果买年度套餐,官方给出的额度是月度的 12 倍。比如 Lite 年度是 49.2B Credits,按 mimo-v2.5 未命中输入折算约 4.92 亿 token,按输出折算约 2.46 亿 token

为什么官方说的任务轮数更少

官方 Token Plan 页面会给出类似“Lite 适合约 200 轮中等到复杂任务”的参考。这个数字看起来比上面的 token 换算少很多,但并不矛盾。

原因是 Coding Agent 场景不是普通聊天。它通常会反复携带这些内容:

  • 系统提示词和工具说明。
  • 历史对话。
  • 代码文件片段。
  • 搜索结果和命令输出。
  • 模型的思考、回复和工具调用结果。

一次看起来只是“帮我改个 bug”的请求,背后可能消耗几十万甚至上百万 token,尤其是多轮修改、读文件、跑测试、修报错时。Token Plan 的官方轮数更接近真实编程工具里的体验,而不是单次 API 调用的理论上限。

举个实际例子

假设你用 mimo-v2.5 做一次普通文本任务:输入 8000 个未命中 token,输出 2000 个 token。

计算方式是:

8000 × 100 + 2000 × 200 = 1,200,000 Credits

Lite 月度套餐有 4.1B Credits,理论上可以跑:

4,100,000,000 ÷ 1,200,000 ≈ 3416 次

但如果换成代码 Agent,一次任务可能不是 8000 + 2000 token,而是反复带着完整上下文滚动。比如一次任务总消耗到 20M Credits,Lite 就大约只能跑:

4,100,000,000 ÷ 20,000,000 = 205 次

这就接近官方给 Lite 标注的中等到复杂任务轮数。

和普通 API 计费的区别

MiMo 还有普通 API 的按量定价,比如按“元 / 1M tokens”计费。这和 Token Plan 不是一回事。

普通 API 计费看的是现金价格,例如国内定价里 mimo-v2.5 未命中输入是 ¥2.80 / 1M tokens,输出是 ¥14.00 / 1M tokensmimo-v2.5-pro 未命中输入是 ¥7.00 / 1M tokens,输出是 ¥21.00 / 1M tokens

Token Plan 则是先买套餐,得到一池 Credits,再按倍率扣。它更像面向编程工具的订阅额度,而不是通用 API 余额。

还有一个重要限制:Token Plan 官方说明主要面向 Claude Code、OpenCode、OpenClaw、Cline、Roo Code、Kilo Code、Qwen Code 这类编程工具场景。套餐 API Key 不适合拿去做自动化脚本、自定义应用后端或非 Coding 产品调用。额度用完后,套餐服务会停止,不会自动继续扣赠金或账户余额。

该怎么选套餐

如果只是轻度试用,Lite 足够看清模型风格和编程工具兼容性。它的 4.1B Credits 在普通文本任务里看起来很多,但在 Agent 编程里会被上下文滚动快速消耗。

如果每天都用 AI 编程工具,Standard 才更接近稳定日用。Pro 和 Max 更适合高频开发、长上下文项目、多人共享或经常让 Agent 读大量代码的场景。

我的判断是:

使用方式更合理的起点
偶尔问代码、轻量修 bugLite
每天用编程 AgentStandard
大项目、多轮改造、长上下文Pro
高频重度使用或团队场景Max

总结

MiMo 的 Credits 不能直接当 token 看。token 是模型处理量,Credits 是套餐额度;真正能用多少,要看模型、输入/输出比例、缓存命中率和任务复杂度。

最容易记的换算是:mimo-v2.5 未命中输入 100 Credits / token,输出 200 Credits / token。所以 Lite 的 4.1B Credits,按纯输入大约是 4100 万 token,按纯输出大约是 2050 万 token。放到编程 Agent 场景里,实际可用轮数会明显低于这个理论 token 上限。

选套餐时,不要只看 Credits 总数。真正要看的是:你每天会不会让 Agent 读项目、跑命令、反复修错、带长上下文。如果会,Credits 消耗速度会比普通聊天快得多。

参考来源