
MiMo Credits 和 Token 到底怎么换算?一篇讲清 Token Plan 能用多少
先说结论
MiMo 里的 token 是模型真正处理的文本单位;Credits 是 Token Plan 套餐里的额度点数,用来抵扣模型调用消耗。它们不是一个东西。
如果只记一条公式,就是:
消耗 Credits = 输入 token × 输入倍率 + 输出 token × 输出倍率
截至 2026-06-11,小米 MiMo 官方 Token Plan 订阅说明里,mimo-v2.5 的未命中输入是 100 Credits / token,输出是 200 Credits / token;mimo-v2.5-pro 的未命中输入是 300 Credits / token,输出是 600 Credits / token。
所以 4.1B Credits 的 Lite 套餐,不等于 41 亿 token。如果全按 mimo-v2.5 未命中输入算,是 4100 万 token;如果全按 mimo-v2.5 输出算,是 2050 万 token。

Credits 和 token 的区别
可以这样理解:
| 概念 | 含义 | 谁决定消耗 |
|---|---|---|
| token | 模型处理文本的基本单位,输入和输出都会计量 | 你的提示词、上下文、工具结果、模型回复长度 |
| Credits | Token Plan 套餐里的额度点数 | 模型档位、输入/输出、缓存是否命中、是否调用语音能力 |
token 是“工作量”;Credits 是“预算池”。
同样是 1 个 token,用在不同地方,扣的 Credits 不一样。缓存命中的输入 token 最便宜,普通输入 token 贵一些,输出 token 更贵;Pro 模型比普通模型贵。
这也是为什么很多人看到 Lite 套餐的 4.1B Credits 会误会:它不是直接送你 41 亿 token,而是给你 41 亿个扣费点。每处理 1 个 token,要按官方倍率扣掉若干 Credits。
官方扣费倍率
MiMo Token Plan 对语言模型的 Credits 扣费规则如下:
| 模型 | 缓存命中输入 | 缓存未命中输入 | 输出 |
|---|---|---|---|
mimo-v2.5 / mimo-v2-omni | 2 Credits / token | 100 Credits / token | 200 Credits / token |
mimo-v2.5-pro / mimo-v2-pro | 2.5 Credits / token | 300 Credits / token | 600 Credits / token |
语音能力是另一套扣法:ASR 按 30M Credits / 小时 计费,TTS 系列在官方页面里标注为限时免费。这里先只分析大多数人最关心的文本和代码场景。
套餐到底能用多少
Token Plan 月度套餐额度如下:
| 套餐 | Credits / 月 |
|---|---|
| Lite | 4.1B |
| Standard | 11B |
| Pro | 38B |
| Max | 82B |
按纯 token 极限换算,大概是这样:
| 套餐 | mimo-v2.5 未命中输入 | mimo-v2.5 输出 | mimo-v2.5-pro 未命中输入 | mimo-v2.5-pro 输出 |
|---|---|---|---|---|
Lite 4.1B | 4100 万 token | 2050 万 token | 1367 万 token | 683 万 token |
Standard 11B | 1.1 亿 token | 5500 万 token | 3667 万 token | 1833 万 token |
Pro 38B | 3.8 亿 token | 1.9 亿 token | 1.27 亿 token | 6333 万 token |
Max 82B | 8.2 亿 token | 4.1 亿 token | 2.73 亿 token | 1.37 亿 token |
如果买年度套餐,官方给出的额度是月度的 12 倍。比如 Lite 年度是 49.2B Credits,按 mimo-v2.5 未命中输入折算约 4.92 亿 token,按输出折算约 2.46 亿 token。
为什么官方说的任务轮数更少
官方 Token Plan 页面会给出类似“Lite 适合约 200 轮中等到复杂任务”的参考。这个数字看起来比上面的 token 换算少很多,但并不矛盾。
原因是 Coding Agent 场景不是普通聊天。它通常会反复携带这些内容:
- 系统提示词和工具说明。
- 历史对话。
- 代码文件片段。
- 搜索结果和命令输出。
- 模型的思考、回复和工具调用结果。
一次看起来只是“帮我改个 bug”的请求,背后可能消耗几十万甚至上百万 token,尤其是多轮修改、读文件、跑测试、修报错时。Token Plan 的官方轮数更接近真实编程工具里的体验,而不是单次 API 调用的理论上限。
举个实际例子
假设你用 mimo-v2.5 做一次普通文本任务:输入 8000 个未命中 token,输出 2000 个 token。
计算方式是:
8000 × 100 + 2000 × 200 = 1,200,000 Credits
Lite 月度套餐有 4.1B Credits,理论上可以跑:
4,100,000,000 ÷ 1,200,000 ≈ 3416 次
但如果换成代码 Agent,一次任务可能不是 8000 + 2000 token,而是反复带着完整上下文滚动。比如一次任务总消耗到 20M Credits,Lite 就大约只能跑:
4,100,000,000 ÷ 20,000,000 = 205 次
这就接近官方给 Lite 标注的中等到复杂任务轮数。
和普通 API 计费的区别
MiMo 还有普通 API 的按量定价,比如按“元 / 1M tokens”计费。这和 Token Plan 不是一回事。
普通 API 计费看的是现金价格,例如国内定价里 mimo-v2.5 未命中输入是 ¥2.80 / 1M tokens,输出是 ¥14.00 / 1M tokens;mimo-v2.5-pro 未命中输入是 ¥7.00 / 1M tokens,输出是 ¥21.00 / 1M tokens。
Token Plan 则是先买套餐,得到一池 Credits,再按倍率扣。它更像面向编程工具的订阅额度,而不是通用 API 余额。
还有一个重要限制:Token Plan 官方说明主要面向 Claude Code、OpenCode、OpenClaw、Cline、Roo Code、Kilo Code、Qwen Code 这类编程工具场景。套餐 API Key 不适合拿去做自动化脚本、自定义应用后端或非 Coding 产品调用。额度用完后,套餐服务会停止,不会自动继续扣赠金或账户余额。
该怎么选套餐
如果只是轻度试用,Lite 足够看清模型风格和编程工具兼容性。它的 4.1B Credits 在普通文本任务里看起来很多,但在 Agent 编程里会被上下文滚动快速消耗。
如果每天都用 AI 编程工具,Standard 才更接近稳定日用。Pro 和 Max 更适合高频开发、长上下文项目、多人共享或经常让 Agent 读大量代码的场景。
我的判断是:
| 使用方式 | 更合理的起点 |
|---|---|
| 偶尔问代码、轻量修 bug | Lite |
| 每天用编程 Agent | Standard |
| 大项目、多轮改造、长上下文 | Pro |
| 高频重度使用或团队场景 | Max |
总结
MiMo 的 Credits 不能直接当 token 看。token 是模型处理量,Credits 是套餐额度;真正能用多少,要看模型、输入/输出比例、缓存命中率和任务复杂度。
最容易记的换算是:mimo-v2.5 未命中输入 100 Credits / token,输出 200 Credits / token。所以 Lite 的 4.1B Credits,按纯输入大约是 4100 万 token,按纯输出大约是 2050 万 token。放到编程 Agent 场景里,实际可用轮数会明显低于这个理论 token 上限。
选套餐时,不要只看 Credits 总数。真正要看的是:你每天会不会让 Agent 读项目、跑命令、反复修错、带长上下文。如果会,Credits 消耗速度会比普通聊天快得多。