Kimi K2.7 Code 开源实测：Token 省 30%、工具调用超越 Claude，月之暗面在下一盘大棋

6月12日，月之暗面非常低调地丢了一个大招——Kimi K2.7 Code 编程模型开源了。

没有大规模发布会，没有刷屏的公关稿，直接往 Hugging Face 扔模型权重和 API 接入文档就走。但如果你仔细看这次更新的内容，会发现这可能是 2026 年 Q2 最有价值的开源编程模型之一。

核心升级：砍掉 30% 的冗余思考

大模型编程有一个长期没有解决好的问题：过度思考。

模型在生成长代码时，经常陷入不必要的中间推理步骤——先自言自语一遍”用户想要什么”，再分析一遍”我该怎么做”，然后才真正开始写代码。结果 Token 消耗翻倍，但产出质量没有相应提升。

K2.7 Code 的核心改进集中在这个问题上。官方数据显示，相比 K2.6，平均 Token 消耗减少了 30%。这不是通过裁剪模型尺寸实现的，而是在保留同等甚至更强推理能力的前提下，消除了长程任务中的冗余推理路径。

具体数字很扎实：

最关键的是工具调用能力：Agent 基准测试 81.1%，超过了 Claude Opus 4.8 的 76.4%。对于 AI 编程工具来说，工具调用准确率直接决定了”能不能干活”而不是”会不会说话”。

K2.7 Code 的 API 定价延续了 K2.6 的标准——输入 6.5 元/1M token，输出 27 元/1M token，缓存命中后输入降至 1.3 元。

但因为 Token 消耗减少了 30%，实际完成同样任务的开销比 K2.6 低了近三分之一。如果把缓存命中率算进去，实际成本还会进一步压低。

这个定价在大模型编程赛道上很有攻击性。对比一下：

月之暗面走的是”开源权重 + 低价 API”路线——比闭源模型便宜，同时让你可以自托管。Kimi Code Plan 订阅用户的默认模型已经切到 K2.7 Code，说明他们对自己有信心。

和 DeepSeek 走超大 MoE 路线（V4 万亿参数级）、Qwen 走全尺寸矩阵（从 0.6B 到万亿）不同，月之暗面走的是 “有限资源下的效率最大化” 策略。

K2.7 Code 没有盲目扩大参数量，而是在 K2.6 的基础上做工程优化——消除冗余推理、强化指令跟随、提升多语言覆盖。这背后有一个务实判断：当前大模型的瓶颈已经不是智力，而是成本。

对于开发者来说，这意味着什么？

你不需要一块 A100 来跑推理，不需要为 90% 用不到的通用能力付费。K2.7 Code 是一个”偏科生”——只做编程一件事，但做得比绝大多数”全能选手”好。

这次开源还有一个值得关注的信号：月之暗面在积极向开发者渗透。

从年初 K2.5 的开源，到全球首张 AI 原生信用卡的推出，再到 K2.6（万亿参数多模态）和现在的 K2.7 Code 编程专业模型，月之暗面的节奏明显在加速。估值从年初的 40 亿到现在的 180 亿美元，翻了 4 倍多。

最新的消息是，月之暗面已在评估赴港 IPO，估值谈判仍在进行中。在 DeepSeek、智谱、阿里、字节的包围中，它选择了一条更”开发者友好”的路——开源核心模型 + 低价 API + 垂直深耕编程赛道。

如果你是一个重度 AI 编程用户，K2.7 Code 值得花一个下午跑跑看。毕竟，能省 30% Token 的编程助手，在代码量大的项目里可能省下的是几万块钱的 API 费用。