Kimi K2.7 Code 开源实测:Token 省 30%、工具调用超越 Claude,月之暗面在下一盘大棋

6月12日,月之暗面非常低调地丢了一个大招——Kimi K2.7 Code 编程模型开源了

没有大规模发布会,没有刷屏的公关稿,直接往 Hugging Face 扔模型权重和 API 接入文档就走。但如果你仔细看这次更新的内容,会发现这可能是 2026 年 Q2 最有价值的开源编程模型之一。

核心升级:砍掉 30% 的冗余思考

大模型编程有一个长期没有解决好的问题:过度思考

模型在生成长代码时,经常陷入不必要的中间推理步骤——先自言自语一遍”用户想要什么”,再分析一遍”我该怎么做”,然后才真正开始写代码。结果 Token 消耗翻倍,但产出质量没有相应提升。

K2.7 Code 的核心改进集中在这个问题上。官方数据显示,相比 K2.6,平均 Token 消耗减少了 30%。这不是通过裁剪模型尺寸实现的,而是在保留同等甚至更强推理能力的前提下,消除了长程任务中的冗余推理路径。

具体数字很扎实:

  • Kimi Code Bench v2:提升 21.8%
  • Program-Bench:提升 11%
  • MLS Bench Lite(多语言编程):提升 31.5%(Python、Rust、Go 全面提升)

最关键的是工具调用能力:Agent 基准测试 81.1%,超过了 Claude Opus 4.8 的 76.4%。对于 AI 编程工具来说,工具调用准确率直接决定了”能不能干活”而不是”会不会说话”。

成本账:比前代更便宜意味着什么

K2.7 Code 的 API 定价延续了 K2.6 的标准——输入 6.5 元/1M token,输出 27 元/1M token,缓存命中后输入降至 1.3 元。

但因为 Token 消耗减少了 30%,实际完成同样任务的开销比 K2.6 低了近三分之一。如果把缓存命中率算进去,实际成本还会进一步压低。

这个定价在大模型编程赛道上很有攻击性。对比一下:

  • Claude Opus 4.8 API 按量计费
  • GPT-5.5 编程模型仍属于高价档
  • 国产开源模型里,Qwen3.7 和 GLM-5.2 各有拥趸但定价相近

月之暗面走的是”开源权重 + 低价 API”路线——比闭源模型便宜,同时让你可以自托管。Kimi Code Plan 订阅用户的默认模型已经切到 K2.7 Code,说明他们对自己有信心。

技术选型:为什么是”瘦身”而不是”堆料”

和 DeepSeek 走超大 MoE 路线(V4 万亿参数级)、Qwen 走全尺寸矩阵(从 0.6B 到万亿)不同,月之暗面走的是 “有限资源下的效率最大化” 策略。

K2.7 Code 没有盲目扩大参数量,而是在 K2.6 的基础上做工程优化——消除冗余推理、强化指令跟随、提升多语言覆盖。这背后有一个务实判断:当前大模型的瓶颈已经不是智力,而是成本

对于开发者来说,这意味着什么?

你不需要一块 A100 来跑推理,不需要为 90% 用不到的通用能力付费。K2.7 Code 是一个”偏科生”——只做编程一件事,但做得比绝大多数”全能选手”好。

竞争格局:月之暗面的生态野心

这次开源还有一个值得关注的信号:月之暗面在积极向开发者渗透

从年初 K2.5 的开源,到全球首张 AI 原生信用卡的推出,再到 K2.6(万亿参数多模态)和现在的 K2.7 Code 编程专业模型,月之暗面的节奏明显在加速。估值从年初的 40 亿到现在的 180 亿美元,翻了 4 倍多。

最新的消息是,月之暗面已在评估赴港 IPO,估值谈判仍在进行中。在 DeepSeek、智谱、阿里、字节的包围中,它选择了一条更”开发者友好”的路——开源核心模型 + 低价 API + 垂直深耕编程赛道。

如果你是一个重度 AI 编程用户,K2.7 Code 值得花一个下午跑跑看。毕竟,能省 30% Token 的编程助手,在代码量大的项目里可能省下的是几万块钱的 API 费用


← Back to blog