深夜突袭!万亿参数MoE模型Kimi K2上线即开源,月之暗面能否重归C位?
更新时间:2025-07-13 17:53:42 浏览次数:

  持续加码AI,字节来势汹汹,大模型格局的洗牌还在继续。

  抛开一切变化,硬实力才是搏击市场的硬拳头。这次,月之暗面能否靠Kimi K2重归大模型C位?

  月之暗面在官方介绍中称,在SWE Bench Verified、Tau2、AceBench等基准性能测试中,Kimi K2均取得开源模型中的SOTA成绩。在其公布的测评结果中,Kimi K2在Agentic Coding、Tool Use和Math&Reasoning三个维度的表现上均超过了同为开源模型的DeepSeek-V3和阿里Qwen3。值得一提的是,Kimi评测中的所有模型均为非思考模型的Kimi-K2-Instruct。

  目前,Kimi K2的API服务已上线元/百万“输入”tokens,16元/百万“输出”tokens,兼容OpenAI和Anthropic两种API格式。

  为了体现Kimi K2在代码、Agent工具调用、风格化写作三项能力上的提升,月之暗面也给出了具体任务下的展示。在前端开发任务中,Kimi K2支持粒子系统、可视化和3D场景等表现形式。

  
Kimi K2生成的山川峡谷3D景观 而在Agent工具调用能力方面,月之暗面表示Kimi K2现已具备稳定的复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的ToolCall结构。在其释出的案例中,Kimi K2规划了参加Coldplay乐队巡演的行程,可以完成演唱会所在城市的机酒与旅游规划,并且生成日历,再用html概括完整行程规划。

  随后,
此外,本次Kimi还特别展示了Kimi K2对文字输出风格的掌控,并且在虚构写作任务中,官方还表示:Kimi K2生成的文字更关注细节与情感,不再是抽象泛泛而谈。
由Kimi K2Kimi K2的突袭中,似乎隐含着要打一场翻身仗的决心。

  2024年11月,月之暗面创始人杨植麟在接受商业智能数据服务商QuestMobile数据显示,截至2024年12月份,豆包、Kimi、文小言的月活跃用户规模分别为7523万、2101万和1224万。Kimi位列原生App领域的“三强”之一。

  随着今年年初DeepSeek的横空出世,整个市场格局被迅速打乱。

  今年5月,联合QuestMobile发布的显示,Kimi虽仍在月均活跃用户规模上位于第四,但其2000万出头的规模已经和以1.8亿排在第一的DeepSeek相差甚远。在“月均下载用户数环比增长”一项上,Kimi甚至出现了负增长,用户数环比下降3.8%。

  2025年以来,Kimi对模型的更新升级速度明显放缓。但从2024年年底到今年5月份,Kimi在似乎瞄准了垂类领域,寻找新的用户群,先后和财新传媒、小红书、游戏达成合作。

  此前6月20日,Kimi发布第一个Agent——Kimi-Researcher。

  据官方表示:“模型即Agent,Kimi-Researcher是基于端到端自主强化学习技术训练的新一代Agent模型,也是一个专为深度研究任务而生的Agent产品。”当时Kimi还表示将逐步开源Kimi-Researcher基础预训练模型,以及强化学习后的模型,如今来看的话应该就是本次发布的Kimi K2。

  知名经济学者、工信部信息通信经济专家委员会委员盘和林在接受此外6月17日,MiniMax发布MiniMax-M1系列模型,并以token范围分段定价。在0~12.8万token范围内,据官方介绍,其定价均低于DeepSeek-R1。

  6月11日,豆包大模型1.6正式发布时,火山引擎总裁谭待现场表示,豆包1.6首创按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。豆包1.6的综合成本只有豆包1.5深度思考模型或DeepSeek-R1的三分之一。

  而本次Kimi K2的定价和DeepSeek-R1基本持平。在盘和林看来,目前价格还不完全是竞争的关键因素,“因为同样价格的话,存在先入为主。很多用户用过一个AI,如果价格相同,为什么要去用另一个AI?这个转换理由有两个,另一个AI更便宜,或者另一个AI更符合自己需要。我认为Kimi不能走低价,而是要走差异化路线。”

推荐图文

鄂ICP备2024040700号-2
武汉砺行体育文化传媒有限公司-版权所有
数据源自网络仅供参考