Kimi、千问等AI集体押注世界杯⋯⋯大模型不再比拼聊天，为何集体扮演“懂球佬”

更新时间：2026-06-11 21:30:40 浏览次数：

　　国产大模型Kimi称将通过Agent集群同时调度300个子Agent，公开预测104场世界杯赛事，并提出德国队或爆冷夺冠。Kimi同时上线万亿Token奖池，用户选队、球队赢了就可以瓜分Token，将体育赛事与AI用户运营深度绑定。

　　Kimi发文称，将通过Agent集群同时调度300个子Agent，公开预测104场世界杯赛事，并在每轮赛前公开预测、赛后复盘。

　　Kimi的预测策略并没有完全随大流。它并未否认当前多数主流模型将西班牙队和法国队列为夺冠最大热门，同样认为两者的夺冠概率位居前列，但它提出了另一个关注点：德国队的夺冠概率可能被市场低估。

　　当网友们热议“AI预测究竟准不准”“AI懂不懂球”时，Kimi在开头就坦承“我们的预测很可能是错的”，并称希望通过这次尝试，把分析过程、预测结果和赛后复盘放在同一个透明框架中。

　　此外，Kimi还拿出1万亿Token奖池，用户预测冠军队、pick的球队每次获胜就可以参与瓜分Token。截至6月11日18时，Kimi App显示，实时排行的队伍支持率TOP5分别为阿根廷、法国、西班牙、巴西、葡萄牙，有43.33%的参与用户选择了阿根廷。

　　长期关注世界杯等知名赛事的体育咨询专家、关键之道创始人张庆告诉

　　“每一届世界杯都是巨大的流量池，各个企业都希望有机会参与，获得更多曝光、引流机会。而大模型天然适合做这类数据分析和预测。”张庆向

　　深耕人工智能产业多年的技术专家王岩在接受

　　王岩认为，热点借势只是入口，真正竞争点在于谁能把抽象模型能力转化为用户可感知结果。这意味着，AI大模型企业在品牌传播上，不再只发布参数、榜单和技术报告，转为借高关注赛事制造用户体验入口；而在商业竞争上各家模型争夺的则是用户心智、使用频次、社交传播和开发者注意力。

　　截至目前，多少用户参与了Kimi“押注”世界杯的活动？通过用Agent集群预测世界杯冠军，Kimi又将获得哪些方面的能力提升？Kimi方面向

　　不只Kimi，其他AI大模型玩家也试图“分一杯世界杯的羹”。例如，千问也推出“决战美加墨，与千问一起预测，赢万元现金”的活动，加入这场AI“秀肌肉”争夺战。

　　“我前两天也用DeepSeek、豆包预测了2026年世界杯冠军，想对比它们谁分析的有道理，但我看到它们给出的预测和相关理由都有明显局限性。”张庆向

　　在国产大模型眼中，谁是“2026年世界杯冠军队伍”？

　　每款AI大模型给出的“夺冠队伍”理由分析略有不同。值得注意的是，投票西班牙队的AI大模型们，其判断逻辑高度趋同，核心理由之一均为“权威数据模型、机构高度一致看好”。

　　上海财经大学特聘教授胡延平向

　　“世界杯预测无疑是展示模型与智能体水准的一个上佳机会窗口，不过预测的效果也是一把双刃剑。个人预期这届世界杯，水准最高的预测模型，成功率能达到60%～80%左右。”胡延平坦言。

　　不过，Kelly Bench在2023—2024赛季英格兰超级联赛的模拟中显示，其评估的每个前沿模型在整个赛季都亏损了，并且许多都经历了破产。其中，Claude Opus 4.7目前以-3.7%的平均投资回报率领先；有4个模型避免了所有的破产。

　　“AI更多是一个辅助工具，基于战队历史战绩、世界杯排名、赔率、国际足联等大量数据的多维度预测，AI大模型呈现了客观数据统计，所以作为参考工具还是有意义的，但不会完全依赖它的结果。”一位长期关注世界杯的资深球迷告诉

　　在上述球迷看来，相比大模型的预测，每个球迷都更青睐自己喜欢的球队，喜好也会占一大部分判断，而且越到决赛越是球员临场发挥和心理上的博弈，不确定性太多了。

　　当Kimi拿出万亿Token、调动300个子Agent对世界杯赛事进行并行预测，当千问、豆包、元宝争先恐后地给出各自的夺冠热门队伍时，这场看似娱乐化的“AI押注战”背后，AI大模型厂商究竟想“秀”什么？又在集体“卷”什么？

　　“本轮大模型预测世界杯冠军，是生成式AI从问答工具走向公共事件运营的典型样本。”王岩向

　　当下，AI大模型的竞争早已不局限于单纯的参数榜单，而是从“会聊天”转向“能办事”，从“比模型”转向“比场景”。然而，全球研究显示，在调研全球1250多家企业后，仅5%的公司实现了AI价值的规模化应用。Gartner数据也显示，截至2025年底，嵌入真正AI Agent的企业应用占比不足5%。

　　胡延平大模型和智能体正从对话走向任务，从预训练走向持续学习，从数据语料走向持续多维的现实感知。“预测世界杯这类探索项目会加速这个进化过程。未来行动智能体所需要的能力体系，也是在走向‘感知－交互－决策－协同’这个方向。”

　　不过，王岩坦言，世界杯预测可以成为Agent能力的公开压力测试，但不能自动证明Agent能力提升，大模型在这场押注中训练和检验的是长任务组织、概率校准和用户交互能力。

　　“Kimi的300个Agent代表分析覆盖面增加，不直接代表预测准确率提升。相关Agent任务Token消耗研究显示，同一任务的Token消耗可相差几十倍，更多Token并不必然带来更高准确率。同样，相关Prediction Arena研究也显示，多个前沿模型在Kalshi线天交易测试中最终收益为-16.0%至-30.8%，研究量与结果没有相关性。”王岩向

　　正如王岩所言：“当前Agent的最大缺口，正在从‘能否给出合理计划’转向‘能否稳定完成长周期真实任务’。”这意味着，谁能率先落地“实战能力”，谁就将有机会在愈发激烈的争夺赛中脱颖而出。

推荐图文