AI猜中了胜负,却没猜中世界杯:12个AI、明星嘉宾、贴砖小哥同场交卷,真正赢下这场"考试"的,是足球
创始人
2026-07-04 17:07:58
0

  一、16强落定,AI交卷

  7月4日,历时六天、十六场生死战之后,2026年美加墨世界杯16强名单终于落定:加拿大、巴西、巴拉圭、摩洛哥、挪威、法国、墨西哥、英格兰、比利时、美国、西班牙、葡萄牙、瑞士、埃及、阿根廷、哥伦比亚。

  这是世界杯历史上第一次出现“1/16决赛”。48支球队、104场比赛的新赛制,把淘汰赛的闸门提前了一轮,也把偶然性放大了一轮。六天之内,东道主三国携手过关,德国与荷兰两大豪门同日被点球放逐,佛得角把卫冕冠军阿根廷拖进加时,直到最后时刻才被击倒。

  球场之外,另一场比赛也在同步计分。

  联想集团与咪咕视频发起的“世界杯预测人机大战”中,由联想天禧AI召集的12个中国主流大模型——联想天禧AI、DeepSeek、通义千问、百度文心、腾讯混元、Kimi、智谱、MiniMax、阶跃星辰、讯飞星火、商汤小浣熊、中移九天——对这16场比赛交出了整整192次预测。

  成绩单是这样的:胜平负方向,192次预测命中132次,命中率68.8%;精确比分,192次预测命中41次,命中率21.4%。

  这不是一个低分。恰恰相反,它说明AI已经相当擅长判断强弱、趋势和大概率结果。但这张成绩单里最值得看的,不是132次命中,而是剩下的60次失手。

  那里面,藏着足球不肯被完全计算的部分。

  二、两个0/12:算法最整齐的一次失手

  这一轮12大AI预测,有两个“0/12”。

  德国对巴拉圭。12个AI,12张预测卡,无一例外写着“德国胜”:2:1、3:0、3:0、2:0、2:0、3:1、3:1、3:0、3:1、2:0、3:0、3:1。

  这不是荒唐的判断。四届世界杯冠军,对阵南美中游球队;更深的阵容,更稳定的淘汰赛经验,更显赫的历史。按常识、按数据、按概率,这都是一道不难的题。

  但比赛没有按概率走。

  120分钟1:1,点球大战巴拉圭晋级。德国出局。12个AI,12次预测,全部落空。

  同一个比赛日,荷兰对摩洛哥几乎复刻了这一幕。12个AI同样全部预测荷兰胜,比赛同样踢成120分钟1:1,同样进入点球大战,同样是传统强队倒下。

  两场比赛,24次预测,0次命中。

  AI不是败给了无知,而是败给了共识。它们读懂了历史,读懂了实力,也读懂了概率,却没有读到点球点前那几秒钟的迟疑、门将扑出去的一瞬间,和淘汰赛里某支球队突然相信自己可以改写命运的冲动。

  所有让世界杯成为世界杯的时刻,几乎都发生在概率的边缘。

  三、猜中胜负,却错过了比赛的形状

  如果只讲失手,也是不公平的。

  16场比赛里,有八场12个AI全部命中方向:巴西胜日本、法国胜瑞典、英格兰胜刚果(金)、美国胜波黑、西班牙胜奥地利、葡萄牙胜克罗地亚、瑞士胜阿尔及利亚、阿根廷胜佛得角。对“大概率之河”的把握,AI是稳定而有效的。

  问题在于,足球最迷人的部分,往往不只在结局。

  AI算得出英格兰会赢刚果(金),却算不出凯恩会在第86分钟用一脚时速94公里的转身抽射完成逆转,顺手超越贝利的世界杯进球纪录;算得出加拿大是热门,却算不出欧斯塔基奥要等到第92分钟,才为这个国家射进队史第一个世界杯淘汰赛进球。

  阿根廷对佛得角,则是最典型的样本。

  赛前,12个AI全部预测阿根廷胜,方向完全正确。但真实发生的比赛,不是一场轻松的大胜,而是90分钟1:1、加时3:2。阿根廷两度被追平,佛得角把卫冕冠军拖到最后时刻,直到第111分钟才被一次折射击穿。

  AI猜中了胜负,却错过了比赛的形状。

  最终,千问和中移九天以13/16、81.3%的方向命中率并列领跑;MiniMax虽然方向命中为12/16,但精确比分命中6场,比分命中率达到37.5%,在比分维度最突出;此前在32强预测中领跑的腾讯混元,本轮只命中9场,与Kimi、讯飞星火同列后段。

  预测的王座不是固定的。上一轮领先,不代表下一轮继续领先。世界杯每一轮都是新考卷,上一张卷子的高分,换不来下一场比赛的豁免。

  这场实验最诚实的是,它不是为了证明某一个AI永远更准,而是把所有模型放到同一个赛场上,让它们一次次接受真实赛果的校验。

  在一个由红牌、门柱、点球和第92分钟组成的世界里,任何领先都是暂时的。

  四、从贴砖工到12个AI:世界杯仍然不可完全计算

  这个夏天至今最强的预测者,也许不是任何一个AI。

  在此前的32强竞猜中,一位来自重庆彭水的29岁家装贴砖工李先生,在超过2500万参与者中猜中了31个晋级名额。12个AI、解说名宿、明星嘉宾同场作答,他的成绩依然高得惊人。

  这当然不能证明人类直觉一定胜过AI。它只能说明,在世界杯这样的系统里,计算和直觉都只能接近答案,却很难完全占有答案。

  从2010年的章鱼保罗,到今天的超级计算机和大模型,人类从来没有停止过对“预知比赛”的迷恋。只不过,过去我们把期待寄托在一只章鱼身上,现在则寄托在算法、模型和算力上。

  而中国这场“世界杯预测人机大战”不是一台机器或是AI的独角戏,而是12个大模型与数千万普通用户、专业嘉宾一起交卷。AI不再只是替人类做判断的黑箱,它坐到了人类旁边,写下自己的答案,接受同一记终场哨的裁决。

  这可能才是“首届AI世界杯”的真正含义:不是AI预测世界杯,而是世界杯考验AI。用点球,用补时,用一个40岁门将的十次扑救,用一支不被看好的球队突然爆发出的勇气。

  16强之后,新的对阵已经排开。12个AI很快还会交出下一轮预测。它们大概率会继续保持不错的命中率,也大概率会在某个夜晚再次集体失手。屏幕前的人也一样,会继续熬夜,继续相信自己比机器更懂某支球队。

  多数时候,我们错了。

  偶尔,像那位重庆的贴砖工人一样,我们对得离谱。

  68.8%属于算法。剩下的31.2%,属于点球点,属于补时,属于门柱,属于一个不肯倒下的门将。

  也属于足球,属于我们熬过的每一个夜晚。

相关内容

从 “坐等报批” 到 “2...
转自:扬子晚报扬子晚报网7月4讯(通讯员 王雯雯 记者 姜天圣)近...
2026-07-04 17:38:14
出海扩产承压前行,贵州轮胎...
日前,贵州轮胎(000589.SZ)抛出重磅海外扩产计划,拟投资近...
2026-07-04 17:38:08
【提示】12个新职业,要来...
(来源:上海普陀)近日,人社部办公厅发布《关于对拟发布船舶岸基管理...
2026-07-04 17:38:01
72吨北欧三文鱼40分钟交...
青岛日报社/观海新闻7月4日讯 7月4日,马士基航空波音777-2...
2026-07-04 17:37:55
看得见的病,看不见的负担:...
来源:@华夏时报微博重症肌无力患者和志愿者等人同台演出华夏时报记者...
2026-07-04 17:37:49
咪咕数媒联合主办昕智大讲堂...
来源:环球网 2026 年 7 月 4 日,由咪咕数媒联合主办的《...
2026-07-04 17:37:43
下线!豆包、千问出手:将暂...
  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力...
2026-07-04 17:28:44
为基层减负!新疆四地试点基...
(来源:新疆日报)记者从自治区数字化发展局获悉:自治区已在克拉玛依...
2026-07-04 17:28:33
300961,终止控制权变...
【导读】深水海纳终止控制权变更事项,实控人等需偿还8000万元诚意...
2026-07-04 17:28:20

热门资讯

从 “坐等报批” 到 “24 ... 转自:扬子晚报扬子晚报网7月4讯(通讯员 王雯雯 记者 姜天圣)近日,江苏高光半导体材料有限公司相关...
出海扩产承压前行,贵州轮胎摩洛... 日前,贵州轮胎(000589.SZ)抛出重磅海外扩产计划,拟投资近3亿美元在摩洛哥建设年产600万条...
【提示】12个新职业,要来了! (来源:上海普陀)近日,人社部办公厅发布《关于对拟发布船舶岸基管理工程技术人员等职业信息进行公示的公...
72吨北欧三文鱼40分钟交付!... 青岛日报社/观海新闻7月4日讯 7月4日,马士基航空波音777-200全货机搭载72吨北欧三文鱼抵青...
看得见的病,看不见的负担:重症... 来源:@华夏时报微博重症肌无力患者和志愿者等人同台演出华夏时报记者 周南 北京报道2001年,清昭2...
咪咕数媒联合主办昕智大讲堂,彭... 来源:环球网 2026 年 7 月 4 日,由咪咕数媒联合主办的《昕智大讲堂——彭凯平 x 鲍鹏山心...
下线!豆包、千问出手:将暂停这...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:证券时报)今...
为基层减负!新疆四地试点基层报... (来源:新疆日报)记者从自治区数字化发展局获悉:自治区已在克拉玛依市、乌鲁木齐高新技术产业开发区(新...
300961,终止控制权变更 【导读】深水海纳终止控制权变更事项,实控人等需偿还8000万元诚意金及订金中国基金报记者 忆山7月3...
在古都文脉中体验传统体育项目 ... 近日,“中轴线与北京‘双奥’主题展览”活动在国家体育场举办。这场活动为市民呈现了一场融合“展览演艺、...