中文大模子测评出炉:豆包跻身全球第一梯队 小米MiMo上榜
2026-03-30 13:40:13
3月30日消息,中文大模型基准测评SuperCLUE发布2026年3月最新结果,22款国内外主流模型参与角逐。
字节跳动旗下豆包(Doubao-Seed-2.0-pro-260215(high))以71.53分拿下国内第一,成功跻身全球第一梯队;小米集团的MiMo-V2系列两款模型均顺利上榜。
本次测评覆盖数学推理、科学推理、代码生成等六大核心任务,全面检验模型综合能力。海外闭源模型依旧占据总分前列,Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)分列前三。
豆包则紧随其后,总分仅与GPT-5.4相差0.95分,实现全方位追赶,在智能体任务规划维度更是反超部分海外模型,跻身全球前五。
小米此次有两款模型入选测评榜单,其中MiMo-V2-Pro以60.67分位列闭源模型前列,在数学推理任务中取得84.03分的亮眼成绩;开源版本MiMo-V2-Flash虽以49.97分排名靠后,但在代码生成等细分场景中表现出一定潜力。
测评还显示,国产模型整体表现亮眼,开源赛道尤为突出,Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型包揽开源榜前三,大幅领先海外同类模型。

声明:文章不代表链懂观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
相关阅读
-
探索欧 易下载官方app下载的魅力与实用性链百科 2026-03-30 13:37:17
-
4月发布,OPPO Pad Mini真机表态:8.8英寸小平板、首发骁龙8 Gen5链资讯 2026-03-30 13:29:17
-
KRW1是什么?有什么用途?一文详解首个韩元支持的稳定币链知识 2026-03-30 13:28:44
-
一体化数字资产平台WhaleFin与国际鲸豚保护组织WDC达成合作链百科 2026-03-30 13:27:00
-
反差婊黑料万里长征:揭示直播视频软件背后的内幕链资讯 2026-03-30 13:26:11
-
深入了解欧交易所app官方下载,助您轻松进行数字资产交易链百科 2026-03-30 13:23:11
-
3年衰减40%,司机列队加装电池续命 专家:这些车都是挪动炸弹链资讯 2026-03-30 13:22:27
-
韩国网友偷广州街景图称是首尔,阅读破百万后引争议删除链资讯 2026-03-30 13:16:19
-
币安旗下印度交易所WazirX遭冻结资产816万美元链百科 2026-03-30 13:12:09
-
神人筹划,冯提莫直播间擦边被封:开岛典礼被告发链资讯 2026-03-30 13:10:54