数学家惊了,ChatGPT初次原创独立证实数学假定
2026-03-31 16:40:27
3月31日消息,近日,比利时布鲁塞尔自由大学(VUB)数据分析实验室发布重磅研究成果,证实商用大型语言模型已具备独立生成原创数学证明的能力。
OpenAI旗下ChatGPT-5.2(Thinking)成功破解了一项此前悬而未决的数学猜想,同时催生了名为“vibe-proving”的全新AI推理方法,相关预印本论文已于2026年2月21日发表在arXiv平台。
此次研究聚焦的核心命题,是数学家Ran与Teng在2024年提出的一项数学猜想。在数学领域,猜想是基于规律与重复验证被认为成立,但尚未经过严谨形式化证明的命题,只有完成完整有效的逻辑论证,猜想才能正式升格为定理。
研究团队介绍,整个证明过程历经7轮与ChatGPT的对话交互,形成了4版逐步迭代完善的论证版本。其中,ChatGPT核心承担了证明路径探索、核心结构搭建的工作,人类研究人员则全程把控推理的正确性与逻辑完整性。
研究团队将这种大模型辅助梳理、探索复杂理论构想的模式,命名为“vibe-proving”,并提出这一方法有望复刻AI辅助编程(vibe-coding)的快速发展路径,从基础工具快速向近自动化的理论探索演进。
“此前很多人认为,AI系统的创造力本质上只能局限于对训练数据的重新组合,我们的研究恰好打破了这一误解。”VUB教授VincentGinis表示。参与研究的博士后研究员BrechtVerbeken也坦言,虽早已预判ChatGPT能助力数学难题证明,但其实际表现出的效率仍远超预期。
尽管AI在此次证明中发挥了核心作用,研究团队仍反复强调,人类的参与与最终验证不可或缺,尤其是补全证明逻辑缺口、完成最终严谨校验的环节。
VUB教授AndresAlgaba指出,AI将大幅加快数学猜想候选证明的生成速度,未来行业的核心瓶颈会转向人类验证环节,而语言模型同样有望在这一领域提供助力。
这项成果也标志着,大语言模型的能力边界已从辅助编程、文本创作,正式拓展至需要深度原创推理的理论数学研究领域。

相关阅读
-
AI不再一本正派胡说,千问测试引证新功能:让AI本人打假链资讯 2026-03-31 16:33:46
-
我国团队初次精准测定月壤单颗粒热导率:发现天然超绝热资料,链资讯 2026-03-31 16:27:41
-
最后一天,一次性信誉修复政策明天截止 万元以下足额还款征信将不显示过期链资讯 2026-03-31 16:22:16
-
什么是元宇宙(metaverse)?链百科 2026-03-31 16:17:17
-
2026年3月科学蜚语榜:过敏是由于免疫力差、汽车车身轻等于保险性下落等系谎言链资讯 2026-03-31 16:17:02
-
2.71T数据,蚂蚁灵波开源大范围空间感知数据集链资讯 2026-03-31 16:10:14
-
终究对僵尸车出手了,深圳新规:恒久占位不缴费者将罚款并归入征信链资讯 2026-03-31 16:04:23
-
元宇宙是什么?VR虚拟实境加强版?一分钟看懂元宇宙新革命!链百科 2026-03-31 16:02:20
-
三年营收从16亿飙至65亿,盛合晶微冲刺科创板:拟募资48亿元链资讯 2026-03-31 15:58:31
-
张雪机车制止新手买车 盼望少死人引网友点赞:官方欢送告发 证明后奖5000元链资讯 2026-03-31 15:52:35