动态列表

  • 1亿签约金抢AI大神?谷歌AI元老劝退全网:别再读博了!
  • 三天逆袭,Sora登顶美榜!15秒大片玩疯奥特曼,全网直呼真假难辨
  • 10个Agent一键组队:并行智能体协作,端到端交付从24h缩减到4h!
  • 首位AI女演员出道!好莱坞「天敌」来了,下一代偶像全是代码制造?
  • 南理工提出FMC-DETR:巧用“频率解耦”,航拍小目标检测精度飙升8.2% AP50
  • 网红挑战特斯拉FSD穿越美国出车祸;小米回应「小米汽车突然自己开走」;Sora 登顶美区苹果商城免费榜
  • 刚刚,Anthropic紧急换帅!新任CTO执掌算力命脉,直面OpenAI千亿赌局
  • Gemini 3.0 Pro内测流出,编程实力惊人!下周上线
  • 刚刚,奥特曼首曝:AI取代CEO后,我想去当农民!
  • 华人主导谷歌SLED,论文登顶会!一键让模型学会自救
  • LeCun考虑辞职!Meta AI百亿豪赌引爆「内战」,逼走首席科学家
  • NeurIPS 2025 | RAD:基于大规模3DGS孪生数字世界的端到端强化学习训练策略
  • 小米 17 系列销量超百万;苹果新产品泄密源头疑为越南工厂;低价版 model Y 现身官网代码|极客早知道
  • 刚刚,这家0产品0模型就估值854亿的公司,终于发布了首款产品!
  • 刚刚,奥特曼亲赴,韩国「举国」投靠!
  • 奥特曼「一张脸」引爆全球狂欢!Sora 2冲上APP榜第三,邀请码炒到1250元
  • 60岁老人AI养生三个月吃进医院!「AI精神病」全球扩散,OpenAI急招医生
  • 一杯咖啡,3亿美金!斯坦福天才少女退学创业,Meta AI大牛排队加入
  • 武大新作MASt3R-Fusion:融合IMU与GNSS,为新一代视觉SLAM注入“多感官”智慧
  • 中科大、清华、快手等发布OpenGPT-4o-Image:为多模态AI打造的“超级燃料”,图像编辑性能提升18%
  • 历史首位,马斯克身家突破 5000 亿美元;王腾注销、清空多个社媒账号;美国演员工会抵制 AI 演员
  • 刚刚,OpenAI Sora 2重磅登场!首个APP上线,或将成为AI时代新TikTok
  • Sora 2全网疯狂实测:以假乱真、脑洞大开、虚实难分|附首个APP教程和邀请码
  • OpenAI和DeepMind大佬离职联手,誓用AI科学家实现室温超导!已融3亿美元
  • 南洋理工联合商汤提出Visual Jigsaw:像玩拼图一样,显著提升多模态大模型的视觉理解力
  • 天津大学联合腾讯提出Wan-Alpha:一键生成高质量透明视频,发丝级抠图不再是梦
  • OpenAI 深夜重磅推出新视频模型和独立 App;英伟达市值突破4.5万亿美元;特斯拉预计推出第三代人形机器人 | 极客早知道
  • 刚刚!软银系创始人4个月打造机器人超级黑马,获2轮近亿元融资
  • 博士生,当代最穷科研民工?Nature最新调查:不涨工资,我们就跑路了
  • Thinking Machines曝LoRA终极指南:10倍学习率,媲美全参微调
  • AI改造出行体验:滴滴的试验能否开启行业范式转变?
  • GPT-5「降智」真相曝光:不是变笨,而是五个超级开关没激活
  • OpenAI 刚刚发布了属于 AI 的抖音,还有 Sora 2
  • DeFacto:用强化学习治愈AI幻觉,让多模态模型“有据可查”
  • YOLO26首份学界评论:端到端无NMS,目标成为边缘设备实时目标检测新标杆
  • NeurIPS 2025 | 清华大学与华为等提出全新正则化方法,破解稀疏视图3DGS“协同适应”难题
  • 榜一换人!OCRBench v2九月新榜:揭示多模态大模型文档智能真实水平
  • 把“俄罗斯方块”搬进设计室:物竞天择让振动微型机器人进化得越跑越快
  • LoRA到底能否媲美全参?Thinking Machines用实验曲线划出「无悔区」
  • DeepSeek V3.2 发布,API 成本减半;特斯拉员工被机器人打伤,索赔 5100 万美元;Claude 新模型登场
  • 谷歌Veo 3论文竟无一作者来自美国!揭秘零样本「看懂」世界
  • 零样本「即插即用」!智源开源RoboBrain-X0,一个基座模型开动不同机器人
  • AI老司机现身重庆!徐峥挑战赛车手,上演「不再囧途」
  • 强化学习之父给LLM判死刑!站队LeCun:我们全搞错了
  • 独家!DeepSeek最新模型上线,全新注意力机制基于北大ACL最佳论文
  • 北京内推 | 快手可灵AI技术部招聘视频生成/数字人方向算法实习生
  • KDD 2025 | 看不见也能控:用“基混杂向量”打穿分布移位,交通预测稳了
  • 4B逼近DeepSeek-R1!Bengio团队「递归聚合」刷新小模型上限
  • 在云栖,我们遇见了最会玩的「AI 原住民」
  • NeurIPS 2025 | UniPixel:首个统一对象指代与分割的像素级推理框架,让大模型看懂每一个像素
  • NeurIPS 2025 | Seg4Diff:无需分割头,揭示并放大扩散Transformer中的涌现分割能力
  • 做 AI 陪伴收获 1000 万用户后,前微信 AI 产品负责人,要重新定义生活里的 AI
  • 透视阿里云产品生态团队:AI 落地的「关键通道」
  • OpenAI「降配门」发酵,偷换模型遭全网实锤;小米 SU7 在日本首秀;苹果内部测试类 ChatGPT 应用|极客早知道
  • OpenAI「GPT门」事件引爆!Plus、Pro账户统统降配,偷换模型全网实锤
  • 突发,普林斯顿CS博士后猝然离世!清华本科毕业,刚完成论文答辩
  • 国内首次!8.9毫秒推理速度破纪录,1元打穿百万token
  • 惊现高管离职潮!马斯克亲信操盘xAI,千亿美元能填AGI野望?
  • 黄仁勋2小时反驳「AI泡沫帝国」论!英伟达将成全球首家十万亿市值公司
  • 云与AI,如何托举 Z 世代的创新野心
  • 8GB显卡的逆袭!SSD换显存,3060 Ti硬跑100k长上下文
  • NeurIPS 2025 | 我奶奶都能复现?条件表征学习:矩阵一乘,表征立马“对齐”!
  • 北京/杭州内推 | 阿里通义实验室招聘多模态大模型与智能体方向算法实习生
  • InterDigital开源CompressAI-Vision:为“AI看”的视频压缩,打造一个“通用跑分平台”
  • NeurIPS 2025 | 北大等提出C²Prompt:解耦类内与类间知识,破解联邦持续学习“双重遗忘”难题
  • 24.98万的理想i6,在特斯拉、小米、蔚来「后院」放了一把火
  • 小米 17 开售 5 分钟,破国产机销售纪录;Meta 研发机器人项目;国内发布「脑机接口标准」

陶哲轩联手GPT-5,1小时攻克数学难题!全程无需编码,OpenAI副总惊呼



  新智元报道  

编辑:桃子
【新智元导读】陶哲轩联手ChatGPT,多轮交互一个小时,最终破解了MathOverflow复杂数学题。让他惊喜的是,AI不仅省去了数小时编码,还优化了工作流。

一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发

两年前,陶哲轩曾预言,「2026年的AI,将成为数学研究和其他很多领域的可靠的合作者」。

现在,不用等到2026年,AI已经做到了!

在Mathstodon上,陶哲轩称,自己联手ChatGPT攻克了一个MathOverflow难题,节省了数小时的编码时间。

在此期间,对话持续长达一小时。

OpenAI副总Kevin Weil激动表示,「陶哲轩+AI解决了复杂数学难题」。

OpenAI科学家Sebastien Bubeck自豪地表示,「这次,是陶哲轩本人的」。

几天前,GPT-5成功破解三大猜想,通过了「哥德尔测试」,以往需要耗费人类博士生数日时间才能完成。

如今,越来越多的证据表明,AI正为数学发现做出实质性的贡献。

这一次,陶哲轩携手ChatGPT,攻克了怎样的难题?


陶哲轩+GPT-5,破解数学难题


这个MathOverflow的问题,探讨了「最小公倍数序列是否为某一特定集合的子集」——

 序列lcm(1,2,…,n)是否是高度丰数的一个子集?


陶哲轩本人通过理论分析,已经得出结论:答案是否定的。

然而,要完全证明这一点,他需要找到具体的数值参数,以便确凿地构建一个反例。

这一过程看似简单,实则需要繁琐的计算和参数搜索,稍有不慎便可能陷入低效的泥潭。

初试ChatGPT,多轮交互


起初,陶哲轩尝试让ChatGPT直接生成Python代码,以搜索满足条件的不等式参数。

这样一来,就可以自己运行和调整。

不过,这一方法很快暴露了局限性——

生成的代码运行时间过长,且初始参数选择不当,最终会导致搜索的失败。

于是接下来,他改变了策略,转而与AI展开分步对话,让它通过启发式计算来寻找可行的参数选项。

这种方法的核心在于:将复杂问题拆解为小步骤,每一步都由AI提供计算支持,并在陶哲轩的指导下不断优化。

最终,AI成功生成了符合要求的参数。

为了确保结果的可靠性,陶哲轩使用了一个由AI生成的29行Python脚本进行独立验证。

这个脚本简洁明了,易于人工检查,且验证的数值结果与之前的启发式预测完全吻合。

上下滑动查看


不用手动编码,优化工作流


陶哲轩坦言,AI在这一过程中的作用不可忽视。

AI不仅帮助他发现了初始尝试中的多处数学错误,还将原本可能耗费数小时的编程与调试工作,压缩为一个高效的流程。

如果没有AI的协助,他根本不会尝试这种数值搜索,而是转而寻求更传统的理论分析方法。

更重要的是,陶哲轩强调,他没有遇到AI常见的「幻觉」问题。

这得益于他清晰的任务规划,以及分步引导的对话方式。

每一步计算,都在自己的监督下完成,AI仅在最后阶段提供了数值结果和验证代码,确保了整个过程的严谨性。

我认为,这是因为对需要执行的那些繁琐的计算任务,我心里已经有了比较清晰的规划,并且能够以分步的方式向AI详细解释,每一步都在对话中得到确认后,再继续下一步。  


在切换到对话式策略后,我只在最后阶段才用Python进行外部验证,也就是当AI生成了它声称满足约束条件的数值输出时。


顺便提一句,陶哲轩本人用的就是,所有人接触到的GPT-5。

陶哲轩的这次尝试,为我们揭示了AI在数学研究中的巨大潜力。

它不仅能执行繁琐的计算任务,还能在数学家的引导下,参与复杂的探索过程。

AI的价值在于解放研究者的时间与精力,让他们能够专注于更高层次的思考与创新。

正如陶哲轩所言,「如果没有 AI 的帮助,我很可能不会去尝试这种数值搜索」。

从AI拿下IMO金牌,到成为天才数学家的得力助手,或许未来,类似的故事将更多领域不断上演。

参考资料:
https://x.com/kevinweil/status/1974161952260624459
https://x.com/minilek/status/1974118573569421650 
https://x.com/slow_developer/status/1974238028743811544

<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652631925&amp;idx=1&amp;sn=615e5d3c408ae6d5832fe50186325ab2&amp;chksm=f0abda4073699be2cb9c59d4ad778a51f871507403dc915aa4a3771e545907840aa750ef4e33&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/2qQiqjTeoS&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们