动态列表

  • Stability AI前CEO惊人预测:人类智力价值归零,只剩1000天!
  • 刚刚,奥特曼预言:人类「只剩」最后5年!
  • 免训练加速61倍!陈怡然团队新作DPad:仅关注「彩票token」
  • 估值840亿AI实验室再放大招,他们要给大模型戴上「紧箍咒」
  • 自动驾驶进入大模型时代,主机厂寻找「联合创始人」
  • 复旦等揭秘机器人“大脑”安全漏洞:一张图就能让它“宕机”,攻击成功率76.2%
  • DASFAA 2025 | 湖大等提出SCRA-VQA:给LLM一份“精装修”的图像描述,无需训练提升VQA性能
  • 苹果官方旗舰店也放假,商品不发货;腾讯推「老年打车」服务;车主酒驾,智能驾驶「报警」|极客早知道
  • 刚刚,ChatGPT Pulse上线!私人秘书不再是富人特权
  • 颠覆算力格局!全球首个星座级太空AI算力服务,在中国诞生
  • OpenAI 3万亿美元测试,AI首战44个行业人类专家!
  • JHU教授揭秘学术潜规则:普通博士如何打破鄙视链翻盘?
  • Hinton预言错了!年薪狂飙52万美元,AI没有「干掉」放射科医生
  • 168 元一年的「小红卡」,是小红书打破本地生活红海的钥匙
  • 当 5 亿玩家涌入 AI 的 3D 新世界
  • 博士申请 | 香港中文大学(深圳)冀晓强老师课题组招收人工智能全奖博士/硕士
  • 128k死穴被击穿!Amazon爆改长上下文:段内压缩快4×,推理不掉点还更准
  • 普林斯顿陈丹琦组新作:RLHF难支撑,RLVR有边界?RLMT开辟第三条路
  • AI 到底会不会做生意?1688 的答案让人惊喜
  • 找人不求人?Lessie 让「人脉玄学」变成算法游戏|AI 上新
  • 斯坦福推出VisualMimic:让机器人“眼观六路”,零样本完成复杂任务
  • 浙大发布RS3DBench:让遥感AI看懂3D世界,首个像素级对齐的大规模基准来了!
  • 小米 17 系列发布,4499 起;追觅「库里南」图片曝光;YU7 Max 成「百万最速」车
  • 刚刚,LeCun团队开源首款代码世界模型!能像程序员一样思考的LLM来了
  • AI正在偷走白领工作!OpenAI狂砸10亿教AI上班,你的完美继任者即将上岗
  • Sora 2瑟瑟发抖!通义万相2.5放大招:一句话出1080P电影,音画精准同步
  • 信息熵之后,清华提出状态熵!量化分析「系统智能性」的全新视角
  • 突发!Meta刚从OpenAI挖走了清华校友宋飏
  • KV缓存不再爆!清华姚期智团队重写注意力维度,长上下文更省更强 | NeurIPS 2025 Spotlight
  • 78条打穿1万条!上交大新范式告诉你:智能体训练靠“质”,不是靠“量”
  • 北京内推 | 中科院软件所数据科学研究中心招聘大语言模型算法实习生
  • 三款骁龙芯片曝光,高通谷歌联手打造「安卓 PC」时代
  • Instagram 月活破 30 亿,靠“短视频”和“私信”;2027款iPhone曝光;女子用ChatGPT选号中百万大奖,全部捐出
  • 一年4次迭代,狂堆GPU成真!微软AI冷液灌芯,散热暴涨3倍
  • 刚刚,阿里CEO吴泳铭发布「ASI宣言」:超级智能才是终局!
  • 前Meta工程师爆料:17人团队15个H-1B!一夜之间80%对手没了?
  • 秘塔AI放大招!「边想边搜边做」,内置20+智能体,想法一键实现
  • 震撼!AI物理「双修」:亥姆霍兹方程嵌进生成器,伪影当场消失
  • OCRBench v2 25年9月最新榜单发布!揭示多模态大模型文档智能真实水平
  • 恶劣天气下的图像修复:南理工等提出LCDiff,让AI在雨雪雾天也能看得清
  • RL不再撒胡椒面!港科大 × 清华新作:只盯“规划token”,大模型推理力狂飙
  • NeurIPS 2025 | 甩掉文本CoT!FSDrive开启时空思维链,自动驾驶迈入视觉推理时代
  • 博士申请 | 加拿大麦吉尔大学智能自动化实验室招收大模型/强化学习方向全奖博士生
  • 3 天卖完今年所有产能,蔚来全新 ES8 如何实现逆风翻盘?
  • 超越 AGI,阿里剑指「超级智能」
  • ContextFlow:无需训练的视频编辑新范式,实现电影级魔改!
  • 字节跳动OmniInsert炸场:无需掩码,任意物体“贴”进视频,效果碾压闭源SOTA!
  • Point-SSM:一种用于点云分析的极简状态空间模型,在医学点云任务上表现SOTA
  • 忘了法拉利,一辆中国车正在改写游戏规则
  • 40亿投进去,换回了什么?全新问界M7的「值得」哲学
  • 华为问界新 M7,1 小时大定 3 万;李想:iPhone 17 顶配太丑,不买;防台风,腾讯「捆绑」QQ 企鹅塑像
  • 一半人明天不上班,GDP不会掉一点!耶鲁大学揭AGI残酷真相
  • 告别胶水代码,5倍飚速!无问芯穹首次揭秘,Infra智能体蜂群登场
  • Depth Anything再出新作!浙大 & 港大出品:零样本,优化任意深度图
  • H-1B「天价签证」引爆恐慌!印裔精英返乡梦碎,2800亿市场剧震
  • 突发:甲骨文CEO下台!刚和OpenAI签下3000亿美元大单,或因路线斗争
  • 年轻一代创作者,学会与 AI 共舞
  • KDD 2025 | 从个股偏离到市场共振:UMI挖出股市非理性因子,显著提升预测精度
  • 一套框架搞定图像定制!IC-Custom统一「位置相关/无关」,万物迁移真落地
  • 北京内推 | Apple中国招聘机器学习/AI方向研究型实习生
  • MiniCPM-V 4.5技术报告正式出炉!首个高刷视频理解多模态模型全解析
  • Yann LeCun团队新作LLM-JEPA:结合联合嵌入预测架构,显著提升大模型微调性能与效率,在代码生成任务上表现卓越
  • SilentStriker:无声击溃大模型
  • TPAMI | 数据增强还在“盲操”?南大提出IPF-RDA,让模型训练告别信息丢失
  • 小米 17 系列手机官宣 9 月 25 日发布;iPhone 17 标准款需求超预期,苹果已增产;罗永浩再回应债务问题:个人债务五年前就还完了,后面是主动还的公司债务|极客早知道
  • 比思维链准43%!逻辑脑+大模型直觉,推理可靠性大幅提升
  • 陶哲轩官宣AI数学基金首轮名单:29个项目瓜分1.3亿,数学界沸腾!
  • GPT-5仅23.3%,全球AI集体挂科!地狱级编程考试,夺金神话破灭
  • 一手奶瓶一手键盘!新手宝妈产假氛围编程,自研实用家庭App
  • 刚刚,DeepSeek-V3.1「终极版」重磅发布!最大提升超36%,V4/R2还远吗?
  • 为了千元机用户的「流畅权」,OPPO 为安卓换了个「引擎」
  • ​一年卖出 10 个亿,这是年轻人真正的「户外神器」
  • Teable 宣布完成数百万美元天使轮融资,让数据库「长出耳朵和手」
  • 博士申请 | 复旦大学魏龙老师课题组招收AI4Science方向博士/硕士/RA/实习生
  • Lumos-1登场!自回归 + 离散扩散合体:让大模型真正“构造”动态世界!
  • RLHF要下岗?Meta × 牛津搞出新套路:用算力教算力,大模型训练新范式来了!
  • 北京内推 | 智源研究院多模态交互研究中心招聘多模态/具身智能方向研究型实习生
  • 不到两千块,我拍到了专业级别的月全食|New Things
  • 字节跳动SAIL-VL2登顶OpenCompass,开源高效多模态新标杆
  • 博后年薪40万到90万 | 东方理工朱文韬课题组招聘AI方向博士后、研究助理教授、访问学生、实习生
  • 苹果发布Manzano:一种简单可扩展的统一多模态大模型,其混合视觉Tokenizer统一了理解与生成任务,性能SOTA
  • 黄仁勋出手,50 亿美元入股英特尔,英伟达一统「GPU+x86」生态
  • 巴菲特清仓比亚迪,期间股价上涨 38 倍;苹果折叠屏手机细节曝光;雷军年度演讲定档 9 月 25 日
  • 刚刚,Gemini「灵魂人物」官宣加盟xAI!马斯克火速转推背书
  • 靠10万+粉丝,北漂插画师秒贷款!华为全栈AI加速,让银行及时看见
  • 醒醒,LLM根本没有性格!加州理工华人揭开AI人格幻觉真相
  • 哈佛大佬都哭了!H-1B签证飙至10万刀,微软谷歌连夜召回全球员工
  • 马斯克xAI百天血战,100天狂招100人!联创实权被削,豪言干掉微软
  • 全球双榜SOTA!明略科技专有大模型 Mano开启GUI智能操作新时代
  • 谷歌Gemini IMO和ICPC夺金功臣之一被xAI挖走,马斯克直呼:起飞
  • 工业级3D世界构建提速90倍!全新框架LatticeWorld让虚拟世界「一句话成真」
  • 集合通信库VCCL释放GPU极致算力,创智、基流、智谱、联通、北航、清华、东南重磅开源
  • 【招生招聘】阿卜杜拉国王科技大学孟彦达博士组全奖博士、博后、实习、交流生
  • 告别视频“抽帧”理解,美国东北大学新算法GRT算法实现高效可扩展的高帧率密集视频理解
  • iPhone17 卖爆,官网发货延至双 11;比亚迪仰望 U9 赛道版开启预定;网友玩坏 iPhone「舌头刷抖音」

苹果掀桌!扔掉AlphaFold核心模块,开启蛋白折叠「生成式AI」时代



  新智元报道  

编辑:元宇
【新智元导读】蛋白质折叠是计算生物学的皇冠难题,SimpleFold作为首个仅基于通用Transformer模块的蛋白折叠模型,摒弃了AlphaFold2系列的传统架构,能够直接将蛋白质序列生成完整的三维原子结构,在CAMEO、CASP基准测试上表现强劲。

一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发

蛋白质折叠,一直是计算生物学中的一个核心难题,并对药物研发等领域产生着深远影响。

若把蛋白质折叠类比为视觉领域的生成模型,氨基酸序列相当于「提示词」,模型输出则是原子的三维坐标。

受此思维启发,研究人员构建了一个基于标准Transformer模块与自适应层的通用且强大的架构——SimpleFold。

论文地址:https://arxiv.org/abs/2509.18480

SimpleFold和AlphaFold2等经典的蛋白质折叠模型有哪些不同?

AlphaFold2、RoseTTAFold2通过融合复杂且高度专业化的架构,如三角更新、成对表示、多序列比对(MSA)。

这些设计往往是将我们对结构生成机制的已有理解「硬编码」到模型中,而不是让模型自己从数据中学习生成方式。

SimpleFold则提出了一种全新思路:

没有三角更新、成对表示,也不需要MSA,而是完全基于通用Transformer和流匹配(flow-matching),能够直接将蛋白质序列映射为完整的三维原子结构(见图1)。


SimpleFold
首个基于Transformer模块的蛋白折叠模型

流匹配把生成视作一段随时间推进的旅程,用常微分方程(ODE)做轨迹积分,就好像冲洗照片一样,噪声也一点点被「冲洗」成清晰的结构。

SimpleFold在蛋白质折叠上也复现这段旅程:

输入是氨基酸序列这串「提示词」,输出是全原子三维「照片」,很像视觉里的「文生图」或「文生三维」任务。

自AlphaFold2以来,诸如三角更新、单体与对表示交互等组件被广泛应用于蛋白质折叠模型,但这些设计是否必要并未形成定论。

SimpleFold在设计上进行了大胆创新,仅采用通用Transformer模块构建架构(对比见图5)。

SimpleFold架构由三部分组成:轻量原子编码器、重型残基主干、轻量原子解码器(见图2)。

这套「细—粗—细」的层级套路,先看微观、再抓全局、再补细节,在速度与精度之间找到了良好的平衡点。

与以往方法不同,SimpleFold不使用对表示,也不依赖MSA或PLM的注意力初始化。

与依赖等变架构的工作相比,SimpleFold完全基于非等变的Transformer构建。

为应对蛋白质结构中的旋转对称性,研究人员在训练时引入SO(3)数据增强,即随机旋转目标结构,并依赖模型学习该对称性。


实验评估

为了研究SimpleFold框架在蛋白质折叠任务中的扩展能力,研究人员训练了一系列不同规模的SimpleFold模型(包括100M、360M、700M、1.1B、1.6B和3B)。

模型做大不只是加参数,随着模型规模的增加,研究人员在原子编码器、解码器和残基主干网络也进行了全链路升级(详见表5)。

在训练过程中,研究人员借鉴AlphaFold2的策略,同一蛋白在每张GPU上复制Bc份,各自抽不同时间步t,再从Bp个蛋白累积梯度(具体设置见表6)。

实验表明,这种策略相比于直接随机选择蛋白组成一个batch,能带来更稳定的梯度和更优的模型性能。

研究人员在CAMEO22和CASP14这两个广泛使用的蛋白质结构预测基准上评估了SimpleFold的性能。

这两个基准测试在泛化能力、鲁棒性以及原子级准确性方面要求较高。

表1总结了CASP14和CAMEO22上的评估结果。

研究人员根据蛋白序列信息提取方式将模型分为两类:基于MSA检索的方法(如RoseTTAFold、RoseTTAFold2和AlphaFold2)和基于蛋白语言模型(PLM)的方法(如ESMFold和OmegaFold)。

此外,还根据训练目标是否为生成式目标(如扩散、流匹配或自回归)对基线模型做了标注,以区分它们是否直接进行结构回归。

有意思的是,从AlphaFold2、ESMFold微调成流匹配的AlphaFlow、ESMFlow,整体指标反而不如各自原版回归模型。

研究人员认为,这是因为蛋白质折叠基准如CAMEO22和CASP14通常仅提供一个「真实」结构目标,这对于进行确定性逐点预测的回归模型更为有利。

尽管架构简洁,但SimpleFold的性能依然非常出色。

在两个基准测试中,SimpleFold一贯优于同为流匹配方法、基于ESM嵌入构建的ESMFlow。

在CAMEO22上,SimpleFold的表现与目前最先进的模型(如ESMFold、RoseTTAFold2和AlphaFold2)相当。

更为重要的是,不使用三角注意力和MSA,SimpleFold在多数指标也能跑到RF2/AF2性能的95%以上。

在更具挑战性的CASP14中,SimpleFold甚至超越了ESMFold。

SimpleFold跨基准的掉分更小,说明它不靠MSA也能稳健泛化,能够应对更复杂的结构预测任务。

研究人员也报告了不同规模的SimpleFold模型的表现。

即便是最小的SimpleFold-100M,在CAMEO22上也能实现ESMFold性能的90%+以上,进一步说明基于通用结构模块构建蛋白质折叠模型是可行的。

随着模型规模的提升,SimpleFold的性能在各项指标上持续提升,这表明通用可扩展的架构设计在折叠任务中具有显著优势。

尤其是在更具挑战性的CASP14上,模型扩大带来的性能增益更为明显。

图3(a)展示了一个包含pLDDT预测值的结构示例,其中红色和橙色表示预测置信度低,蓝色表示预测置信度高。

可以看到,SimpleFold对大多数次级结构的预测较为自信,而在柔性环区域表现出一定不确定性。

图3(b)和(c)展示了pLDDT与实际LDDT-Cα的对比分析。


SimpleFold的结构集合生成能力

采用生成式目标的好处在于:SimpleFold可直接建模结构分布,而非仅输出单一「定稿」。

因此,同一条氨基酸序列,它既能生成一个确定性的结构,还能生成多个不同构象组成的结构集合。

为了验证SimpleFold这一能力,研究人员在ATLAS数据集上进行测试。

该数据集用于评估分子动力学(MD)结构集合的生成,包含了1390个蛋白质的全原子MD模拟结构。

表2展示了SimpleFold与多个基线模型在ATLAS上的对比结果(不同规模的SimpleFold模型见表9)。

所用指标全面评估了生成结构集合的质量,包括柔性预测、分布准确性以及集合可观测性。

如表2所示,SimpleFold在多个评估指标上持续优于同样依赖ESM表征的ESMFlow-MD。

同时,在暴露残基与互信息矩阵等关键可观测性上,SimpleFold也胜过AlphaFlow-MD,有助于挖掘药物发现里常见的「隐性口袋」。

研究人员还评估了SimpleFold对天然具有多种构象状态蛋白质的结构建模能力。

如表3所示,在Apo/holo数据集上,SimpleFold取得了当前最优表现,显著超越了AlphaFlow等强大的MSA方法。

在Fold-switch数据集上,SimpleFold的表现与ESMFlow相当甚至更优。

整体来看,SimpleFold的性能随着模型规模的增加而提升,进一步展示了该框架在蛋白质结构集合生成方面的巨大潜力。


在蛋白质折叠中的扩展效应

为了研究SimpleFold在蛋白质折叠任务中扩展效应,研究人员训练了从1亿参数到30亿参数不等的多个模型版本。

所有模型均使用完整预训练数据,包括PDB、AFDB中的SwissProt以及筛选后的AFESM。

图4(a)-(d)展示了模型规模对折叠任务的性能影响(另见图1(d))。

结果表明,规模更大的模型在训练资源更充足的情况下(如更多FLOPs和迭代次数)表现更佳。

这证明SimpleFold的可扩展性过关,也为通用生成模型在生物领域大规模落地指出了可行路径。

研究人员还研究了训练数据规模的扩展对模型表现的影响:使用SimpleFold-700M模型,在不同规模的数据集上进行训练。

如图4(e)-(f)所示,随着训练数据中唯一结构数量的增加,在40万次迭代后,模型性能持续提升。

这些结果证明:一个简洁、可扩展的折叠模型能够从日益丰富的实验与模型数据中持续获益。


作者简介

Yuyang Wang

Yuyang Wang现为苹果机器学习研究(MLR)的一名人工智能研究员,目前致力于研究构建通用的扩散模型。

Yuyang Wang获卡内基梅隆大学(CMU)博士学位,长期从事生成式模型与科学计算的交叉研究。

其兴趣集中在flow-matching/扩散等通用生成模型及其在图像、3D、图与分子体系中的表示与推断,并探索以通用Transformer解决蛋白质结构建模等问题。

除论文外,Yuyang Wang重视开源与可复现,经常与跨学科团队协作,推进药物发现与蛋白设计等应用。

参考资料:
https://arxiv.org/abs/2509.18480


<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652630672&amp;idx=1&amp;sn=96b70f9e99c4cf2bda370f6b1d919cf8&amp;chksm=f0529d0752f1b825f5ea736db1750e0afd67a3304c822f23011f97ad1550ac29b6c6966d8f0c&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/KrsLxQnFn4&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们