动态列表

  • 别再问什么工作被AI取代!Karpathy直指本质:你的工作「可验证」吗?
  • Karpathy最新发文:醒醒!别把AI当人看,它没欲望也不怕死
  • 马斯克想要「杀死」氛围编程,就像FSD搞定自动驾驶
  • 硅谷今夜笑疯!马斯克自黑「傻胖子」,只因Grok硬捧他打赢泰森
  • 2025宝山·智能机器人产业大会暨嘉年华隆重开幕
  • 解放军总医院联合南大、吉大等机构,共同提出首个「脊柱诊疗大模型」SpineGPT
  • Anthropic发现AI「破窗效应」:只是教它偷个懒,结果它学会了撒谎和搞破坏
  • DeepMind招募波士顿动力前CTO,哈萨比斯点赞宇树
  • 把具身机器人开发变简单,地瓜机器人S600与一站式平台双擎亮相
  • Meta再推WorldGen,简单一句话,竟「盖」出50×50米一座城
  • 华为开源突破性技术Flex:ai,AI算力效率直升30%,GPU、NPU一起用
  • 腾讯混元数字人团队发布Moral RolePlay基准,揭秘大模型的「道德困境」
  • 美团宣布在全国建设「骑手公寓」;2026 款苹果 iPad Air 曝光;月之暗面被曝计划明年下半年 IPO
  • 具身智能「全明星日」来袭!智源组局30+行业掌门人,激辩机器人终极命题
  • 1分钟跑出数百预测!WeatherNext 2把短时预报带入小时级
  • GPT-5得分不到0.4!法律+金融最大规模基准:1.9万+专家评估准则
  • AGI真来了!谷歌Nano Banana Pro实测,设计师天塌了?
  • 2025智源具身开放日:共筑开源基石,抢占全球具身智能生态新高地
  • 核反应堆的「第一次心跳」:初创公司实现零功率临界,研发模式迈向轻量化
  • SGLang Diffusion震撼发布:图像视频生成速度猛提57%!
  • 小米汽车第 50 万辆整车下线;谷歌推出 Nana Banana Pro;华为正式推出乾崑境系列旗舰 | 极客早知道
  • 字节这个「消失」了几年的 App,悄悄杀回苹果商城排行榜
  • 解耦骨骼与体型,实现前所未有的动画真实感!Meta SAM 3D核心技术:开源人体参数化模型MHR
  • 遥感变化检测,ChangeDINO来了:DINOv3驱动,IoU、F1指标全面SOTA!
  • ​「数字分身」白菜价:每月 998 元,雇一个 AI 帮你直播 8 小时
  • 理想亮相广州车展:宣布推送全新VLA、AES辅助驾驶能力
  • 别问树模型了!死磕结构化数据,清华团队把大模型表格理解推到极限
  • Meta超级智能实验室又发论文,模型混一混,性能直接SOTA
  • 超越 VTM-RA!快手双向智能视频编码器BRHVC亮相NeurIPS2025
  • 刚刚!腾讯混元开源HunyuanVideo 1.5 元宝上线生视频能力
  • 两院院士增选结果揭晓:周志华、刘云浩当选科学院院士
  • 无需训练、只优化解码策略,DTS框架让大模型推理准确率提升6%,推理长度缩短23%
  • RoboChallenge组委会正式成立:具身智能真机评测迈入标准化共建时代
  • 210亿美元的幻觉?奥特曼投了一家核能初创
  • LeCun出局,Meta变天!Llama 4翻车大清洗,「学院派」大败退
  • 大模型上天、马斯克发射GPU?中国团队直接建「太空超算」
  • 图像模型今夜变天?谷歌刚刚泄露了「Nano Banana Pro」这张王牌
  • AI顶会ICLR最严新规:滥用AI的作者和审稿人,论文一律拒稿!
  • 谷歌Nano Banana Pro上线,深度结合Gemini 3,这下生成世界了
  • DeepSeek悄悄开源LPLB:用线性规划解决MoE负载不均
  • AAAI 2025 Oral | 火山引擎多媒体实验室提出VQ-Insight,AIGC视频画质理解大模型
  • OpenAI 的「群聊」,可能比你想得更重要!
  • 最大游戏up主也玩本地AI?让笔记本都能跑大模型的Parallax来了
  • 并行扩散架构突破极限,实现5分钟AI视频生成,「叫板」OpenAI与谷歌?
  • 字节张楠、张宏江、田渊栋······极客公园创新大会 2026 嘉宾阵容更新!
  • 为什么说在 AI 时代,「想象」比「记录」更费劲?
  • NEX:下一代能动性模型体系与开源生态
  • 发布即产品!SAM 3D横空出世:Meta再次颠覆3D视觉,单图即可实现高精度三维重建
  • 很强很惊艳!Meta重磅开源SAM 3:可概念提示,统一检测、分割与追踪,性能提升2倍
  • 本周六,围观学习NeurIPS 2025论文分享会,最后报名了
  • AI终于学会「读懂人心」,带飞DeepSeek R1,OpenAI o3等模型
  • 让移动不再成为噪声:搭载AI的新一代可穿戴传感实现高动态条件下的精准识别
  • SOTA集体掉线?美团AMO-Bench揭露大模型数学推理的真实段位
  • 百万步0失误!LLM首次跑通1,048,575步长任务,不崩、不偏、不掉链
  • 星动纪元获近10亿元A+轮融资!吉利资本领投,总订单额破5亿
  • 刚刚,Yann LeCun官宣离职创业,瞄准高级机器智能AMI
  • 分割一切并不够,还要3D重建一切,SAM 3D来了
  • 杨立昆宣布离开 Meta「自立门户」;荷兰暂停干预安世半导体;TikTok 将支持用户设置减少 AI 内容
  • 首个AI神作!一人分饰全角,万人围观外星人嘲讽人类灭绝
  • 申研「全拒得」的「差生」,终成PyTorch之父、Meta副总裁!今天跳槽TML
  • 图灵奖得主竟「忘了提及」中国学者成果?马库斯重锤Yann LeCun
  • 永别了,Tokenizer!何恺明师徒新作,颠覆AI生图技术
  • 年度最强AI实锤!谷歌Gemini 3全网首测震撼,一句话编码封王
  • 亚马逊云科技发布Kiro正式版:核心功能升级
  • 对话斑马口语:如何用 AI Agent 造出「超人类外教」?
  • 清华团队“密度法则”登上Nature子刊,揭示大模型高效化发展新规律
  • 点击下载!中国科研人员AI使用率全面领跑:Wiley发布全新调研报告
  • 风口浪尖中的小米汽车,创下国产新势力最快盈利速度
  • 何恺明团队再出手!将ARC视为视觉问题,ViT从零训练60.4%准确率,达到人类平均水平
  • CMU新作Co-Me:无需重训,VGGT长序列迎11.3倍加速!
  • 资深技术专家胡成文出任鼎犀智创CTO,共赴新材料智创未来
  • 如视发布空间大模型Argus1.0,支持全景图等多元输入,行业首创!
  • 登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的「数据进化」
  • NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法
  • NeurIPS 2025 | 上下文元学习实现不微调跨被试脑活动预测
  • 刚刚,PyTorch之父光速入职TML!离职Meta刚过一天,投身500亿估值独角兽
  • 何恺明重磅新作:Just image Transformers让去噪模型回归基本功
  • ConsistEdit来了:无需训练,实现高精度、高一致性的视觉编辑新范式
  • Gemini 3深夜来袭:力压GPT 5.1,大模型谷歌时代来了
  • 「30 秒造应用」——蚂蚁灵光点燃「所想即所得」的魔法时刻
  • 视频模型真在推理,还是「表演」推理?港中文等质疑:Chain-of-Frame是真的吗?
  • Gemini 3 正式发布,多榜单断崖式领先;美安全服务商网络中断,ChatGPT、X 受牵连;苹果承认酒精擦拭可能导致手机掉色|极客早知道
  • 4万亿刀,仅3.6万人!英伟达揭残酷真相:劳动正与财富大脱钩
  • 医疗AI智能体全面综述:行业爆发,年增长130%!
  • AI「看见」实验,哈佛颠覆性突破!一副AR眼镜,新手秒变资深专家
  • 震惊电影圈!好莱坞混了10年没出头,他把AI「烂片」做成23万粉爆款
  • Anthropic CEO:最快明年,一半初级白领下岗!失业率将达10%-20%
  • 谷歌 Gemini 3.0 深夜炸场:没有悬念的最强 AI
  • 夸克全面接入千问对话助手,将发布全新AI浏览器
  • MIT何恺明团队新作:让扩散模型回归“去噪”本质,简单Transformer即可实现SOTA性能
  • Yann LeCun团队新作LeJEPA:仅一个超参数、50行代码,实现可证明、可扩展的自监督学习
  • JSON刚死24小时,TOON又被网友玩坏:LLM数据格式彻底乱套了
  • 美团多篇论文入选NeurIPS 2025:从大模型到多模态的全线突破 | 直播预告
  • 阿里千问公测,挑战 ChaGPT;京东上线独立外卖 App;贝佐斯出任 AI 初创公司 CEO
  • 抱歉了GPT-5,这次是中国AI「上岸」了
  • 你急它不急:GPT-5先判断,再决定「速答」还是「深想」
  • Meta开始用KPI考核,强迫所有员工尽可能多使用AI
  • 接招吧,GPT-5.1!
  • 「前三代定律」下,百年吸尘器如何做出新意?
  • 两个月破 300 万用户,Agnes AI 刷新 Instagram 与 Snapchat 增长纪录
  • 每天给白领发 1000 万,他成了硅谷最年轻亿万富翁
  • 2025,中国科技圈进入全面「大乱斗」时代
  • 当 AI 开始分「左右」
  • 阿里云,用全栈 AI 刷新第十七个双十一
  • AAAI 2026 Oral MiniShift+Simple3D:面向高分辨率3D异常检测的可扩展数据集与实时检测新范式
  • AAAI 2026 山大提出DiveSeg:为DINO注入“水下感知力”,实例分割性能提升显著
  • 双重隐式记忆来了!JanusVLN让视觉语言导航真正理解3D空间
  • 让千问APP当一周科研打工人:它比我想的能干,也比我想的累
  • 雷军连发多条微博回应质疑;iPhone 发布方式将在明年重大变革;年度最令人不安的研究:AI 刷多社媒会变蠢|极客早知道
  • 图灵奖得主LeCun最后警告Meta!我搞了40年AI,大模型是死路
  • AI又封神了!华人新作直出憨豆+《猫和老鼠》,平行宇宙对上戏了
  • AI「逼宫」库克?苹果秘密计划曝光,接班人竟是M芯片之父!
  • 年度最强AI压轴!谷歌Gemini 3.0下周决战OpenAI,前端要下岗了
  • 安谋科技发了一枚 NPU,要把 AIGC 算力提升 10 倍
  • ICLR 2026吃瓜现场:有人用LLM连投4版论文,竟然拿到两个8分?
  • 无人工标注、可持续扩展:AcademicEval推动长文本评测进入“自更新”阶段
  • 宇树完成上市辅导,拟境内IPO;传索尼开发Labubu电影;2699元!原道X小岛秀夫耳机限量发售

AI半天顶博士6个月,奥特曼太激动!生化圈巨震



  新智元报道  

编辑:KingHZ
【新智元导读】奥特曼激动转发!这将是AI最深刻的影响,预示科学从稀缺走向丰饶的时代即将来临。

让OpenAI奥特曼激动的AI成就!

「AI科学家」Kosmos带来了7项发现:

独立复现了神经科学、材料科学、生物学等领域3大发现,


还在遗传流行病学、多组学整合分析、阿尔茨海默症和转录组学上取得了4项原创发现。

OpenAI的奥特曼激动表示:「我预计大家会看到越来越多类似的事情,而这将成AI最重要影响之一。祝贺Future House团队!」

原来这项突破背后靠的OpenAI——

Future House董事兼首席执行官Sam Rodriques在推文评论:

这一切之所以成为可能,很大程度上要归功于OpenAI员工所做的出色工作。


持之以恒,接下来的几年注定精彩纷呈。

他还推销了Kosmos体验平台。

奥特曼送上祝贺的「未来之家」(Future House)什么来头?到底做什么了让奥特曼感到兴奋?

可以保证,这次奥特曼绝对没有「眩晕到瘫坐」。但毫无疑问,这让他真正看到了「AI正在加速科学」的ASI曙光!

全球首个AI科学家天团
为AI加速科学而生

前沿科学,正在从「稀缺」转向「丰饶」人类的知识正以指数级速度激增,但人的大脑容量却止步不前。

于是,新的发现被错过,潜在的联系无人察觉。

要推动科学进步,人类亟需一种能与数据量齐头并进、能够在整个人类知识记录中推理的智能体。

2023年,非营利组织FutureHouse成立,目标是打造一位能够加速创新的AI科学家。

「未来之家」的使命很简单:为每一位科研人员配备一位AI科学家,让跨领域的发现加速发生。

「未来之家」堪称全球第一AI科学家天团,可以007不断查资料,验证生化环材等科学领域的博士级想法是否靠谱;在2.5个月内,此平台找到了治盲新药,让医学圈震撼。

本月初,FutureHouse的商业分支——爱迪生(Edison),现正将这项技术推向全球。

FutureHouse继续致力于推动基础生物学研究和教育普及


而Edison(爱迪生)则将AI科学家技术扩展到全球的研究人员和各行各业中

Edison由来自物理、生物、化学和人工智能等领域顶尖机构的科学家与工程师共同打造。

Edison将继续秉持FutureHouse的理念,为科研社区提供丰厚的免费服务,同时也为需要更高请求速率或额外功能的深度用户提供更多付费选项。

结构化世界模型
一次可读1500篇论文

Kosmos是继FutureHouse的上一代 AI科学家Robin之后的一次重大升级。

首先,Kosmos与许多AI工具完全不同。它不是聊天机器人,更像是一款「深度科研工具」:需要一定的学习和调试时间,尤其在提示词的设计上

Edison团队强调,Kosmos并非闲聊式的「娱乐」工具,而是类似「试剂盒」的科研工具,适合用于真正高价值的研究任务。

所以,Kosmos的定价相当高,但学术用户可享免费额度

作为下一代的AI科学家,Kosmos的核心突破,在于引入了结构化世界模型

它能高效整合数百条智能体轨迹中提取的信息,在千万级token级别的文本中保持研究目标的一致性与连贯性。

此前诸如Robin等AI科学家,难以处理和整合大规模信息。受限于大语言模型的上下文长度,AI科学家在推理路径上「走不了多远」,难以完成复杂发现。

而一次完整的Kosmos 运行,能够阅读1500篇论文,执行42,000行分析代码,其能力远超我们已知的任何智能体。

正因如此,Kosmos相比上一代的Robin具备了更强大的分析能力。

据Beta测试用户反馈,Kosmos能在一天之内完成原本需要六个月才能完成的科研工作,而且结论的准确率高达 79.4%。

这个「六个月」的等效时长最初让人吃惊!

虽然Kosmos通常能生成相当于数月人力的科研成果,但它有时也会误入歧途——比如钻进一些统计显著但科学意义不大的方向。因此,把同一个研究目标运行多次 Kosmos,可以探索它可能采取的不同路径。

比OpenAI还早的科研AI实习生?

在Kosmos的开发过程中,最让人惊讶是:完整运行一次Kosmos,相当于博士生或博士后研究约六个月的工作量

更有意思的是,开发团队发现这一「人类等效时间」随着运行深度线性增长。

这也成为目前首个与「科研任务复杂度」有关的推理时间scaling law

起初,开发团队自己对这个结果也半信半疑,因此专门做了验证——

他们邀请Beta测试用户提供研究目标,并代为运行Kosmos。然后将结果发回给测试用户,并请他们估算:如果不借助 Kosmos,自己完成这一发现大约需要多长时间?

7位科学家的反馈中,20步深度的Kosmos运行平均等效为6.14个月的研究工时

他们对浅层运行也进行了同样的评估,并使用盲测手法进行控制,最终得出了技术报告中展示的那条scaling law曲线。

尽管「人类节省时间」的估算本身存在主观性,开发团队仍认为Kosmos所完成的工作包,确实可以等同于科学家数月的研究时间,原因主要有两点:

一是「独立复现」的客观对照验证。

在技术报告中,他们展示了Kosmos所做出的三项发现,实际上早已被人类科学家独立完成过,但在运行 Kosmos 时:

  • 有两项仍未发表,

  • 另一项虽已发布,但发布时间晚于Kosmos模型的训练数据截止日期,

  • 他们还确保Kosmos无法访问这些文献或任何引用它们的研究。

即便如此,Kosmos依然在一次运行中成功复现了这些核心发现,而根据这些研究原作者的记录,人类完成这些发现通常需耗时几个月

当然,这一时间也存在不确定性(比如研究人员是否100%投入于该项目),但相较于基于主观问卷的「用户反馈法」,这种「已有成果对照法」显然更具客观性,进一步支持Kosmos工作成果的时间价值确实达到了「数月级」。

二是「计算工时」的独立估算模型。

他们还构建了一个更为量化的评估模型:假设科学家平均阅读一篇论文需时15分钟,执行一次完整的数据分析路径约耗时2小时(该假设与METR对当前 AI 智能体在软件工程任务中的时长估算一致)。

据此统计,Kosmos在一次平均运行中所阅读的论文数量与分析路径总和,换算为人类科研时间约为4.1个月(按每周40小时工作制计算)。

在OpenAI宣布「千亿美元股改」直播中,奥特曼直言OpenAI的「科学家愿景」:

到2026年9月,打造一位实习级别的研究助理AI;


到2028年,实现一位全自动的「真正AI科学家」。

如果现在Kosmos的自动研究就达到了「月级别时长」,是否是OpenAI的「实习级别的研究助理AI」?

如果Kosmos已经做到了,OpenAI当初2026年的目标,还有什么难度吗?

这也难怪奥特曼发推表示激动。

而且在技术报告中,Kosmos已经可以在生物、化学、材料科学等学科中发现新结果。

Kosmos报告中的所有结论均配有明确出处——要么引用原始文献,要么标明生成该结论的代码位置,确保整个推理链条完全可溯源。

经独立科学家验证,Kosmos报告中有79.4%的陈述是准确的

7大新发现
拯救生化环材博士生!

技术报告详细列出了Kosmos做出的七项科研发现。

其中有三项,是对人类科学家此前成果的独立复现

第一项发现:Kosmos利用代谢组学数据,复现了一篇尚未发表手稿中的核心结论——在低温条件下,小鼠大脑中核苷酸代谢是变化最显著的通路

关键是,在Kosmos完成运行之后,这项研究的预印本才在BioRxiv发布。也就是说,AI和人类几乎同时独立发现了相同的结果。

第二项发现:Kosmos成功复现了一篇预印本中的关键观点,而这篇预印本的发布时间晚于其所用大语言模型(LLM)的训练数据截止日期,且Kosmos在运行时并未访问该文献。

这一发现出自材料科学领域,表明Kosmos 具备跨学科研究能力。

具体来说,Kosmos再现了这样一个结论:在热退火过程中,绝对湿度是决定钙钛矿太阳能电池效率的主导因素,并指出关键阈值为约60g/m³——一旦湿度超过这一值,器件将彻底失效。

第三项发现:Kosmos与Piazza等人研究报告中得出的结论一致——跨物种的神经元连接模式可由一套通用数学规则描述

预印本链接:https://www.biorxiv.org/content/10.1101/2025.02.27.640551v1

需要说明的是,虽然Kosmos运行时未访问该研究,但该文预印本发布时间早于其所使用模型的训练数据截止日期,无法完全排除其可能在训练中接触过。

除了上述「复现性发现」,Kosmos还独立作出四项原创的科学贡献

第四项发现:Kosmos结合公开的GWAS(全基因组关联分析)与pQTL(蛋白质数量性状位点)数据,进行孟德尔随机化分析,提供了统计学证据支持以下结论:血液中超氧化物歧化酶2(SOD2)浓度升高可能因果性地降低心肌 T1时间,并减少心肌纤维化风险

尽管该机制在小鼠中已有研究,但这一发现进一步证实了其在人类中的潜在意义。

第五项发现:Kosmos基于多组学和统计遗传学公开数据,提出了一个全新的分子机制解释某一单核苷酸多态性(SNP)如何可能降低2型糖尿病的患病风险。

第六项发现:Kosmos创新性地设计了一种新型分析方法利用阿尔茨海默病(AD)患者的蛋白质组数据,推演出导致神经元中Tau蛋白积聚的分子事件序列

第七项发现,具备明确的临床相关性

在「衰老过程中神经元易损性」这一开放性课题中,Kosmos对年轻与年老小鼠的单细胞核转录组数据进行了大规模、无偏探索,发现内嗅皮层神经元(AD中最早出现Tau蛋白积累的区域)随年龄增长,其flippase(翻转酶)基因表达水平显著下降

该下降可能导致磷脂酰丝氨酸暴露于细胞膜表面,向小胶质细胞释放「吃掉我」的信号,从而诱发免疫吞噬反应,导致神经元退化

更关键的是,在另一组人类AD患者的单细胞RNA测序数据中验证了这一发现。在Braak病理阶段II的样本中,内嗅皮层上颗粒层神经元中的flippase表达量明显低于Braak 0阶段(即尚未出现病理变化的阶段),与Tau病变首次出现的时间点完全吻合。

从独立复现到原创发现,Kosmos标志着AI科研能力进入可验证、可复用的新阶段。

自动化科学正在形成,科研模式正迎来结构性变化。

参考资料:
https://edisonscientific.com/articles/announcing-kosmos


<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652647927&amp;idx=3&amp;sn=47f95ddd7ba96d56c640c6b9bf01fdde&amp;chksm=f0a05ba0816ace307cf1d06d7cfe148358728a1d861ef9a05445cee4342cbf971593a7b5d1c5&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/SRz5vYEbgH&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们