动态列表

  • 一觉醒来,GitHub没了?CEO辞职,微软接管,开发者天塌了
  • AI全国榜单爆冷,全网吃瓜大狂欢!这家黑马竟靠DeepSeek杀进全国TOP 2
  • 物理学「AlphaGo时刻」?40年未竟之事被AI一举攻破,顶尖物理学家集体傻眼
  • 刚刚,商汤内部两万字复盘曝光:多模态通往AGI核心路线首次公开
  • 让强化学习快如闪电:FlashRL一条命令实现极速Rollout,已全部开源
  • 从物竞天择到智能进化,首篇自进化智能体综述的ASI之路
  • 破解效率与成本难题:华为UCM技术推动AI推理体验升级
  • SIGGRAPH上,英伟达发布物理AI开源新技术,更新RTX Pro产品线
  • 身家25亿刀,是四家公司创始人,这位伯克利教授还在给本科生上课
  • 商汤王晓刚:世界模型将加快AI从数字空间进入物理世界,「悟能」想做那个桥梁
  • AI全面挖掘微蛋白价值:首次引入合成负样本训练,剔除92%噪声,摆脱保守依赖
  • 是「福尔摩斯」,也是「列文虎克」,智谱把OpenAI藏着掖着的视觉推理能力开源了
  • 东方理工·甬江论坛|新大学、新使命,邀你共启未来
  • LLM总是把简单任务复杂化,Karpathy无语:有些任务无需那么多思考
  • ICCV 2025 | 小红书AIGC团队提出图像和视频换脸新算法DynamicFace
  • 聚焦前沿,见证未来!「X·创新』产品SHOW圆满举办!
  • 刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌
  • Lumina-mGPT 2.0:自回归模型华丽复兴,媲美顶尖扩散模型
  • 雷军:小米YU7改名,被误会是丐版;传淘宝闪购周末峰值超美团;低价 MacBook 或年底亮相,599 美元
  • OpenAI开源霸权5天终结,百川M2一战夺冠!实测比GPT更懂中国医疗
  • 硅谷精英放弃生娃!MIT女记者揭秘:人类只是AI垫脚石,世界很快就毁灭
  • 41个榜单SOTA!智谱最新开源GLM-4.5V实测:看图猜地址、视频秒变代码
  • 2025全球大模型应用报告:红海混战「忠诚度」瓦解,用户脚踏4.7条船!
  • 昆仑万维发布新模型 SkyReels-A3,开启五天技术发布周
  • 世界机器人大会:笨拙的今天,与狂奔的明天
  • 「一只手有几根手指」,你的GPT-5答对了吗?
  • 4D空间智能:AI如何一步步「看懂」时空结构?一篇综述解析通往四维世界的五大层次
  • 智谱终于发布GLM-4.5技术报告,从预训练到后训练,细节大公开
  • 从捍卫者到引路人,上交&上海AI Lab提出LEGION:不仅是AI图像伪造克星,还能反哺生成模型进化?
  • ICCV 2025 | 机器人自主探索未知复杂空间?GLEAM破解主动探索建图的泛化难题
  • 脑子比不过AI,手也要沦陷了?这只灵巧手看得我有点慌
  • 第二届 “兴智杯” 全国人工智能创新应用大赛专题活动明天开启,技术解析 + 资源对接一站式平台重磅来袭!
  • 机器人上下文协议首次开源:阿里达摩院一口气放出具身智能「三大件」
  • Attention Sink产生的起点?清华&美团首次揭秘MoE LLM中的超级专家机制
  • 具身智能技术与应用论坛圆满举行,北京人形公布多项创新成果
  • ACL 2025 | 湖南大学、腾讯生命科学实验室等提出蛋白互作预测新方法,让LLM学会解读蛋白质网络
  • 宇树、银河通用都在用:英伟达「物理AI」技术亮相世界机器人大会
  • 毒液抗菌搭配深度学习,千万级数据组中筛得386条备选,91.4%体外验证成功
  • 马斯克:可能失去特斯拉控制权;何小鹏:听雷军劝,全新 P7 做 24 小时耐力测试;传华为将发 AI 推理突破成果
  • OpenAI惊人自曝:GPT-5真「降智」了!但重现「神之一手」,剑指代码王座
  • AI正在掏空大脑,思想沦为残废!未来只分AI的「主人」和「奴隶」
  • 突破40年Dijkstra算法瓶颈,清华教授等颠覆教科书!斩获STOC最佳论文
  • 小红书为什么要做“漫展”?
  • 腾讯张正友:具身智能必须回答的三个「真问题」
  • token危机解决?扩散模型数据潜力3倍于自回归,重训480次性能仍攀升
  • 联合理解生成的关键拼图?腾讯发布X-Omini:强化学习让离散自回归生成方法重焕生机,轻松渲染长文本图像
  • 40年后,Dijkstra算法极限再被突破,清华段然团队更快最短路径算法摘STOC最佳论文
  • GPT-5 发布后遭用户吐槽,GPT-4o 重新上线;苹果创五年多来最大单周涨幅;暑期档电影总票房破 80 亿元:《南京照相馆》超 20 亿|极客早知道
  • AI「解码」古罗马,重现千年铭文真相!DeepMind新模型再登Nature
  • Gemini再揽金牌,力压大学学霸,AI数学推理时代来了!
  • 内幕曝光:OpenAI模型坦承不会第六题,3人俩月拿下IMO金牌!
  • 实测GPT-5 Pro:别被普通版骗了!Pro才是OpenAI真正的顶级模型
  • GPT-5问题太多,奥特曼带团回应一切,图表弄错是因「太累了」
  • ARPO:智能体强化策略优化,让Agent在关键时刻多探索一步
  • ICCV 2025 | 新型后门攻击直指Scaffold联邦学习,NTU联手0G Labs揭示中心化训练安全漏洞
  • 用户痛批GPT-5,哭诉「还我GPT-4o」,奥特曼妥协了
  • 上海AI Lab、浙大EagleLab等提出RRVF:利用「验证非对称性」,只输入图片学习视觉推理
  • 银河通用亮相 2025 世界机器人大会,搭载英伟达最新 Thor 芯片,Galbot 全球首发震撼登场
  • 李想称知道哪个品牌在黑理想;比亚迪:App 将继续使用「比亚迪」原名;世界机器人大会开幕 | 极客早知道
  • 银河通用WRC首发英伟达Thor,银河太空舱世界首创城市级机器人应用
  • OpenAI o3封王,4比0横扫马斯克Grok 4!全球大模型对抗赛完美收官
  • 单机狂飙4万亿参数,国产AI「四大天王」首次合体!这台超节点鲨疯了
  • 首篇WebAgents综述:大模型赋能AI Agent,实现下一代Web自动化
  • 维他动力Vbot:当遥控器被丢掉,才是机器狗「有生命感」的第一步?
  • 挤不动的世界机器人大会上,自变量秀出了真·通用具身智能
  • 4比0横扫Grok 4,o3强势夺冠,首届大模型对抗赛结果出炉
  • 扩散LLM推理新范式:打破生成长度限制,实现动态自适应调节
  • GPT-5真的拉胯吗?机器之心一手实测,网友:还我4o、还我4.5
  • 从Debugger到Developer : 低代码时代新基准NoCode-bench,SWE-Bench作者力荐
  • 上天入地,从内而外:大疆 DJI OSMO360 深度评测
  • 「贴地飞行」:大疆 ROMO 扫地机器人首发体验
  • 「油车智障」的招牌,被奥迪一脚踢开
  • GPT-5 来了,多项能力屠榜;OpenAI 给所有员工发 150 万美金奖金;特朗普喊话英特尔 CEO:必须立即辞职
  • 刚刚,奥特曼发布GPT-5!人人免费用「博士级」智能,基准图错误遭全网吐槽
  • 北大、字节跳动联手发布SWE-Swiss:一把修复代码Bug的「瑞士军刀」,完整配方直指开源SOTA
  • 刚刚,小红书开源了首个多模态大模型dots.vlm1,性能直追SOTA!
  • 一夜颠覆Sora神话,H200单卡5秒出片!全华人团队开源AI引爆视频圈
  • OpenAI GPT-5 发布:模型能力全面「屠榜」,构建「超级智能」的第一步
  • 从能展示到能顶岗,人形机器人的「上班时刻」到了吗?
  • 行业唯一大电池旗舰性能机,iQOO Z10 Turbo+ 2199元起正式发布
  • 云计算一哥首度牵手OpenAI,大模型「选择」自由,才是终极胜利
  • 颠覆互联网的下一波浪潮:Agentic Web来了!
  • 三重激励+全周期扶持,即梦升级这个计划,让AI创作者的成长有迹可循
  • DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO
  • 硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构
  • 让AI读懂「言外之意」:AI4SG团队发布首个心理健康污名语料库,破解隐性偏见识别难题
  • 谷歌开源DeepPolisher,基因组组装错误率减半,Jeff Dean:令人振奋!
  • AI 能造世界了?谷歌 DeepMind 的 Genie 3 分秒生成《死亡搁浅》
  • 一块钱的AI,开始审判人类
  • 您猜怎么着?Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了
  • 人大高瓴-华为诺亚:大语言模型智能体记忆机制的系列研究
  • 3秒级破百+820km续航,全新小鹏P7定义智能轿跑新标准
  • 傅利叶发布全新人形机器人“Care-bot”GR-3,定义"有爱的"交互新范式
  • GPT-5 发布时间定了;宝马 i 系列汽车设计主管 Kai Langer 宣布加入小米;消息称爱奇艺拟赴港上市融资 3 亿美元
  • 鼠标的未来是手环?解码肌肉信号,Meta黑科技登上Nature
  • Claude Opus 4.1代码实测惊人!OpenAI开源模型却只会写屎山?
  • 爆冷!首届大模型争霸,Grok 4下出「神之一手」?DeepSeek、Kimi惨遭淘汰
  • 全球独家首测Genie 3,实验室细节曝光超震撼!AGI最后一块拼图已实现
  • ICML2025|探索损失加权机制的本质以实现更好的LLM反学习
  • 快270倍,精度超93%,浙大侯廷军、康玉团队等全新扩散生成模型,树立蛋白质-多肽对接新标准
  • 群核科技InteriorGS数据集登顶全球开源榜首
  • Grok 新上的 AI 视频生成,自带「擦边」模式,马斯克靠「踩黄线」称霸 AI?
  • 闹玩呢!首届大模型对抗赛,DeepSeek、Kimi第一轮被淘汰了
  • Token成本下降,订阅费却飞涨,AI公司怎么了?
  • ICCV 2025 | SeaS: 工业异常生成+正常合成+精准掩码大一统框架,指标全面碾压SOTA
  • 第十三届互联网安全大会:多智能体蜂群掀起安全与 AI 融合革命
  • 震撼,世界模型第一次超真实地模拟了真实世界:谷歌Genie 3昨晚抢了OpenAI风头
  • 就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1
  • 北大、蚂蚁三个维度解构高效隐私保护机器学习:前沿进展+发展方向
  • OpenAI重新开源!深夜连发两个推理模型,o4-mini水平,笔记本、手机可跑
  • Discrete Tokenization:多模态大模型的关键基石,首个系统化综述发布
  • 今年CJ,AI 成了游戏产业的「必答题」
  • OpenAI 完成 80 亿美元融资,估值 3000 亿;宇树发布新一代机器狗;英伟达深夜发声:不存在后门、终止开关、监控软件|极客早知道

刚刚,谷歌摊牌:Genie 3让你1秒「进入」名画,人人可造交互世界!



  新智元报道  

编辑:犀牛
【新智元导读】谷歌最新发布的Genie 3世界模型,正以惊人AI能力颠覆想象:从文本生成交互式空间,到进入经典名画如《苏格拉底之死》和《夜游者》自由探索,甚至训练3D模型实现沉浸式体验!
谷歌摊牌了,彻底不装了!

他们前几天刚刚发布的Genie 3世界模型,正在疯狂展示AI的超能力。

它不只是能从文本中生成交互式的AI空间世界,还能操控图像和视频。

比如,你现在可以进入到世界名画中去,随意的在其中移动、观察。

这种身临其境的现场感,对于喜欢艺术的同学不要太爽。

有网友就用Genie 3进入到了Jacques Louis David的名画《苏格拉底之死》。

这幅1787年的油画是新古典主义的代表作,现藏于纽约大都会艺术博物馆。

画的是苏格拉底被判喝毒芹的那一刻:他还在讲道理、伸手接杯子,学生们有人哭成一片,柏拉图则安静坐旁边。

画面干净利落、光影强烈,把「为理性而死」的硬核形象画得很震撼。

以前,我们只能在二维平面前安静地欣赏大师的杰作。

现在,有了Genie 3的帮助,我们有机会1秒钟回到两千四百多年前,目睹苏格拉底饮下毒芹。

轻轻按下按键,就能穿行其中,更加沉浸地去体会艺术、历史与哲学。

这不仅是AI的超能力,更是其存在的意义——更好地成就、提升人们!

前谷歌XR、地图团队成员Bilawal Sidhu甚至还利用Genie 3的生成,成功训练出了3D高斯溅射(Gaussian Splat)模型。

具体的过程大概是:

  • Genie 3从图像(如油画)生成可互动的动态3D世界,支持实时导航和多视角渲染。

  • 然后,进行内绘(移除UI元素)和放大处理(使用Topaz AI提升4倍超分辨率)。

  • 最后,利用这些处理后的图像训练3D高斯溅射(Gaussian Splat)模型,实现高效的辐射场渲染和沉浸式探索。

除了高斯溅射模型,Bilawal Sidhu还尝试了通过经典的摄影测量流程处理,以提取一个带纹理的3D网格,可以将其导入到任何3D工具中。

效果虽然不如高斯溅射来的优雅,不过依然可用。

最后,Bilawal Sidhu还贴心地将两个模型的链接分享了出来,让大家都可以进去体验。

相当nice👍

高斯溅射:https://superspl.at/view?id=e05e5eb7

摄影测量技术:https://sketchfab.com/3d-models/socrates-painting-genie-3-to-textured-3d-mesh-147645d6cc2c4d8c86d23a73f3215b8a

另一个震撼人心的例子是进入到Edward Hopper的《夜游者》。

这是一幅1942年完成的油画,现藏芝加哥艺术学院。

画面是深夜街角的一家餐馆:亮白灯光、玻璃窗内三位顾客与店员,外面空无一人、几乎看不见门。

它是美国现实主义的标志品,被电影、广告与摄影不断致敬,几乎成了「现代城市深夜感」的代名词。

通过Genie 3进入到画中,仿佛你自己就成了那个「夜游者」。

街道上空无一人,孤独、寒冷更加真实地扑面而来。

当然,除了进入名画之外,你还可以把它当作一个游戏来玩。

比如,像下面这种,操控一只狗狗在沙滩上奔跑。

可以随时切换视角,就是那种自由的感觉。


网友热评

网友Hasan感叹道,只需5-10年,我们每个人都会进入到自己的虚拟世界中去。

网友eter Dedene表示同意,他说「全息模拟舱」这种概念正在变成现实。

参考资料:
https://x.com/minchoi/status/1954200428482097249
https://x.com/bilawalsidhu/status/1954229425199034753


<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652618642&amp;idx=1&amp;sn=00b63f646e13a90dfefe27018b4cbbfc&amp;chksm=f048531f20d684b90f8d0afa566baddc0ce8f33be362be7903c4809ee234764db617ac0d9982&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/oE81ZzRytx&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们