动态列表

  • Sora 2全网疯狂实测:以假乱真、脑洞大开、虚实难分|附首个APP教程和邀请码
  • OpenAI和DeepMind大佬离职联手,誓用AI科学家实现室温超导!已融3亿美元
  • 南洋理工联合商汤提出Visual Jigsaw:像玩拼图一样,显著提升多模态大模型的视觉理解力
  • 天津大学联合腾讯提出Wan-Alpha:一键生成高质量透明视频,发丝级抠图不再是梦
  • OpenAI 深夜重磅推出新视频模型和独立 App;英伟达市值突破4.5万亿美元;特斯拉预计推出第三代人形机器人 | 极客早知道
  • 刚刚!软银系创始人4个月打造机器人超级黑马,获2轮近亿元融资
  • 博士生,当代最穷科研民工?Nature最新调查:不涨工资,我们就跑路了
  • Thinking Machines曝LoRA终极指南:10倍学习率,媲美全参微调
  • AI改造出行体验:滴滴的试验能否开启行业范式转变?
  • GPT-5「降智」真相曝光:不是变笨,而是五个超级开关没激活
  • OpenAI 刚刚发布了属于 AI 的抖音,还有 Sora 2
  • DeFacto:用强化学习治愈AI幻觉,让多模态模型“有据可查”
  • YOLO26首份学界评论:端到端无NMS,目标成为边缘设备实时目标检测新标杆
  • NeurIPS 2025 | 清华大学与华为等提出全新正则化方法,破解稀疏视图3DGS“协同适应”难题
  • 把“俄罗斯方块”搬进设计室:物竞天择让振动微型机器人进化得越跑越快
  • LoRA到底能否媲美全参?Thinking Machines用实验曲线划出「无悔区」
  • 榜一换人!OCRBench v2九月新榜:揭示多模态大模型文档智能真实水平
  • DeepSeek V3.2 发布,API 成本减半;特斯拉员工被机器人打伤,索赔 5100 万美元;Claude 新模型登场
  • 谷歌Veo 3论文竟无一作者来自美国!揭秘零样本「看懂」世界
  • 零样本「即插即用」!智源开源RoboBrain-X0,一个基座模型开动不同机器人
  • AI老司机现身重庆!徐峥挑战赛车手,上演「不再囧途」
  • 强化学习之父给LLM判死刑!站队LeCun:我们全搞错了
  • 独家!DeepSeek最新模型上线,全新注意力机制基于北大ACL最佳论文
  • 北京内推 | 快手可灵AI技术部招聘视频生成/数字人方向算法实习生
  • KDD 2025 | 看不见也能控:用“基混杂向量”打穿分布移位,交通预测稳了
  • 4B逼近DeepSeek-R1!Bengio团队「递归聚合」刷新小模型上限
  • 在云栖,我们遇见了最会玩的「AI 原住民」
  • NeurIPS 2025 | UniPixel:首个统一对象指代与分割的像素级推理框架,让大模型看懂每一个像素
  • NeurIPS 2025 | Seg4Diff:无需分割头,揭示并放大扩散Transformer中的涌现分割能力
  • 做 AI 陪伴收获 1000 万用户后,前微信 AI 产品负责人,要重新定义生活里的 AI
  • 透视阿里云产品生态团队:AI 落地的「关键通道」
  • OpenAI「降配门」发酵,偷换模型遭全网实锤;小米 SU7 在日本首秀;苹果内部测试类 ChatGPT 应用|极客早知道
  • OpenAI「GPT门」事件引爆!Plus、Pro账户统统降配,偷换模型全网实锤
  • 突发,普林斯顿CS博士后猝然离世!清华本科毕业,刚完成论文答辩
  • 国内首次!8.9毫秒推理速度破纪录,1元打穿百万token
  • 惊现高管离职潮!马斯克亲信操盘xAI,千亿美元能填AGI野望?
  • 黄仁勋2小时反驳「AI泡沫帝国」论!英伟达将成全球首家十万亿市值公司
  • 云与AI,如何托举 Z 世代的创新野心
  • 北京/杭州内推 | 阿里通义实验室招聘多模态大模型与智能体方向算法实习生
  • NeurIPS 2025 | 我奶奶都能复现?条件表征学习:矩阵一乘,表征立马“对齐”!
  • 8GB显卡的逆袭!SSD换显存,3060 Ti硬跑100k长上下文
  • InterDigital开源CompressAI-Vision:为“AI看”的视频压缩,打造一个“通用跑分平台”
  • NeurIPS 2025 | 北大等提出C²Prompt:解耦类内与类间知识,破解联邦持续学习“双重遗忘”难题
  • 24.98万的理想i6,在特斯拉、小米、蔚来「后院」放了一把火
  • 小米 17 开售 5 分钟,破国产机销售纪录;Meta 研发机器人项目;国内发布「脑机接口标准」
  • Stability AI前CEO惊人预测:人类智力价值归零,只剩1000天!
  • 刚刚,奥特曼预言:人类「只剩」最后5年!
  • 免训练加速61倍!陈怡然团队新作DPad:仅关注「彩票token」
  • 估值840亿AI实验室再放大招,他们要给大模型戴上「紧箍咒」
  • 苹果掀桌!扔掉AlphaFold核心模块,开启蛋白折叠「生成式AI」时代
  • 自动驾驶进入大模型时代,主机厂寻找「联合创始人」
  • 复旦等揭秘机器人“大脑”安全漏洞:一张图就能让它“宕机”,攻击成功率76.2%
  • DASFAA 2025 | 湖大等提出SCRA-VQA:给LLM一份“精装修”的图像描述,无需训练提升VQA性能
  • 苹果官方旗舰店也放假,商品不发货;腾讯推「老年打车」服务;车主酒驾,智能驾驶「报警」|极客早知道
  • 刚刚,ChatGPT Pulse上线!私人秘书不再是富人特权
  • 颠覆算力格局!全球首个星座级太空AI算力服务,在中国诞生
  • OpenAI 3万亿美元测试,AI首战44个行业人类专家!
  • JHU教授揭秘学术潜规则:普通博士如何打破鄙视链翻盘?
  • Hinton预言错了!年薪狂飙52万美元,AI没有「干掉」放射科医生
  • 168 元一年的「小红卡」,是小红书打破本地生活红海的钥匙
  • 当 5 亿玩家涌入 AI 的 3D 新世界
  • 128k死穴被击穿!Amazon爆改长上下文:段内压缩快4×,推理不掉点还更准
  • 普林斯顿陈丹琦组新作:RLHF难支撑,RLVR有边界?RLMT开辟第三条路
  • 博士申请 | 香港中文大学(深圳)冀晓强老师课题组招收人工智能全奖博士/硕士
  • AI 到底会不会做生意?1688 的答案让人惊喜
  • 找人不求人?Lessie 让「人脉玄学」变成算法游戏|AI 上新
  • 斯坦福推出VisualMimic:让机器人“眼观六路”,零样本完成复杂任务
  • 浙大发布RS3DBench:让遥感AI看懂3D世界,首个像素级对齐的大规模基准来了!
  • 小米 17 系列发布,4499 起;追觅「库里南」图片曝光;YU7 Max 成「百万最速」车
  • 刚刚,LeCun团队开源首款代码世界模型!能像程序员一样思考的LLM来了
  • AI正在偷走白领工作!OpenAI狂砸10亿教AI上班,你的完美继任者即将上岗
  • Sora 2瑟瑟发抖!通义万相2.5放大招:一句话出1080P电影,音画精准同步
  • 信息熵之后,清华提出状态熵!量化分析「系统智能性」的全新视角
  • 突发!Meta刚从OpenAI挖走了清华校友宋飏
  • KV缓存不再爆!清华姚期智团队重写注意力维度,长上下文更省更强 | NeurIPS 2025 Spotlight
  • 北京内推 | 中科院软件所数据科学研究中心招聘大语言模型算法实习生
  • 78条打穿1万条!上交大新范式告诉你:智能体训练靠“质”,不是靠“量”
  • 三款骁龙芯片曝光,高通谷歌联手打造「安卓 PC」时代
  • Instagram 月活破 30 亿,靠“短视频”和“私信”;2027款iPhone曝光;女子用ChatGPT选号中百万大奖,全部捐出

刚刚,OpenAI Sora 2重磅登场!首个APP上线,或将成为AI时代新TikTok



  新智元报道  

编辑:艾伦 桃子
【新智元导读】凌晨1点,OpenAI突然扔出Sora 2核弹,AI视频迎来「GPT-3.5时刻」!一大批惊艳Demo放出,物理智能提升一大截,首次实现音画同步,人物一致性、可控性刷新SOTA。但最绝的还是Sora App,它的问世,或将彻底重塑短视频社交媒体的交互逻辑与社区互动方式。


一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发

实属没想到,Sora 2深夜炸场!

刚刚,OpenAI直播正式官宣新一代AI视频模型——Sora 2,正面狙击谷歌Veo 3。

它在物理准确性、逼真度上,一举刷新SOTA,并在一致性、可控性上实现了巨大飞跃。

值得一提的是,Sora 2首次实现「音画同步」。

奥特曼发长文激动地表示,「创意领域的ChatGPT时刻来临」!

人类创造力即将迎来一次寒武纪大爆发,随之而来的艺术和娱乐质量,也将大幅提升。


突然间,创作天地变得无比开阔,令人印象非常深刻。

他还特意强调了一个创意玩法——把自己和朋友们放进视频里,效果好玩到炸!

这不,奥特曼拿着大话筒,直呼「10am PT.开启直播」。

而且,他还和Sora团队负责人Bill Peebles用Sora 2,直接拍了一部官宣2分钟视频,效果极其震撼。

令人意外的是,人物角色的一致性非常高,看来我们离好莱坞级大片不远了。

正如爆料所言,Sora首个App正式解禁,在iOS端可直接下载。安卓用户,需通过sora.com访问。

Sora 2出世,视频GPT-3.5时刻来临

说到AI视频生成,过去总有种「梦里啥都有」的感觉——篮球瞬移进筐、人物刚刚还在左边,下一帧就冒出来个分身。

技术进步快没错,但「假」也总是藏不住。

直到Sora 2推出,第一次让人觉得,AI终于开始尊重物理和常识,生成世界不再是「随便编编」,而是真能照进现实。

2024年2月,Sora首次放出,堪称视频界的「GPT-1时刻」!这是首次,让所有人看到视频生成真的可用了。

过去半年,OpenAI团队死磕「如何让模型真正学会模拟实际运行」这个关键,如今终于取得重大突破。

基于海量视频数据的预训练和后训练技术,Sora 2的高光时刻降临。

正如官博所言,Sora 2开启了「视频领域的GPT-3.5 时刻」!

接下来,具体看看Sora 2历经一年多,究竟取得了哪些重大突破?

AI穿帮,终于被揪出来了

最让人感慨的,是Sora 2在物理细节上的进化。

别小看这个点,比如你让它生成人投篮,旧模型为了「满足」指令,球会强行飞进篮筐(哪怕角度完全不合理);

现在的Sora 2,球打板弹开、甚至投丢都成常态,动作有惯性、受力和材质都说得通。

头顶一只猫咪并完成三周半跳?奥运冠军能否做到尚未可知,但Sora认为完全不在话下。

Prompt: figure skater performs a triple axle with a cat on her head

被业界封为「AI体操界的图灵测试」,Sora 2一次性就通过了。

Prompt: a gymnast flips on a balance beam. cinematic

就连这种不符合逻辑的奇葩操作:一名男子骑在一匹马背上,而这匹马又骑在另一匹马背上,Sora 2也能以意想不到方式完成。

Prompt: a man rides a horse which is on another horse

桨板上的后空翻也不是P上去的,而是力学能自洽地演绎。

Prompt: a man does a backflip on a paddleboard

你甚至能感受到角色的失误、尝试、挣扎,而不是一味「全都对」。

有点像在看小型纪录片——会成功,但也会失败。

Prompt: Title — Lanterns Above, Distance Between (10.0s, Live Action Black & White Festival Night)

Sora 2还能生成各类复杂环境声,效果十分惊艳,几乎听不出AI生成的痕迹。

Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time

「世界模拟器」这词,终于有点底气了。

多镜头、多风格,连贯成片不是梦

以前你让AI连续生成几个镜头,角色的衣服总莫名其妙换了、光线乱飘、道具没了。

Sora 2这次特别强调「世界状态」连续性——哪怕你让角色从厨房走到阳台,镜头切换时阳光、服饰、甚至地上洒的水都能一气呵成,不再穿帮。

你还可以像导演一样指定每个镜头的顺序、节奏、景别变化,把握故事节奏。

风格上,它已经能写实、能做电影质感;

Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)

甚至连日漫那种「超现实高燃」也能做得行云流水。

比如生成一场刀光剑影的动漫打斗,每一帧都能让二次元粉感叹「这比PPT流畅多了」。

还有曾经爆火全网的吉卜力风格,Sora 2在生成效果上也能拿捏。

Prompt: in the style of a studio ghibli anime, a boy and his dog run up a grassy scenic mountain with gorgeous clouds, overlooking a village in the distant background

而且音频直接跟上,不仅对白和口型对齐,连环境音、动作声效都随场景变化,给人一种「拿来即用」的感觉,省去后期剪辑音频的繁琐。

就比如,一位年长的教授可以英语无缝切换德语讲话。

Prompt: old professor talks in english then german

更多Sora 2官方惊艳Demo一览:

左右滑动查看


新玩法:Sora App 让你「投影」自己进故事

除了模型本身,这次最让人感到「时代变了」的,是全新iOS 社交App——Sora。

打开App,只需要录一小段带声音的视频,系统验证身份和采集形象后,你或朋友,马上就能把你的样子和声音准确「扔进」任意生成场景:

可以让自己出现在巴黎铁塔前开派对、和熊猫打乒乓,甚至和马斯克同框唱歌(当然,公众人物暂时不支持哈)。

Sora 2可以直出一只鸵鸟叼走男子的帽子,在农场里奔跑的视频,效果非常自然,让人辨别不出这是AI生成的。

Prompt: an ostrich steals dads hat and dad chases after it

更令人惊喜的是,在Sora 2中还能赋予一个人「超能力」——飞起来,一个Prompt就可实现。

这个功能还用于Sora App,带来了一种全新的社交互动方式。

Prompt: Add @kendra except she can actually fly

「狗超人」拯救人类的剧情,在Sora 2中上演了。

Prompt: @rocket is a superpowered superhero dog, flying through the sky and saving new york city

还有更多的惊艳Demo,以第一视角带你畅玩。

左右滑动查看

这个「Cameo」功能用一次就停不下来,很多OpenAI内测员工说靠它结识了新朋友,AI不止能生成内容,还能创造社交纽带。

Sora的分发逻辑也颇有趣:推荐更偏向于「有二创价值」的视频,而不是单纯让你无脑刷时长。

你可以用自然语言告诉系统想看什么类型、什么风格、哪种故事,算法会主动调整推荐。

起步是邀请制,先在美加上线,后续很快扩展。

拿到邀请码还能上sora.com网页体验,高质量Pro版则专属ChatGPT Pro用户。

历史作品不会丢,API也在路上。

全网实测震撼

提前拿到内测资格的开发者,已经放出诸多Sora 2的震撼demo。

@Miguel | AP直言,Sora是自己见过第一个,可以把动漫效果做到很到位的AI视频模型。

再来看Sora 2极致运镜效果,从近拉到远,完全没有违和感。

还有人体验后惊艳地表示,我非常确定我们已进入一个社交媒体新时代!

漫雪纷飞中,一对情侣在跳舞。

还有OpenAI研究员@gabriel,也在第一时间公开了一些「奥特曼参演剧情」的demo。

奥特曼本尊,正窃取用于Sora推理的GPU。

安全与治理:不是喊口号,是真上心

能力强了,风险也大了。

Sora 2在每一个环节都布下「安全网」:

  • 三层审核:文本提示、上传素材、视频逐帧、自动生成的场景描述和音频转写,全流程分层分类拦截。有些内容在输入就会被拦,有的生成完还要二次封堵,尤其未成年场景严上加严。

  • 肖像权与公众人物保护:刚上线时,禁止用别人的视频做「换脸」,不支持生成公众人物。只有你自己验证授权后,别人才可以用你的形象做视频,所有涉及你形象的作品你都能查到、撤回。

  • 青少年守护:青少年账号内容和Cameo权限都有限制,家长可以通过ChatGPT平台控制推荐、管理私信甚至关掉个性化推荐。

  • 可追溯性:视频下载会带动态水印,所有内容都嵌入行业标准元数据。官方还开发了检测工具,方便未来判断「是不是AI造的」。

  • 压力测试:在成人内容、极端主义、自伤、暴力、误导性政治等维度,都有专门评测和红队攻防。对违规拦截率、误杀率的数据都透明公布,核心指标大多在95-99%区间。

核心团队介绍

在Sora 2官博最后,OpenAI放出了所有参与的成员名单,阵容超豪华。

上下滑动查看

在这份「电影谢幕工作人员表」中,OpenAI的几乎所有员工都被拉出来谢幕。

而为我们带来这场如梦如幻的电影的「总导演」,也就是Sora负责人Bill Peebles。

他是一名95后,本科毕业于MIT计算机专业,后于加州伯克利取得计算机博士学位。

他曾先后在英伟达、Adobe、Meta的AI岗实习,博士毕业后直接加入了OpenAI,工作的最大业绩是Created Sora(创造出了Sora)。

字越少事越大,言简意赅。

下一步:从玩内容到「世界模拟」

OpenAI说,Sora 2不会是终点。

OpenAI坦言它还会犯错,但路线已经明朗:继续用更多、更高质量的视频数据喂养模型,世界模拟的准确性和细节感会越逼真。

这个进化带来的不仅仅是让你玩得爽,更会影响影视广告、动画分镜、教育科普、产品演示,甚至是未来AI机器人「在现实世界里学本事」。

当然,这也意味着欺诈、非自愿肖像、青少年保护等问题会更加突出,需要靠技术、产品、社区和政策一起盯着。

你想把自己「丢」进哪个世界?

Sora 2这一波,是真正把视频生成从「像不像」推向「合不合理」,物理逻辑、镜头控制、音画同步、可玩性和安全性全线升级;

Cameo则把创作从「看别人」变成「玩自己」,让每个人都能成为主角。

不妨现在就想想:如果有30秒,让你出现在任何场景,你最想玩点啥?

是和偶像穿越打怪,还是带宠物环游地球,或者干脆做自己的动漫主角?

欢迎在评论区留言告诉我们你的第一条Sora 2创意。

下一个出圈的爆款视频,也许就来自你手里的Sora。

参考资料:
https://openai.com/index/sora-2/
https://openai.com/index/sora-2-system-card/
https://cdn.openai.com/pdf/50d5973c-c4ff-4c2d-986f-c72b5d0ff069/sora_2_system_card.pdf
https://www.youtube.com/watch?v=gzneGhpXwjU

<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652631458&amp;idx=1&amp;sn=3a67df2af1ea2b661fd3c99a6ff51369&amp;chksm=f00263ec949e95776205f4d0d97277f117908eeb4f1555c800505e6ed4698e155af33c8be008&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/gpy9Kp4GHN&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们