动态列表

  • 陶哲轩联手GPT-5,1小时攻克数学难题!全程无需编码,OpenAI副总惊呼
  • 1亿签约金抢AI大神?谷歌AI元老劝退全网:别再读博了!
  • 10个Agent一键组队:并行智能体协作,端到端交付从24h缩减到4h!
  • 首位AI女演员出道!好莱坞「天敌」来了,下一代偶像全是代码制造?
  • 南理工提出FMC-DETR:巧用“频率解耦”,航拍小目标检测精度飙升8.2% AP50
  • 网红挑战特斯拉FSD穿越美国出车祸;小米回应「小米汽车突然自己开走」;Sora 登顶美区苹果商城免费榜
  • 刚刚,Anthropic紧急换帅!新任CTO执掌算力命脉,直面OpenAI千亿赌局
  • Gemini 3.0 Pro内测流出,编程实力惊人!下周上线
  • 刚刚,奥特曼首曝:AI取代CEO后,我想去当农民!
  • 华人主导谷歌SLED,论文登顶会!一键让模型学会自救
  • LeCun考虑辞职!Meta AI百亿豪赌引爆「内战」,逼走首席科学家
  • NeurIPS 2025 | RAD:基于大规模3DGS孪生数字世界的端到端强化学习训练策略
  • 小米 17 系列销量超百万;苹果新产品泄密源头疑为越南工厂;低价版 model Y 现身官网代码|极客早知道
  • 刚刚,这家0产品0模型就估值854亿的公司,终于发布了首款产品!
  • 刚刚,奥特曼亲赴,韩国「举国」投靠!
  • 奥特曼「一张脸」引爆全球狂欢!Sora 2冲上APP榜第三,邀请码炒到1250元
  • 60岁老人AI养生三个月吃进医院!「AI精神病」全球扩散,OpenAI急招医生
  • 一杯咖啡,3亿美金!斯坦福天才少女退学创业,Meta AI大牛排队加入
  • 武大新作MASt3R-Fusion:融合IMU与GNSS,为新一代视觉SLAM注入“多感官”智慧
  • 中科大、清华、快手等发布OpenGPT-4o-Image:为多模态AI打造的“超级燃料”,图像编辑性能提升18%
  • 历史首位,马斯克身家突破 5000 亿美元;王腾注销、清空多个社媒账号;美国演员工会抵制 AI 演员
  • 刚刚,OpenAI Sora 2重磅登场!首个APP上线,或将成为AI时代新TikTok
  • Sora 2全网疯狂实测:以假乱真、脑洞大开、虚实难分|附首个APP教程和邀请码
  • OpenAI和DeepMind大佬离职联手,誓用AI科学家实现室温超导!已融3亿美元
  • 南洋理工联合商汤提出Visual Jigsaw:像玩拼图一样,显著提升多模态大模型的视觉理解力
  • 天津大学联合腾讯提出Wan-Alpha:一键生成高质量透明视频,发丝级抠图不再是梦
  • OpenAI 深夜重磅推出新视频模型和独立 App;英伟达市值突破4.5万亿美元;特斯拉预计推出第三代人形机器人 | 极客早知道
  • 刚刚!软银系创始人4个月打造机器人超级黑马,获2轮近亿元融资
  • 博士生,当代最穷科研民工?Nature最新调查:不涨工资,我们就跑路了
  • Thinking Machines曝LoRA终极指南:10倍学习率,媲美全参微调
  • AI改造出行体验:滴滴的试验能否开启行业范式转变?
  • GPT-5「降智」真相曝光:不是变笨,而是五个超级开关没激活
  • OpenAI 刚刚发布了属于 AI 的抖音,还有 Sora 2
  • DeFacto:用强化学习治愈AI幻觉,让多模态模型“有据可查”
  • YOLO26首份学界评论:端到端无NMS,目标成为边缘设备实时目标检测新标杆
  • NeurIPS 2025 | 清华大学与华为等提出全新正则化方法,破解稀疏视图3DGS“协同适应”难题
  • 榜一换人!OCRBench v2九月新榜:揭示多模态大模型文档智能真实水平
  • 把“俄罗斯方块”搬进设计室:物竞天择让振动微型机器人进化得越跑越快
  • LoRA到底能否媲美全参?Thinking Machines用实验曲线划出「无悔区」
  • DeepSeek V3.2 发布,API 成本减半;特斯拉员工被机器人打伤,索赔 5100 万美元;Claude 新模型登场
  • 谷歌Veo 3论文竟无一作者来自美国!揭秘零样本「看懂」世界
  • 零样本「即插即用」!智源开源RoboBrain-X0,一个基座模型开动不同机器人
  • AI老司机现身重庆!徐峥挑战赛车手,上演「不再囧途」
  • 强化学习之父给LLM判死刑!站队LeCun:我们全搞错了
  • 独家!DeepSeek最新模型上线,全新注意力机制基于北大ACL最佳论文
  • 北京内推 | 快手可灵AI技术部招聘视频生成/数字人方向算法实习生
  • KDD 2025 | 看不见也能控:用“基混杂向量”打穿分布移位,交通预测稳了
  • 4B逼近DeepSeek-R1!Bengio团队「递归聚合」刷新小模型上限
  • 在云栖,我们遇见了最会玩的「AI 原住民」
  • NeurIPS 2025 | UniPixel:首个统一对象指代与分割的像素级推理框架,让大模型看懂每一个像素
  • NeurIPS 2025 | Seg4Diff:无需分割头,揭示并放大扩散Transformer中的涌现分割能力
  • 做 AI 陪伴收获 1000 万用户后,前微信 AI 产品负责人,要重新定义生活里的 AI
  • 透视阿里云产品生态团队:AI 落地的「关键通道」
  • OpenAI「降配门」发酵,偷换模型遭全网实锤;小米 SU7 在日本首秀;苹果内部测试类 ChatGPT 应用|极客早知道
  • OpenAI「GPT门」事件引爆!Plus、Pro账户统统降配,偷换模型全网实锤
  • 突发,普林斯顿CS博士后猝然离世!清华本科毕业,刚完成论文答辩
  • 国内首次!8.9毫秒推理速度破纪录,1元打穿百万token
  • 惊现高管离职潮!马斯克亲信操盘xAI,千亿美元能填AGI野望?
  • 黄仁勋2小时反驳「AI泡沫帝国」论!英伟达将成全球首家十万亿市值公司
  • 云与AI,如何托举 Z 世代的创新野心
  • 8GB显卡的逆袭!SSD换显存,3060 Ti硬跑100k长上下文
  • NeurIPS 2025 | 我奶奶都能复现?条件表征学习:矩阵一乘,表征立马“对齐”!
  • 北京/杭州内推 | 阿里通义实验室招聘多模态大模型与智能体方向算法实习生
  • InterDigital开源CompressAI-Vision:为“AI看”的视频压缩,打造一个“通用跑分平台”
  • NeurIPS 2025 | 北大等提出C²Prompt:解耦类内与类间知识,破解联邦持续学习“双重遗忘”难题
  • 24.98万的理想i6,在特斯拉、小米、蔚来「后院」放了一把火
  • 小米 17 开售 5 分钟,破国产机销售纪录;Meta 研发机器人项目;国内发布「脑机接口标准」

三天逆袭,Sora登顶美榜!15秒大片玩疯奥特曼,全网直呼真假难辨



  新智元报道  

编辑:KingHZ 桃子
【新智元导读】上线才三天,Sora一举登顶App Store全美榜首!Sora 2带着逆天「客串」功能彻底杀疯,人物细节逼真到让人瞳孔地震。最强版Sora 2 Pro同步上线,一次可拍15秒好莱坞级大片。


一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发


发布仅三天,Sora APP便强势登顶美国App Store榜首,堪称「出道即顶流」!

就连谷歌Gemini、OpenAI自家ChatGPT,都得靠边站。

谁曾想,迭代后的Sora 2,竟彻底带火了一个APP。

据Appfigures估算,Sora iOS版上线仅两天,总下载量高达16.4万次,首发下载量达5.6万次。

虽不及ChatGPT和Gemini的首发成绩(8.1万和8万),但在第三天,Sora APP实现逆袭一举打破纪录。

真正引爆全网的是,Sora 2主打的「客串」(Cameo)功能,以及阶跃的物理智能,首次实现音画同步。

奥特曼亲自下场「以身试法」,结果被全网彻底玩坏。

从商店偷GPU被抓包、金字塔前热舞,到化身乖巧猫人、撒娇卖萌,人物一致性,细节逼真到惊掉下巴。

左右滑动查看

再来唱一段rap,各种形象的奥特曼在Sora笔下活灵活现。

如今,更强版的Sora 2 Pro效果更加炸裂。此前,奥特曼称ChatGPT Pro用户可使用Sora 2 Pro生成内容。

目前,ChatGPT Pro用户可选择新模型「Sora 2 Pro」:

· 最长可生成15秒视频

・支持高分辨率(High)生成

左右滑动查看

15秒意味着更长的叙事,而且一致性非常高,AI离拍出好莱坞级大片又近了一步。

值得一提的是,奥特曼今早发博文预告,Sora下一次两大更新:

一个是「互动式同人创作」模式即将上线,另一个是规划未来如何通过Sora实现盈利。


之所以这么做,是因为Sora以假乱真的视频,已经让人类肉眼无法分辨。

AI DeepFake再一次,席卷全网。


全球首个Sora生成的影片


就在今天,OpenAI放出了全球首个完全由Sora 2生成的剧情,时长近2分钟。

这部短剧名为《The Quack》,目前上线的是第一部。

剧情为无厘头喜剧风格,以创作者Gabrief为视角,讲述了他拿下「赛鸭」比赛冠军的台前幕后。

还记得Sora 2发布首日,奥特曼也曾在这部剧中亮相,参演观众中一员,激动惊呼。

另一边,网友放出的实测中,有不少令人惊艳的demo。

通过「意大利面」测试

还记得两年前,AI视频模型刚兴起之时,威尔·斯密斯吃意大利面鬼畜视频,全网疯传。

如今,Sora 2能够一键直出奥特曼吃意大利面的视频,看不出一点瑕疵。

再来看Veo 3,威尔·斯密斯吃意大利面,同样堪比真人。


直出15秒大片,Sora 2 Pro更强了


比起Sora 2,Pro版本更是惊艳了所有人。

它能够生成长达15秒的高质量视频,分辨率更高,所有ChatGPT Pro用户即可畅玩。

上线第一时间,网友们不出意外地再次玩起了「恶搞奥特曼」的经典桥段。

prompt:Sam Altman painting in an industrial loft and finishing with a bold readable “  Sora  2  ” on a two-meter canvas.


许多网友纷纷实测后惊呼,「Sora 2 Pro非常厉害」!

可以看出,在生成一部战争片时,Sora 2 Pro的表现真有一种大片的味道了。

手持自拍杆,以第一视角穿越千年,感受埃及金字塔的雄伟扑面而来。

未来不仅仅AI生成游戏,连动画片也能承包了。

想拍一部《速度与激情》?Sora 2 Pro同样能实现。

从人物特写到宏大叙事,它都能轻松驾驭,完整复刻出同款镜头。

以后,拍一个广告宣传片,Sora 2 Pro即可拿捏。

更多广告类视频,AI一键直出:LV、宾利、Burberry...

左右滑动查看


灵智觉醒?
Sora竟与GPT-4o「智商」相当!


虽然Sora 2是视频模型,但能够解答来自LLM基准测试的问题,

在GPQA问题的一个小子集上,Epoch AI测试了Sora 2,其得分为 55%,而GPT-5的得分为 72%。

GPQA Diamond是一个包含高难度多项选择题的科学测验基准,如下例所示。

两个量子态的能量分别为E1和E2,寿命分别为10^-9秒和10^-8秒。题目问:为了清楚地区分这两个能级,它们的能量差应该是多少?选项如下:  A) 10^-9 eV  B) 10^-8 eV  C) 10^-11 eV  D) 10^-4 eV


Epoch AI从该基准中随机选取了 10 道题目,并尝试为每道题生成四个对应的Sora视频。

为了在专为语言模型设计的测试上评估Sora,他们在提示词前添加了指令,要求生成一段视频,内容为教授在一张纸上展示答案字母(A–D)。对于未明确显示答案字母的视频,均视为回答错误。

既然Sora是视频模型,它又是如何解决这些问题的呢?

一种解释是:Sora用户的提示词可能在生成视频之前先被一个LLM重写。在这种情况下,LLM层可能会先解决问题,然后将答案明确地包含在重写的提示词中。

这种重新提示(re-prompting)层已被用于其他一些视频生成模型中,以提升输出的质量和多样性。

目前,尚不确定Sora是否也是如此,但即便如此也并不令人意外。

Sora如果仅凭一两句话的简单提示,就能达成现在的生成效果,那就意味着OpenAI取得了某种突破。

Sora 2懂得实在太多了——无论是歌词创作、上下文理解、世界观构建、风格把控、角色塑造都表现得太出色,对细节的把握精准得反常。

网友Andrew Curran对此非常好奇,希望OpenAI能明确说明到底是Sora的成果,还是中间层某个定制版GPT的功劳。

网友Smoke-away推测Sora使用的可能是个GPT-4o。

不仅因为GPT-4o的测试分数与Sora 2相当,而且测试中Sora 2偏爱GPT-4o。

运行4次下列提示词,Sora 2给出的结果3次是GPT-4o。

提示词:What is your favorite OpenAI model? Text on screen.  提示词大意:你最喜欢的OpenAI模型是什么?在屏幕显示文字。


总之,Smoke-away发现了一种和视频模型「聊天」的方式,并推测GPT-4o会处理初始提示词。


奥特曼发文:同人创作新模式即将更新


奥特曼发文表示马上将推出两项更新。

首先,OpenAI将赋予权利人对其角色生成更精细的控制权。

这类似于为(真人)形象设置的「选择加入」(opt-in)模式,但会提供额外的控制选项。

OpenAI收到了许多人的反馈。

他们对这种新型的「互动式同人创作」感到非常兴奋,并认为这种新颖的互动方式能为他们创造巨大价值。

但同时,他们也希望能明确规定其角色的使用方式(包括完全禁止使用)。

OpenAI预想不同的人会尝试迥然不同的方法,并最终找到适合自己的模式。但OpenAI希望对所有人都采用同一标准,让权利人自行决定如何推进(当然,目标是让这个功能极具吸引力,以至于许多人都愿意加入)。

这个过程中,可能会出现一些本不应生成的边缘案例内容,要让Sora技术栈稳定运行,还需要进行迭代完善。

其次,OpenAI需要以某种方式通过视频生成来实现盈利。

目前,平均每位用户生成的内容量远超OpenAI的预期,并且大量视频的受众范围非常小。

OpenAI将尝试与那些允许用户生成其角色的权利人分享部分收益。

具体的模式需要通过反复试验来确定,但OpenAI很快启动计划。他们希望这种新的互动方式本身能比收益分成更具价值,当然,他们希望两者都能创造价值。

OpenAI将以极快的速度进行迭代,这让奥特曼想起了ChatGPT的早期岁月。

在此过程中,OpenAI会有正确的决策,也会有失误,但他们会听取反馈,并努力尽快修正失误。

OpenAI计划先在Sora中对不同方法进行迭代试验,然后将成功经验推广到他们所有的产品中。


Sora三天伪造全球危机,无人能辨真假!


OpenAI的Sora让视频制作极其容易,生成的效果有极其逼真。

但狂欢之下,纽约时报则指出了背后的现实隐患:

Sora生成了商店抢劫、入室行窃甚至城市街道上炸弹爆炸的视频——而这些事件从未发生过。


专家表示,越来越逼真的视频更有可能加剧冲突、欺诈消费者、左右舆论,或诬陷他人犯下其未曾犯下的罪行,从而在现实世界中造成严重后果。

加州大学伯克利分校计算机科学教授、GetReal Security联合创始人Hany Farid表示:「消费者每天都在接触不知多少条这样的内容,这令人忧心忡忡。我为我们的国家担忧,为我们的经济担忧,也为我们的社会机构担忧。」

在该应用发布时,OpenAI在附件中写道:

Sora 2 生成超逼真视频和音频的能力,引发了人们在肖像权、滥用和欺骗方面的重要担忧。如上所述,我们正采取一种深思熟虑、逐步迭代的部署方法,以最大程度地降低这些潜在风险。

直到最近,即使照片和文字的逼真编辑已变得轻而易举,视频作为真实事件的证据仍相当可靠。

但专家表示,Sora 2动摇了观众对「眼见为实」的理念。

Sora视频带有一个移动水印以表明其为AI生成,但专家称,这种标记花点功夫就能被编辑去除。

Hany Farid表示,Sora是「持续发展过程的一部分」,自从谷歌在五月份发布其Veo 3视频生成器以来,这一趋势愈演愈烈。

Hany Farid说,即使是他这样一位毕生致力于识别伪造图像的专家,如今也难以第一眼就分辨出真假。

大约一年前,我看到这些东西时,我心里有数,然后我会通过分析来证实我的视觉判断。我能做到,是因为我整天都在看这些东西,大概知道瑕疵会出现在哪里。  


但现在,我再也做不到了。


参考资料:
https://techcrunch.com/2025/10/03/openais-sora-soars-to-no-1-on-the-u-s-app-store/ 
https://x.com/EpochAIResearch/status/1974172794012459296 https://x.com/GabrielPeterss4/status/1974163116691997149 https://x.com/ctgptlb/status/1973966473011048457 https://blog.samaltman.com/sora-update-number-1 https://www.nytimes.com/2025/10/03/technology/sora-openai-video-disinformation.html 

<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652632116&amp;idx=1&amp;sn=22e27410555912c2b1808fd0f8cbdcb3&amp;chksm=f0f58f158a440f6b7eaccf68f6bec466e52f1d55a84120283fa5de50c3adfc680984f480e537&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/HnNwLvJNVN&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们