动态列表

  • 210亿美元的幻觉?奥特曼投了一家核能初创
  • LeCun出局,Meta变天!Llama 4翻车大清洗,「学院派」大败退
  • 大模型上天、马斯克发射GPU?中国团队直接建「太空超算」
  • AI顶会ICLR最严新规:滥用AI的作者和审稿人,论文一律拒稿!
  • 谷歌Nano Banana Pro上线,深度结合Gemini 3,这下生成世界了
  • DeepSeek悄悄开源LPLB:用线性规划解决MoE负载不均
  • AAAI 2025 Oral | 火山引擎多媒体实验室提出VQ-Insight,AIGC视频画质理解大模型
  • OpenAI 的「群聊」,可能比你想得更重要!
  • 最大游戏up主也玩本地AI?让笔记本都能跑大模型的Parallax来了
  • 并行扩散架构突破极限,实现5分钟AI视频生成,「叫板」OpenAI与谷歌?
  • 字节张楠、张宏江、田渊栋······极客公园创新大会 2026 嘉宾阵容更新!
  • 为什么说在 AI 时代,「想象」比「记录」更费劲?
  • NEX:下一代能动性模型体系与开源生态
  • 发布即产品!SAM 3D横空出世:Meta再次颠覆3D视觉,单图即可实现高精度三维重建
  • 很强很惊艳!Meta重磅开源SAM 3:可概念提示,统一检测、分割与追踪,性能提升2倍
  • 本周六,围观学习NeurIPS 2025论文分享会,最后报名了
  • AI终于学会「读懂人心」,带飞DeepSeek R1,OpenAI o3等模型
  • 让移动不再成为噪声:搭载AI的新一代可穿戴传感实现高动态条件下的精准识别
  • SOTA集体掉线?美团AMO-Bench揭露大模型数学推理的真实段位
  • 百万步0失误!LLM首次跑通1,048,575步长任务,不崩、不偏、不掉链
  • 星动纪元获近10亿元A+轮融资!吉利资本领投,总订单额破5亿
  • 刚刚,Yann LeCun官宣离职创业,瞄准高级机器智能AMI
  • 分割一切并不够,还要3D重建一切,SAM 3D来了
  • 杨立昆宣布离开 Meta「自立门户」;荷兰暂停干预安世半导体;TikTok 将支持用户设置减少 AI 内容
  • 首个AI神作!一人分饰全角,万人围观外星人嘲讽人类灭绝
  • 申研「全拒得」的「差生」,终成PyTorch之父、Meta副总裁!今天跳槽TML
  • 图灵奖得主竟「忘了提及」中国学者成果?马库斯重锤Yann LeCun
  • 永别了,Tokenizer!何恺明师徒新作,颠覆AI生图技术
  • 年度最强AI实锤!谷歌Gemini 3全网首测震撼,一句话编码封王
  • 亚马逊云科技发布Kiro正式版:核心功能升级
  • 对话斑马口语:如何用 AI Agent 造出「超人类外教」?
  • 清华团队“密度法则”登上Nature子刊,揭示大模型高效化发展新规律
  • 点击下载!中国科研人员AI使用率全面领跑:Wiley发布全新调研报告
  • 风口浪尖中的小米汽车,创下国产新势力最快盈利速度
  • CMU新作Co-Me:无需重训,VGGT长序列迎11.3倍加速!
  • 何恺明团队再出手!将ARC视为视觉问题,ViT从零训练60.4%准确率,达到人类平均水平
  • 资深技术专家胡成文出任鼎犀智创CTO,共赴新材料智创未来
  • 如视发布空间大模型Argus1.0,支持全景图等多元输入,行业首创!
  • 登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的「数据进化」
  • NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法
  • NeurIPS 2025 | 上下文元学习实现不微调跨被试脑活动预测
  • 刚刚,PyTorch之父光速入职TML!离职Meta刚过一天,投身500亿估值独角兽
  • 何恺明重磅新作:Just image Transformers让去噪模型回归基本功
  • ConsistEdit来了:无需训练,实现高精度、高一致性的视觉编辑新范式
  • Gemini 3深夜来袭:力压GPT 5.1,大模型谷歌时代来了
  • 「30 秒造应用」——蚂蚁灵光点燃「所想即所得」的魔法时刻
  • 视频模型真在推理,还是「表演」推理?港中文等质疑:Chain-of-Frame是真的吗?
  • Gemini 3 正式发布,多榜单断崖式领先;美安全服务商网络中断,ChatGPT、X 受牵连;苹果承认酒精擦拭可能导致手机掉色|极客早知道
  • 4万亿刀,仅3.6万人!英伟达揭残酷真相:劳动正与财富大脱钩
  • 医疗AI智能体全面综述:行业爆发,年增长130%!
  • AI「看见」实验,哈佛颠覆性突破!一副AR眼镜,新手秒变资深专家
  • 震惊电影圈!好莱坞混了10年没出头,他把AI「烂片」做成23万粉爆款
  • Anthropic CEO:最快明年,一半初级白领下岗!失业率将达10%-20%
  • 谷歌 Gemini 3.0 深夜炸场:没有悬念的最强 AI
  • 夸克全面接入千问对话助手,将发布全新AI浏览器
  • MIT何恺明团队新作:让扩散模型回归“去噪”本质,简单Transformer即可实现SOTA性能
  • Yann LeCun团队新作LeJEPA:仅一个超参数、50行代码,实现可证明、可扩展的自监督学习
  • 美团多篇论文入选NeurIPS 2025:从大模型到多模态的全线突破 | 直播预告
  • JSON刚死24小时,TOON又被网友玩坏:LLM数据格式彻底乱套了
  • 阿里千问公测,挑战 ChaGPT;京东上线独立外卖 App;贝佐斯出任 AI 初创公司 CEO
  • 抱歉了GPT-5,这次是中国AI「上岸」了
  • 你急它不急:GPT-5先判断,再决定「速答」还是「深想」
  • Meta开始用KPI考核,强迫所有员工尽可能多使用AI
  • 接招吧,GPT-5.1!
  • 「前三代定律」下,百年吸尘器如何做出新意?
  • 两个月破 300 万用户,Agnes AI 刷新 Instagram 与 Snapchat 增长纪录
  • 每天给白领发 1000 万,他成了硅谷最年轻亿万富翁
  • 2025,中国科技圈进入全面「大乱斗」时代
  • 当 AI 开始分「左右」
  • 阿里云,用全栈 AI 刷新第十七个双十一
  • AAAI 2026 Oral MiniShift+Simple3D:面向高分辨率3D异常检测的可扩展数据集与实时检测新范式
  • AAAI 2026 山大提出DiveSeg:为DINO注入“水下感知力”,实例分割性能提升显著
  • 让千问APP当一周科研打工人:它比我想的能干,也比我想的累
  • 双重隐式记忆来了!JanusVLN让视觉语言导航真正理解3D空间
  • 雷军连发多条微博回应质疑;iPhone 发布方式将在明年重大变革;年度最令人不安的研究:AI 刷多社媒会变蠢|极客早知道
  • 图灵奖得主LeCun最后警告Meta!我搞了40年AI,大模型是死路
  • AI又封神了!华人新作直出憨豆+《猫和老鼠》,平行宇宙对上戏了
  • AI「逼宫」库克?苹果秘密计划曝光,接班人竟是M芯片之父!
  • 年度最强AI压轴!谷歌Gemini 3.0下周决战OpenAI,前端要下岗了
  • 安谋科技发了一枚 NPU,要把 AIGC 算力提升 10 倍
  • 无人工标注、可持续扩展:AcademicEval推动长文本评测进入“自更新”阶段
  • ICLR 2026吃瓜现场:有人用LLM连投4版论文,竟然拿到两个8分?
  • 宇树完成上市辅导,拟境内IPO;传索尼开发Labubu电影;2699元!原道X小岛秀夫耳机限量发售
  • AAAI 2026 Oral | 清华大学等提出SpatialActor:解耦空间感知,重度噪声下机器人操作鲁棒性暴涨19.4%
  • AI不懂痛苦,却成了你的深夜知己!170位医生教ChatGPT安慰人
  • 一条短信,7年恩怨!奥特曼与马斯克决裂曝出新隐情
  • 不会说英语的母亲,教出了5万亿英伟达CEO!
  • AI「牛顿」来了!北大团队新突破,看一眼数据就能推出物理定律
  • AAAI 2026 Oral | 中科院联合港大提出ARRA:外部视觉表征对齐重塑全局一致性,让自回归大模型充分释放图像生成潜能
  • 1899 元「iPhone 袜子」上架秒光;传华为 Mate80 上 20GB 内存;微信点赞苹果小程序政策
  • 全球最大开源具身大模型!中国机器人跑完马拉松后开始学思考
  • OpenAI拆开AI「黑箱」,终于可以看懂GPT在想什么了
  • LeCun在Meta的「最后一作」
  • 视觉压缩称王?谷歌死守AI黑科技,DeepSeek一夜开源
  • 大疆 OSMO Action 6 体验:完美进化,不止运动
  • iOS 为微信小程序「正名」,腾讯移动生态的新转机
  • “全模态”3D视觉基础模型OmniVGGT出炉!即插即用任意几何模态,刷新3D视觉任务SOTA,赋能VLA模型
  • WACV 2026 | PALMS+:融合深度基础模型,手机室内导航的技术再突破
  • GPT 5.1 发布了,但西方媒体准备「讲好中国故事」
  • AI、游戏双驱动,腾讯「赚麻了」
  • 对话李彦宏:Chatbot 不是一切,我在 AI 上看到了更让人兴奋的未来
  • 杭州/北京内推 | 阿里淘天算法团队招聘多模态理解方向算法实习生
  • ACL 2025 | 用图结构让RAG学会「记忆与总结」,重塑长上下文理解
  • OpenAI把Transformer训练成「几乎全零」,黑箱首次被彻底揭开
  • 传苹果从微信小程序抽成 15%,腾讯回应;特斯拉考虑支持 CarPlay;iPhone Air 成功支持实体卡 |极客早知道

图像模型今夜变天?谷歌刚刚泄露了「Nano Banana Pro」这张王牌



  新智元报道  

编辑:倾倾
【新智元导读】Nano Banana Pro要登场了?传言说,它能自己排版、搭UI,甚至一键生成整张设计稿。如果真是这样,那设计师的得力助手或许不再是PS,而是Nano Banana Pro了。

谷歌的下一张王牌,终于藏不住了!

就在刚刚,谷歌DeepMind CEO Demis Hassabis,亲手置顶了一条「预告」!

更有意思的是,这个传说中的Nano Banana Pro,昨晚就在社交媒体与开发者社区出现踪迹。

多方爆料称,它疑似采用了Gemini 3.0 Pro级的多模态推理内核,分辨率与文字渲染被明显拉高,界面生成更有「结构感」,还有传闻说首次出现系统级UI工作流的雏形。

按TestingCatalog的说法,发布时间可能在11月中下旬。

入口没开放、功能没官宣,但讨论已经把社区搅得热气腾腾。

谷歌到底在憋什么大招?

全面升级:速度、4K、清晰度一起拉满

关于Nano Banana Pro,出现频率最高的词,是「升级幅度超乎想象」。

Pro不是NB1和NB2的简单叠加,而是基于 Gemini 3.0 Pro级多模态引擎,彻底重做了图像生成逻辑。

在如此专业的支撑下,Nano Banana Pro的定位也从「创意玩具」上升到了「专业制作级工具」。

最直观的变化,是速度。

爆料者在内测版里跑过一条复杂场景,生成时间压到十几秒以内。

这种时长放在NB1时代根本无法想象,而现在它几乎能跟摄影棚级构图、产品渲染、广告光效同步输出。

画质也迎来一次真正的飞跃。

据爆料Nano Banana Pro支持高达4K的分辨率,16:9至9:16比例的尺寸,方便用户根据需求调节。

作品具备真实相机才能捕捉的质感,金属反射、皮肤纹理、光影衔接,不再是「AI风格」,而是「工作流可用级别」。

输入正确完整的prompt后,Nano Banana Pro生成的图不论是从颜色搭配,文字排版等各方面看,均达到专业水平。

Prompt: Create a wide infographic titled "How Solar Power Works" with a clean flat design. Include: a sun icon, solar panel diagram, arrows showing energy flow to a house and battery, four numbered steps with short captions, and a comparison bar chart of "Day vs Night usage".

输入以上prompt,就能得到这样一张堪称完美的「太阳能发电原理图」。

概念工作流程它也行。上传二维草图,就能渲染出超级逼真的三维产品图像,材质和光照都能表现出来。

Prompt: A clean, 3D isometric visual explainer of a "Smart Home Ecosystem." Show a cross-section of a house with icons connecting different devices: a thermostat, a smart fridge, and security cameras. Use a pastel color palette with soft lighting.

更令人惊喜的是,Nano Banana Pro支持同时上传6张图片,并且可以进行「风格迁移」。

你甚至能在上传的图片上涂鸦、圈选或添加注释,以便Gemini根据指示行动。

Prompt: A cinematic, wide-angle view of Istanbul during the golden hour. In the foreground, intricate Ottoman tile patterns on a balcony railing are in sharp focus. In the background, the Hagia Sophia and the Blue Mosque dominate the skyline across the Bosporus, silhouetted against a warm, hazy orange and purple sunset. Seagulls are flying in the distance. Photorealistic, 8k resolution.

Nano Banana Pro生成的伊斯坦布尔日落时分的全景电影画面

Nano Banana Pro的目标很明确。它不只生成图像,还要试图理解图像,力求把每一次渲染、每一处细节推进到「可用于严肃创作」的等级。

懂界面的AI:从「像UI」到「会搭界面」

很多测试者发现,Nano Banana Pro好像比以前更有逻辑、更像人了?

这不是幻觉,而是谷歌有意为之。

从目前的公开爆料来看,Pro版在UI方向的变化很一致:

界面不再是「像UI的图片」,更像是被模型按结构拆解并重新组织之后的结果。

标题区、功能区、按钮区、背景信息层,都开始呈现出合理的界面关系,而不是NB1那种风格化堆叠。

提示词:生成一张Windows 11操作系统的桌面截图,截图中已打开Google Chrome浏览器,并在浏览器窗口内展示YouTube网站上Mr. Beast的视频缩略图。

提示词:以赛马娘的东海帝皇为主角的大型游戏实机画面

底层推理更强,模型自然能把界面当成「信息结构」,而不是简单地画图。

与此同时,文字渲染也出现大幅改善。

按钮字体不再漂移、标题不再糊成块、英文字符的笔画明显更稳。

提示词:手账风格,出一个冰激凌制作步骤教程图,步骤说明要中文。

这些提升与UI生成是高度相关。如果没有更高分辨率、更稳的排版,界面就不可能看起来像真的。

Pro版本第一次让界面图呈现出一种「可作为设计参考」的质感。

它不是生成一个长得像软件的图,而是生成一个你能一眼看懂的界面。

对于任何图像模型来说,这已经不止是画风升级,而是能力层级被整体往上推了一格。

创作力爆表:插画、动漫、产品图一键到位

如果说NB1让图像生成进入了全民创作时代,那么Nano Banana Pro则更进一步:它开始进入专业领域。

在NB1时代,虽然单张图看起来不错,但复杂光效——比如逆光、棚拍布光、玻璃反射生成不稳定。

Pro的推理底层更强,使得它在渲染高动态范围光效时,更像是一个能理解场景逻辑的系统。

提示词:生成一张巨龙眼睛的特写照,写实。

尤其是在广告图里,金属质感、纹理细节、阴影衔接,都比NB1更接近真实布光。

Prompt : A professional studio product shot of a futuristic, transparent smart-watch resting on a piece of dark slate. The watch interface is glowing holographic green. Soft dramatic lighting, 8k resolution, macro photography style, shallow depth of field.

传统的NB1可以保持人物五官相似,但在不同角度、不同姿势,往往容易跑偏。

Pro则更关注「更强的角色保持与风格一致性」。在动漫、二次元、真人写实三种风格之间,人物的做工会更稳定,不再出现换角度就换人的情况。

提示词:请生成蜡笔小新和小白在《清明上河图》的一角卖大福的场景。

这对漫画分镜、角色设定、虚拟偶像创作者来说,是一种史诗级别的增强。

提示词1:这是一张动画跨界截图,画面背景是蟹堡王餐厅,瑞克和莫蒂正坐在桌旁

提示词2:海绵宝宝走了过来,来到他们的桌前。


提示词3:显然感到厌烦的瑞克,随即将一个传送门射开在了海绵宝宝的脚下。


显然,Nano Banana Pro正在逼近真正的专业创作。

从插画到动漫,再到商业级产品图,每一个方向都在悄悄被Pro 推到可用的边界上。

而这,也许才是Pro真正的含义。

如何抢先体验Nano Banana Pro?

那么,如何才能体验如此神奇的Nano Banana Pro呢?只需四步:

第一步,浏览器进入该网址:discord.gg/UuYfh5KR,加入该频道。

第二步,在频道中找到「lyra-chat」分区,输入「/new」建立一个子区。当然,你也可以加入别人建立的子区。

第三步,进行步骤1后,直接进行步骤4。

第四步,在子区中,点击Change Model切换模型,在新的对话中选择2或者3。

这样就能先人一步体验到强大的Nano Banana Pro了!

种种证据显示,Nano Banana Pro即将隆重登场。

谷歌没说一句话,但空气里已经有了山雨欲来的气息。

如果这些爆料最终成真,Pro不会是NB的常规升级,而是图像模型迈进「专业级时代」的第一步。

接下来,只能等谷歌的官宣了。

参考资料:
https://x.com/m__dehghani/status/1991174956009562583?s=20

http://zhuanlan.zhihu.com/p/1974462028769948765

https://www.geeky-gadgets.com/google-gemini-3-0-pro-leaks/?utm_source

秒追ASI
⭐点赞、转发、在看一键三连⭐
点亮星标,锁定新智元极速推送!

<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652647156&amp;idx=2&amp;sn=8a67b34ab649f0b4780ec0614f5e8526&amp;chksm=f0f7238a3031d74f32df5f223184e93432dbb814ea27a02698a8e119cc74f35c61c2025aca4d&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/8nUfL0drNs&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们