新智元报道
新智元报道
【新智元导读】谷歌的Gemini 3,才是奥特曼做梦都想要的「GPT-5」?
全球最强Gemini 3深夜炸场,谷歌开启了AI下一个新纪元!
这是迄今最强的AI模型,可能没有之一——
推理最强,多模态理解最强,以及「智能体」+「氛围编程」最强。
上下滑动查看
奥特曼、马斯克接连送上祝贺:
Gemini 3.0 Pro性能强到令人发指,多项指标全面碾压GPT-5.1。
不得不说,这回谷歌真是支棱起来了,一口气干翻了OpenAI和xAI。
而且,论文中明确指出,不靠英伟达GPU,纯TPU就炼出了世界最强的AI猛兽。
但这次不止是AI王朝交替——
谷歌发推表示,Gemini 3是最智能的模型,是通向AGI的重要一步。在自家网站,谷歌CEO劈柴、Hassabis高调宣称——「Gemini 3:智能新纪元」。
谷歌这次主打的是让用户的创意成为现实。
DeepMind则强调Gemini 3 Pro是最适用于AI智能体与氛围编程,可将创新概念带入生活。
昨晚,Gemini 3.0 Pro凭借一张基准测试图火出圈,但对大多数人来说,这还远远不够直观。
它究竟有多强?
全网首测demo最有说服力,一起看看大家如何用实力玩出花样。
网友Min Choi表示,Gemini 3简直好得令人难以置信。
顺便插播一句,Gemini 3 Pro还只是一个预热,谷歌研究员称,更多精彩好戏明天上演。
让一让,谷歌来了。
诺奖得主、DeepMind CEO Hassabis,花了几个小时就重建了90年代游戏《Theme Park》的测试环境,甚至包括让玩家调整薯条上盐分含量这样的细节!
甚至只用5分钟,网友Flavio Adamo就做出了一款游戏,比预期中还要好:
AI创业者Pietro Schirano用Gemini 3 Pro创建了3D乐高编辑器:只要一次,Gemini 3就完成了UI、空间逻辑以及其他功能。
谷歌的AGI政策开发负责人 Séb Krier惊呼:「Gemini 3好得邪门」——
只要两次,就生成了核电站运行原理可视化仿真!
LMArean利用Gemini 3 Pro,在Code Arena中完成了多项实测:
无尽版《极速风流》「Outrun」驾驶游戏
DNA互动游戏
雾中的金门大桥
……
用Gemini 3模拟魔方,效果丝滑:
自十月初,一系列Gemini 3内测放出后,AI大佬们纷纷吵着:前端开发的时代结束。
如今,Gemini 3出笼后,真的要一夜之间端掉前端的饭碗了。
有开发者仅用一句话,成功搭建了一个公司网页端UI。
不止于生成UI,Gemini 3 Pro还可以为其注入灵魂,让界面上的文案优美动人。
只要一次,生成的多律动物理音序器:
对3D物理模拟,最能体现一个AI对真实世界的理解力。
先以最常见的测试为例:小球在六边形中的自由落体运动,Gemini 3 Pro仅在30秒就完成。
而ChatGPT和Grok 4.1,各花费了2分钟,这是速度制胜。
ChatGPT vs. Gemini 3.0 vs. Grok 4.1
谷歌AI Studio产品负责人Logan Kilpatrick还有个更复杂的版本:
再来个超带劲的——
Gemini 3 Pro可以完美演绎一颗柠檬掉入水中的真实测试,就连水花、波纹、光影效果全部拉满。
如下超酷炫的3D粒子星系,也是Gemini 3 Pro一次完成。
眼前就是一片浩瀚星海,无数光点缓缓旋转,组成巨大的银河旋臂。
用上Gemini 3 Pro+Three.js,还可以可视化混沌能量。
在SVG动画生成方面,Gemini 3达到了一个全新的境界。
最常见的「鹈鹕骑自行车」测试,Gemini 3 Pro一次性就完成了。
再来个高难度的「马戏团」SVG。
prompt:an animated svg scene of: a secretary bird riding a unicycle while juggling, two snakes sumo wrestling, a giraffe on a trapeze and a lizard riding a dog riding a cow
宝可梦对战SVG动画,Gemini 3搞定:
一次性生成在单个HTML文件中,运行的经典风扇的SVG,还是可以调风速的那种。
超逼真的Xbox手柄,Gemini 3 Pro成功通过压力测试。
除了Gemini 3之外,谷歌还推出了Antigravity编程助手。
对于程序员而言,Antigravity的设计理念并不陌生——
它类似于Claude Code和OpenAI Codex,是一款获得计算机访问权限后能在指导下自主编写程序的专用工具。
Gemini 3拥有卓越的编程能力,沃顿商学院教授Ethan Mollick认为,这至关重要——即使你从不自视为程序员。
他的理由来自他对AI发展的核心洞察:计算机上的一切操作终将归为代码。
当AI掌握代码能力,它就能完成任何计算机用户可做的事:构建数据看板、操作网站、制作PPT、读取文件等等。
这使得具备编程能力的智能体成为通用工具。Antigravity正是基于这一理念。
除了更强的代码能力和创造力外,真正值得OpenAI警惕的是:
谷歌首次将AI模型「一上线就接入搜索引擎」。
现在,用户只需点击Google搜索中的「AI模式」,无需下载App或跳转网页,就能直接使用Gemini 3。
这是一次正面迎击:Google不再把AI产品局限于单独的Chat界面,而是借助自家搜索引擎和产品矩阵,让AI无处不在。
Gemini API同步更新:
Gemini 3 Pro默认使用动态思考来推理提示。
开发者可设置思考等级,更好地控制延迟时间、费用和多模态保真度。
谷歌特别提示:Gemini 3是一种推理模型,注意一下提示词技巧。
精确的指令:输入提示应简洁明了。Gemini 3最适合处理直接、清晰的指令。它可能会过度分析用于旧模型的冗长或过于复杂的提示工程技术。
输出详细程度:默认情况下,Gemini 3的输出详细程度较低,更倾向于提供直接、高效的答案。如果您的使用情形需要更具对话性或「聊天」风格的角色,您必须在提示中明确引导模型(例如,“以友善健谈的助理的身份解释一下”)。
上下文管理:处理大型数据集(例如整本书、代码库或长视频)时,请将具体指令或问题放在提示末尾的数据上下文之后。在提问时,以「根据上述信息…」之类的短语开头,将模型的推理锚定到提供的数据。
<br>
<a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652646869&idx=1&sn=8f9b25312ef18394379d67ec23820817&chksm=f002d64c3648aaf1a23589e71d459493b9fb13bc07f7d4eef5debc82d4915ae37924912c0846&scene=0#rd" target="_blank">文章原文</a>
<br>
<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/83671/AlslT89HVC&maxage=1y" width="1px"></div></div></body></html>