动态列表

  • GPT-5点赞!八大顶尖机构发布「自进化智能体」全面综述
  • 打工半年后,Atlas觉醒!「大行为模型」零代码上新技能,AI工业革命来了?
  • DeepSeek-V3.1震撼发布,全球开源编程登顶!R1/V3首度合体,训练量暴增10倍
  • 刚刚,好莱坞特效师展示AI生成的中文科幻大片,成本只有330元
  • 摆脱遥控器,波士顿动力人形机器人,开始「长脑子」干活了
  • 微软AI CEO警告:我们需要警惕「看似有意识的AI」
  • ICCV 2025 | ECD:高质量合成图表数据集,提升开源MLLM图表理解能力
  • 汽车业务还没盈利,小米却已找到「第三曲线」
  • 通义APP上线官方知识库,首批覆盖教育、法律、金融等五大领域
  • AI Scientist生成的论文被指「剽窃」,回应称「未引用相关研究」,AI自动化科研还靠谱吗?
  • 击败Meta登榜首:推理增强的文档排序模型ReasonRank来了
  • 千寻位置护航无人机表演,开启品牌多城联动新篇章
  • 刚刚,字节开源Seed-OSS-36B模型,512k上下文
  • 上下文记忆力媲美Genie3,且问世更早:港大和可灵提出场景一致的交互式视频世界模型
  • OpenAI 单月营收已经破 10 亿美元;马斯克的 Grok,超 37 万条用户聊天记录「裸奔」;谷歌发布 AI 手机
  • 成为「流量黑马」的老品牌,如何借拼多多秒懂 00 后?
  • AI 的终点不是对话框,这家公司想让真实世界成为 AI 的提示词
  • 网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
  • 二十余名英国青年科学家在沪参与好望角科学沙龙活动
  • 为长视频生成减负!浙大与华为提出Compact Attention,挖掘结构化稀疏加速2.5倍
  • TPAMI 2025 | 骨架动作理解大一统:东南大学等提出USDRL,一个面向密集表征学习的基础模型
  • 报名开启|中关村国际青年论坛:诚邀全球青年学者共探AI前沿
  • Sora没做到的,LongVie框架给解决了,超长视频生成SOTA
  • 「价格战」打了半年,吉利如何做到核心利润暴增102%?
  • 小鹏Q2财报「炸裂」:营收暴涨125%,毛利率反超特斯拉
  • Nature子刊 | 上智院统一框架RXNGraphormer,实现化学反应多任务精准预测,自发掌握分类规律
  • 首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
  • 智谱推出AutoGLM 2.0:手机 Agent 的「Manus 时刻」?
  • 论坛报名已启动,速来锁定席位!解码具身智能的落地挑战与产业爆点
  • DiT在数学和形式上是错的?谢赛宁回应:不要在脑子里做科学
  • dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型
  • DeepSeek开源新基础模型,但不是V4,而是V3.1-Base
  • Meta超级智能实验室重组为四个部门,某些高管将离开
  • ICCV 2025 | 跨越视觉与语言边界,打开人机交互感知的新篇章:北大团队提出INP-CC模型重塑开放词汇HOI检测
  • 黑神话系列第二作,《黑神话:钟馗》先导宣传片公布;小米卢伟冰:2027 年进军欧洲汽车市场;宇树预告新机器人
  • GPT-5暴写「屎山代码」!14个Prompt,看穿GPT-1到GPT-5七年智商进化史
  • 微软最新揭秘:「话痨实习生」AI助手,到底能帮人类做什么?
  • 陶哲轩「断粮」后,25年首次绝望怒吼:美国科学命脉被砍断!
  • 16岁天才少年炒掉马斯克,空降华尔街巨头!9岁上大学,14岁进SpaceX
  • 中科慧远发布CASIVIBOT,以九年积累开启AOI与机器人协同的品质检测新时代
  • 英伟达ViPE:任意视频一键转为3D几何数据,开源引擎与亿级帧数据集重磅发布!
  • CVPR 2025 | DeCLIP:解耦CLIP注意力,哈工大(深圳)、港大提出通用开放词汇密集感知新框架
  • 强化学习之父Richard Sutton最新演讲揭示OaK架构:通向超级智能的八步愿景
  • ICCV 2025 | RobustSplat: 解耦致密化与动态的抗瞬态3DGS三维重建
  • 医疗AI安全革命:全球首个医疗动态红队测试框架DAS,破解临床落地信任危机
  • 谷歌在上海办了场 AI 嘉年华,开发者们却说像逛「AI 基地」
  • 7年了,OpenAI官方给出五代GPT对比,网友却怀念起「狂野」初代
  • X-SAM:从「分割一切」到「任意分割」:统一图像分割多模态大模型,在20+个图像分割数据集上均达SoTA
  • 开源版Genie 3世界模型来了:实时+长时间交互,单卡可跑,国内公司出品
  • 图生视频新玩法刷爆外网:图上画两笔就能动起来,终于告别文本提示
  • 妙笔生维:线稿驱动的三维场景视频自由编辑
  • 一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器
  • Z世代生存、学习与未来宣言!伯克利学霸预言课堂,用AI设计人生
  • AI来了!记者、UP主、写手,谁能逃过这场「灭绝浪潮」?
  • Hinton预言成真!AI接管美国一半白领,牛津哈佛扎堆转行做技工
  • 为什么「游戏」是 AI 陪伴落地的好场景?
  • 新加坡 AI 办公系统 Agnes:200 个 Agent 并行研究,让 AI 主动「找茬」打磨设计
  • 机器人也会「摸鱼」了?宇树G1赛后葛优瘫刷美女视频,网友:比人还懂享受生活
  • 从GPT-2到gpt-oss,深度详解OpenAI开放模型的进化之路
  • NextStep-1:一次在图像生成上自回归范式的探索
  • KDD 2025 | UoMo来了,首个无线网络流量预测模型,一个框架搞定三类任务
  • ICCV 2025 | MobileViCLIP:快55倍!南大等提出首个高效“视频-文本模型,让多模态AI在手机可运行!
  • 突破长视频生成瓶颈:南大 × TeleAI 联合推出全新 AI 生成范式 MMPL,让创意“一镜到底”
  • 开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍
  • 一张图,开启四维时空:4DNeX让动态世界 「活」起来
  • AI发现新物理定律:纠正等离子体理论多年错误假设
  • 多模态大模型在化学与材料学的「体检表」——哪些能力靠谱,哪些还差很远?
  • Altman:希望 AGI 能提高生育率;与辉同行否认董宇辉年收入二三十亿元;今年国内智能眼镜市场同比增长121.1%
  • 刚刚!谷歌内部揭秘Genie 3:Sora后最强AI爆款,开启世界模型新时代
  • 硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码
  • 黄仁勋子女逆袭上位!4万亿「皇储」成长史首曝:一个学烘培,一个开酒吧
  • GPT-5首次会推理,OpenAI联创曝AGI秘诀!超临界学习吞噬算力,2045金钱无用?
  • 400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?
  • CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力
  • SEAgent:开启从实战经验中自我进化的GUI智能体新纪元
  • 给DiT装上“迷你”控制舵:NanoControl实现高效精准控制,参数量仅增0.024%
  • OpenAI估值达5000亿美元;「原道」联手小岛秀夫,推《死亡搁浅》耳机;苹果手表将「大幅重新设计」
  • 奥特曼神秘晚宴讲话曝出!OpenAI的CEO或将是个AI,Chrome我也想买
  • 谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草
  • 最惨就业季!CS学霸GPA 3.98,投2500份简历仅10次面试,AI吞噬入门级岗位
  • Yann LeCun最新纪录片首曝!传奇AI教父的双面人生,深度学习幕后40年
  • 机器人全产业链接会 FAIR plus 2026新闻发布会在京召开
  • 大模型如何推理?斯坦福CS25重要一课,DeepMind首席科学家主讲
  • 当AI比我们更聪明:李飞飞和Hinton给出截然相反的生存指南
  • 简单即强大:全新生成模型「离散分布网络DDN」是如何做到原理简单,性质独特?
  • ICCV 2025 | 告别“尬舞”,InterSyn交错式学习生成逼真多人交互动作
  • Sam Altman:AI存在泡沫;宇树机器人夺金,王兴兴:用遥控追求极致速度;蔡浩宇AI游戏上架,27.19元|极客早知道
  • 吞下17亿图片,Meta最强巨兽DINOv3开源!重新定义CV天花板
  • 打开高德的理由又多一条!全球首个「需求链智能调度」AI地图上线
  • 核心模型被曝蒸馏DeepSeek?前女友一纸控诉,曝出欧版OpenAI塌房真相!
  • 一句话搞定多任务出行,高德用空间智能重新定义地图
  • GPT-5、Grok 4、o3 Pro都零分,史上最难AI评测基准换它了
  • 谷歌开源Gemma 3 270M,性能超越Qwen 2.5同级模型
  • 追剧不断网,可能背后有个AI在加班,故障诊断准度破91.79%
  • ICCV 2025 (Oral) | DPoser-X:基于扩散模型的鲁棒3D全身人体姿态先验,树立领域新标杆
  • DINOv3震撼发布:Meta AI的视觉巨兽,重新定义自监督学习
  • Meta视觉基座DINOv3王者归来:自监督首次全面超越弱监督,商用开源
  • 多突触神经元模型问世,国内团队打造类脑计算新引擎,登上《自然·通讯》
  • Science封面:高效精准模拟构象变化,微软研究院用生成式AI重塑蛋白质功能研究
  • 扎克伯格看OpenAI直播挖人,北大校友孙之清加入Meta
  • AI 模特时代到来:字节x清华推出商用级视频换装模型DreamVVT,保真度显著领先SOTA
  • LeetCode刷够100小时,学会找人内推,OpenAI员工下场教你拿Offer
  • xAI元老离职干风投,传奇人物Babuschkin长文追忆与马斯克创业战友情
  • 链式思维是幻象吗?从数据分布视角重新审视大模型推理,马斯克回复,Grok破防
  • 李想:i8 反响不错,产品力没对手;库克暗示:苹果将推桌面机器人;中国日均消耗 30 万亿 Token,暴涨 300 倍

谷歌手机十年最狠升级,全家桶AI宣战苹果!一句话P图,100倍变焦



  新智元报道  

编辑:桃子 KingHZ
【新智元导读】还没等到苹果出手,谷歌直接截胡了!昨晚,全新Pixel 10「全家桶」火力全开,全系Gemini加持,百倍变焦秒杀细节。十年最强升级,谷歌传统智能手机宣告终结。

这几天,谷歌一款神秘AI生图模型Nano Banana在全网掀起了巨震。

一句话P图、修复老照片、参考生图.....堪称终极AI编辑器。

如今,这款神级AI图像模型,深度集成到谷歌新一代智能手机Pixel 10「全家桶」了。

在Made by Google 2025新品发布会上,谷歌首次亮相Pixel 10系列,正面狙击未发布的苹果iPhone 17。

Pixel 10系一共有四款——Pixel 10、Pixel 10 Pro、Pixel 10 Pro XL、Pixel 10 Pro Fold,搭载了全新Tensor G5芯片,以及Gemini Nano模型。

相较于硬件配置,让全网更兴奋的是,Pixel 10全系配备的强大的AI能力

  • Gemini Live:语音模式拍哪问哪,AI立即给出解答,语音对话时长达文字5倍

  • Voice Translate:实时语音翻译,内置「翻译官」,拿捏11种不同语言

  • Nano Banana:照片编辑器,瞬间消除人物、更换衣物、调整光线

  • Camera Coach:基于Gemini打造,个人摄影「导师」,承包构图、画面布局、拍摄方式

  • Pro Res Zoom:高达100倍智能变焦AI,智能恢复和优化复杂细节

  • Magic Cue:智能信息提示,自动从Gmail、日历、信息中建议内容

有了Gemini Live的加持,去商店购物没有人陪,Pixel 10也能帮你提建议。

拍照小白,尤其是给女友不会拍照的男票们,Pixel 10自带AI摄影师,角度布局全程指导。

与此同时,谷歌还亮相了多款配套硬件,比如Pixel Watch 4、Pixel Buds 2a等等,全部All in AI。

苹果还未做到的,谷歌提前都实现了。

有网友表示,就拿一张夜景图来看,iPhone和Pixel的差异实属有些离谱。

十年重磅升级
谷歌赢麻了

昨天,谷歌正式宣告:传统智能手机时代终结了,手机、手表、耳机、折叠屏……全都由Gemini驱动。

这可能是近十年来最重磅的一次手机升级。

昨天,谷歌一口气推出了Pixel 10系列:Pixel 10,10 Pro, 10 Pro XL,10 Pro Fold。

全新设计,搭载Material 3 Expression UI  

支持Pixel Snap与Qi2磁吸配件  

提供长达7年的系统更新与Pixel Drops功能推送

先看一下这次的核心硬件升级:芯片和摄像头。

谷歌最强芯片:Tensor G5芯片

Tensor G5是谷歌迄今为止最大规模的升级,实现了性能的显著提升,全方位得到了增强——

TPU性能提升高达60%,  

CPU平均运行速度加快34%,  

采用台积电领先的3纳米制程工艺打造,  

搭载的全新安全硬件,为Pixel提供更全面的保护。

Tensor G5让Pixel手机又快又智能。

Tensor G5芯片中全新的图像信号处理器ISP,提升了Pixel拍摄视频的高质量,即便在低光环境下也不例外。

它默认支持动态去模糊功能,并为1080p和4k30视频提供10-bit色深。

此外,它还改进了「真实色调」(Real Tone)功能,能够无缝地还原照片或视频中每个人不同的肤色,让人看到每个人最真实的光彩。

除了提升图像和视频质量,Tensor G5还驱动了一系列相机功能。

Pixel相机:不只5倍长焦镜头

Pixel 10首次配备了5倍潜望式长焦镜头。

它能提供同类最佳的2倍变焦画质、快速自动对焦、10倍光学品质变焦以及最高可达20倍的超分辨率变焦。

Pixel 10 Pro Fold则采用了一款全新的4800万像素后置摄像头传感器。

Pixel相机中运行了有史以来最大规模的AI模型,将您的变焦范围惊人地扩展至100倍,同时保留惊人的细节。

Pixel相机更是AI全面进化:

  • Auto Best Take:融合150帧,打造完美合影

  • Camera Coach:AI指导构图、光线与技巧

  • 折叠屏独享Instant View:拍摄同时预览

  • 内容凭证C2PA:原生认证照片真实性

而且这次发布恰好卡在苹果预计推出iPhone 17的前几周。

相比之下,苹果的新机依旧是熟悉的升级套路——更强的相机、或许更薄的机身,再加上几款全新的配色可选。

苹果对外展示过更聪明的Siri,但如今「神龙见首不见尾」「犹抱琵琶半遮面」,其他所谓Apple Intelligence功能也乏善可陈。

而谷歌这次的Pixel手机却是满满的AI体验——而且都是用户真能用得上的工具。

这次Pixel新系列的智能工具让记者IPhone用户、记者Nicole Nguyen都嫉妒了起来。


硬刚苹果,真·AI手机登场

在Pixel 10上,Gemini原生融入设备,让许多人真切体验到何为「真正的AI手机」。

Gemini Live:AI超级管家,24h在线

今年谷歌I/O大会上,Gemini Live一边通话,一边指导小哥组装自行车的演示,让全网惊叹。

这一次,搭载到全新Pixel 10的Gemini Live,功能也得到了升级。

与以往不同的是,它能够在实时视频中「花圈」了!

假设你想喝一杯咖啡,直接要求Gemini Live「你能教我如何制作一杯浓缩咖啡吗」?

它圈出来告诉你,「先按左边的研磨按钮,接着往豆仓里加咖啡豆」。

这里,Gemini Live植入了一种「视觉叠加」(Visual Overlays)新功能,能够清晰看到你所看到的内容,并通过高亮屏幕上物体,给出建议。

它还新增了一款音频模型,可以监测一个人的语气,比如是兴奋,还是担忧,便会自主调整适应。

要去面试一份工作,提前练习如何自我介绍,找Gemini Live即可。

它会成为你的「面试官」,让你轻松自如地讲出自己的工作经验和个人能力。

Magic Cue:开口搞定一切,Siri要等到26年

这一次,谷歌还重磅推出了对标Siri的AI——Magic Cue,能主动根据实时情境,提供个人建议。

Magic Cue出世,真正拉近了人与AI之间的距离。

多年来,谷歌一直梦想着用户能与自家AI技术之间积极主动的互动,这种构想早在AI时代之前,就已萌芽。

2010年代初期,谷歌曾在安卓系统中,推出了名为「Google Now」功能——主动弹出信息卡片,根据日程安排提供实时信息。

十多年后,Magic Cue在新版Gemini Nano加持下亮相,深度集成到Pixel 10中。

它能感知个人Gmail、日历、Keep 便签、信息应用和截图中的信息,在恰当时机自动提供相关信息和操作。

发布会上,小哥现场演示,收到朋友去哪约饭的信息时,Magic Cue会在信息窗口下方弹出提醒——已在Coppelia预定座位。

不用手写打字,点击提醒直接发送。

又或是,朋友问题落地航班的具体时间,Magic Cue直接调用个人日程,给出建议。

不用跳转应用,也能一键回复。

Magic Cue会以彩色边框提醒,不论是谷歌信息、电话、Pixel 天气、各类应用内的搜索功能,它都会直观弹出通知。

苹果也在一直尝试让用户,通过Siri对话在应用内进行互动操作。但遗憾的是,这款由AI驱动的Siri,已被推迟到2026年。

自带AI摄影师,百倍变焦

在拍照这方面,Pixel 10这次的硬件升级,直接碾碎了最强iPhone 16。

发布会现场,在同一个夜景下,iPhone 16 Pro Max和Pixel 10 Pro XL效果鲜明对比图,引发在座观众的激动欢呼。

不仅如此,他们还推出了一款AI助手Camera Coach,教你炼成一名更出色的摄影师。

在Gemini模型加持下,它能提供更好构图和拍摄的建议,甚至可以选择「获取灵感」选项,AI还会推荐一些合适的场景。

选定好你想要的一种风格后,Camera Coach会在屏幕上给出构图、视角建议——

比如,镜头再拉近一点,手机要放低.....即便是一个初学者也能分分钟拍出大片。

现场,谷歌亲自演示了,如何在Camera Coach指导下,拍出一张自己想要的照片。

此外,摄像头还能一眼识别出,用户是否在拍团体照。

这时,「Auto Best Take」功能自动激活,并在数秒内拍摄至多150张照片,并推荐其中最佳的一张。

「照片问答」(Ask Photos)工具,可以让你直接通过语音、文字与AI助手互动,不论是编辑、调整光线,或是更改构图、移除物体等瞬间实现。

在 Pixel 10 Pro和Pro XL两款机子中,还可以实现百倍生成式AI变焦,刷新纪录。

通过Pro Res Zoom,即使放大到100倍,也能呈现惊艳清晰度。

不仅仅是裁剪,它还能在极端远距离下智能修复细节。

除此之外,Pixel 10还有搭载了实时AI翻译功能,让任何人和歪果仁都能无缝交流。

即便你只会说一点点西班牙语,也不用担心。

它能够支持11种不同语言,翻译又快又准,就好像你在手机中内置了一个私人翻译官。

谷歌Pixel全系,All In AI

Pixel 10系列,还有一款折叠屏——Pixel 10 Pro Fold,同样全面搭载了Gemini Nano模型。

是谷歌迄今最耐用的折叠屏手机,代表了谷歌工程能力的巅峰。

Fold内屏为迄今折叠屏中最大的8英寸;外屏为6.4 英寸,边框更窄,显示面积更大;两块屏幕均支持 3000 尼特峰值亮度。

不仅是大屏,更是耐用性新标杆:

  • IP68认证:首款具备完整防尘防水的折叠机。泼溅、灰尘都不在话下。

  • 薄而坚固:比铅笔还薄,强化铰链+高端材质,开合都很稳固。

  • AI驱动:Tensor G5让多任务流畅应对,轻松跑大应用。

与前三款类似,Pixel 10 Pro Fold中同样集成了,Magic Cue、语音翻译、Gemini Live等AI能力。

与手机相匹配的其他硬件,这一次也得到全面升级。

新代Pixel Watch 4让Gemini上手腕,新增「抬腕说话」功能。 配备AI健康教练,还能检测脉搏消失。

耳机Pixel Buds 2a首款搭载主动降噪,Tensor A1音频芯片驱动,单次7小时(ANC 开启),搭配充电盒20小时。

如今,谷歌Pixel 全系植入强大的Gemini,让人人可用AI。更好的消息是,Gemini 3离正式发布不远了。

LMarena最强修图神器是Gemini 3?

大模型竞技场LMarena中,代号「Nano-banna」的神秘模型大放异彩,让网友惊呼一致性好到发疯!

而且不仅仅是图片PS领域,Nano-banna让他觉得这就是变革。

谷歌实验室的Lars Pragmate认为Nano-banna就是Gemini  3的图像编辑功能。

她认为这是最好的图片编辑器,图像编辑被解决了。

美国媒体推测Nano-banna跟谷歌离不开关系,而「nano」暗示本地设备可跑的模型。

而且在基准测试「人类最后测试」,Gemini 3.0的分数在源代码中被泄露:

Gemini 3.0的成绩为32.4%,高于GPT-5的26.5%以及Grok 4的23.9%。

不过,这一消息没有得到确认,而且同时泄露的另一张图中,GPT-5(high)还顶这xAI的logo(见下图左2)。

如果成绩是正的,GPT-5将面临真正激烈的竞争。

参考资料:
https://blog.google/products/pixel/made-by-google-2025/ 
https://blog.google/products/pixel/tensor-g5-pixel-10/ 
https://blog.google/products/pixel/google-pixel-10-pro-xl/#cameragemini


<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652621641&amp;idx=1&amp;sn=28147951e05942c75024f7b2d42c1cc1&amp;chksm=f014999df55c6915b30354fb4e00e94b44dcd1e8ba2701bdea44748dd0d7e7361f853a7a00e1&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/eUmLBVhGt2&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们