动态列表

  • 刚刚!软银系创始人4个月打造机器人超级黑马,获2轮近亿元融资
  • 博士生,当代最穷科研民工?Nature最新调查:不涨工资,我们就跑路了
  • Thinking Machines曝LoRA终极指南:10倍学习率,媲美全参微调
  • GPT-5「降智」真相曝光:不是变笨,而是五个超级开关没激活
  • OpenAI 刚刚发布了属于 AI 的抖音,还有 Sora 2
  • YOLO26首份学界评论:端到端无NMS,目标成为边缘设备实时目标检测新标杆
  • DeFacto:用强化学习治愈AI幻觉,让多模态模型“有据可查”
  • NeurIPS 2025 | 清华大学与华为等提出全新正则化方法,破解稀疏视图3DGS“协同适应”难题
  • LoRA到底能否媲美全参?Thinking Machines用实验曲线划出「无悔区」
  • 榜一换人!OCRBench v2九月新榜:揭示多模态大模型文档智能真实水平
  • 把“俄罗斯方块”搬进设计室:物竞天择让振动微型机器人进化得越跑越快
  • DeepSeek V3.2 发布,API 成本减半;特斯拉员工被机器人打伤,索赔 5100 万美元;Claude 新模型登场
  • 谷歌Veo 3论文竟无一作者来自美国!揭秘零样本「看懂」世界
  • 零样本「即插即用」!智源开源RoboBrain-X0,一个基座模型开动不同机器人
  • AI老司机现身重庆!徐峥挑战赛车手,上演「不再囧途」
  • 强化学习之父给LLM判死刑!站队LeCun:我们全搞错了
  • 独家!DeepSeek最新模型上线,全新注意力机制基于北大ACL最佳论文
  • 4B逼近DeepSeek-R1!Bengio团队「递归聚合」刷新小模型上限
  • KDD 2025 | 看不见也能控:用“基混杂向量”打穿分布移位,交通预测稳了
  • 北京内推 | 快手可灵AI技术部招聘视频生成/数字人方向算法实习生
  • 在云栖,我们遇见了最会玩的「AI 原住民」
  • NeurIPS 2025 | UniPixel:首个统一对象指代与分割的像素级推理框架,让大模型看懂每一个像素
  • NeurIPS 2025 | Seg4Diff:无需分割头,揭示并放大扩散Transformer中的涌现分割能力
  • 做 AI 陪伴收获 1000 万用户后,前微信 AI 产品负责人,要重新定义生活里的 AI
  • 透视阿里云产品生态团队:AI 落地的「关键通道」
  • OpenAI「降配门」发酵,偷换模型遭全网实锤;小米 SU7 在日本首秀;苹果内部测试类 ChatGPT 应用|极客早知道
  • OpenAI「GPT门」事件引爆!Plus、Pro账户统统降配,偷换模型全网实锤
  • 突发,普林斯顿CS博士后猝然离世!清华本科毕业,刚完成论文答辩
  • 国内首次!8.9毫秒推理速度破纪录,1元打穿百万token
  • 惊现高管离职潮!马斯克亲信操盘xAI,千亿美元能填AGI野望?
  • 黄仁勋2小时反驳「AI泡沫帝国」论!英伟达将成全球首家十万亿市值公司
  • 云与AI,如何托举 Z 世代的创新野心
  • 北京/杭州内推 | 阿里通义实验室招聘多模态大模型与智能体方向算法实习生
  • NeurIPS 2025 | 我奶奶都能复现?条件表征学习:矩阵一乘,表征立马“对齐”!
  • 8GB显卡的逆袭!SSD换显存,3060 Ti硬跑100k长上下文
  • NeurIPS 2025 | 北大等提出C²Prompt:解耦类内与类间知识,破解联邦持续学习“双重遗忘”难题
  • InterDigital开源CompressAI-Vision:为“AI看”的视频压缩,打造一个“通用跑分平台”
  • 24.98万的理想i6,在特斯拉、小米、蔚来「后院」放了一把火
  • 小米 17 开售 5 分钟,破国产机销售纪录;Meta 研发机器人项目;国内发布「脑机接口标准」
  • Stability AI前CEO惊人预测:人类智力价值归零,只剩1000天!
  • 刚刚,奥特曼预言:人类「只剩」最后5年!
  • 免训练加速61倍!陈怡然团队新作DPad:仅关注「彩票token」
  • 估值840亿AI实验室再放大招,他们要给大模型戴上「紧箍咒」
  • 苹果掀桌!扔掉AlphaFold核心模块,开启蛋白折叠「生成式AI」时代
  • 自动驾驶进入大模型时代,主机厂寻找「联合创始人」
  • DASFAA 2025 | 湖大等提出SCRA-VQA:给LLM一份“精装修”的图像描述,无需训练提升VQA性能
  • 复旦等揭秘机器人“大脑”安全漏洞:一张图就能让它“宕机”,攻击成功率76.2%
  • 苹果官方旗舰店也放假,商品不发货;腾讯推「老年打车」服务;车主酒驾,智能驾驶「报警」|极客早知道
  • 刚刚,ChatGPT Pulse上线!私人秘书不再是富人特权
  • 颠覆算力格局!全球首个星座级太空AI算力服务,在中国诞生
  • OpenAI 3万亿美元测试,AI首战44个行业人类专家!
  • JHU教授揭秘学术潜规则:普通博士如何打破鄙视链翻盘?
  • Hinton预言错了!年薪狂飙52万美元,AI没有「干掉」放射科医生
  • 168 元一年的「小红卡」,是小红书打破本地生活红海的钥匙
  • 当 5 亿玩家涌入 AI 的 3D 新世界
  • 普林斯顿陈丹琦组新作:RLHF难支撑,RLVR有边界?RLMT开辟第三条路
  • 博士申请 | 香港中文大学(深圳)冀晓强老师课题组招收人工智能全奖博士/硕士
  • 128k死穴被击穿!Amazon爆改长上下文:段内压缩快4×,推理不掉点还更准
  • AI 到底会不会做生意?1688 的答案让人惊喜
  • 找人不求人?Lessie 让「人脉玄学」变成算法游戏|AI 上新
  • 斯坦福推出VisualMimic:让机器人“眼观六路”,零样本完成复杂任务
  • 浙大发布RS3DBench:让遥感AI看懂3D世界,首个像素级对齐的大规模基准来了!
  • 小米 17 系列发布,4499 起;追觅「库里南」图片曝光;YU7 Max 成「百万最速」车
  • 刚刚,LeCun团队开源首款代码世界模型!能像程序员一样思考的LLM来了
  • AI正在偷走白领工作!OpenAI狂砸10亿教AI上班,你的完美继任者即将上岗
  • Sora 2瑟瑟发抖!通义万相2.5放大招:一句话出1080P电影,音画精准同步
  • 信息熵之后,清华提出状态熵!量化分析「系统智能性」的全新视角
  • 突发!Meta刚从OpenAI挖走了清华校友宋飏
  • 北京内推 | 中科院软件所数据科学研究中心招聘大语言模型算法实习生
  • 78条打穿1万条!上交大新范式告诉你:智能体训练靠“质”,不是靠“量”
  • KV缓存不再爆!清华姚期智团队重写注意力维度,长上下文更省更强 | NeurIPS 2025 Spotlight
  • 三款骁龙芯片曝光,高通谷歌联手打造「安卓 PC」时代
  • Instagram 月活破 30 亿,靠“短视频”和“私信”;2027款iPhone曝光;女子用ChatGPT选号中百万大奖,全部捐出
  • 一年4次迭代,狂堆GPU成真!微软AI冷液灌芯,散热暴涨3倍
  • 刚刚,阿里CEO吴泳铭发布「ASI宣言」:超级智能才是终局!
  • 前Meta工程师爆料:17人团队15个H-1B!一夜之间80%对手没了?
  • 秘塔AI放大招!「边想边搜边做」,内置20+智能体,想法一键实现
  • 震撼!AI物理「双修」:亥姆霍兹方程嵌进生成器,伪影当场消失
  • 恶劣天气下的图像修复:南理工等提出LCDiff,让AI在雨雪雾天也能看得清
  • OCRBench v2 25年9月最新榜单发布!揭示多模态大模型文档智能真实水平
  • RL不再撒胡椒面!港科大 × 清华新作:只盯“规划token”,大模型推理力狂飙
  • NeurIPS 2025 | 甩掉文本CoT!FSDrive开启时空思维链,自动驾驶迈入视觉推理时代
  • 博士申请 | 加拿大麦吉尔大学智能自动化实验室招收大模型/强化学习方向全奖博士生
  • 3 天卖完今年所有产能,蔚来全新 ES8 如何实现逆风翻盘?
  • 超越 AGI,阿里剑指「超级智能」
  • Point-SSM:一种用于点云分析的极简状态空间模型,在医学点云任务上表现SOTA
  • 字节跳动OmniInsert炸场:无需掩码,任意物体“贴”进视频,效果碾压闭源SOTA!
  • ContextFlow:无需训练的视频编辑新范式,实现电影级魔改!
  • 忘了法拉利,一辆中国车正在改写游戏规则
  • 40亿投进去,换回了什么?全新问界M7的「值得」哲学
  • 华为问界新 M7,1 小时大定 3 万;李想:iPhone 17 顶配太丑,不买;防台风,腾讯「捆绑」QQ 企鹅塑像

AI改造出行体验:滴滴的试验能否开启行业范式转变?



  新智元报道  

编辑:KingHZ 艾伦
【新智元导读】AI Agent赋能出行领域,将带来怎样的全新体验?滴滴给出了自己的答案,于近日面向公众内测上线了小滴这款打车Agent,颠覆了滴滴自己亲手开创的打网约车的传统模式。

AI叫车时代来了!

AI Agent赋能出行,将带来怎样的全新体验?

十一黄金周将至,出行高峰随之而来。人多,打车难了,打到适合的车更难了。

滴滴正在公测的出行AI助手,正是为出行高峰量身打造——

输入需求→自动识别上下车点→理解偏好→匹配司机,一键下单!

而这个AI Agent的体验路径如下:

更新滴滴App → 目的地栏搜「AI叫车」→ 点「AI出行助手小滴」→ 输入口令「AI出行用小滴」。

至于效果如何?

反正用过的小伙伴,表示已经回不去了。(手动狗头)

AI叫车:先用小滴先上车

滴滴基于丰富的车辆和司机信息,通过AI智能理解用户需求,提供更精准、更完善、更贴近用户期望的用车方案。

本次覆盖四大出行场景:个性化打车、定时叫车、历史查询、方案对比

<<  滑动查看下一张图片  >>

国庆出行用小滴

小滴虽小,却能轻松应对打车需求。

获得体验资格后,目的地栏出现「AI叫车」选项,可直接点击相关图标(下图红色或蓝色箭头指向的图标)体验。

小滴界面简洁,交互直观,有需求直接说,支持语音与文字输入。老年人、孩子只要说清目的地,也能叫到车。

虽然界面简单,但滴滴打车的各种功能都支持,而且更能满足出行需求。

在假期旅行场景里,小滴能带来什么新体验?

国庆假期,常驻上海的小李和朋友们相约来北京旅游,全程使用了滴滴出行App的小滴AI功能。

个性需求,小滴轻松get

小李刚下飞机,要从首都机场T3航站楼去三里屯的全季酒店,行李很多。

他向小滴AI说道:「小滴,我现在要从首都机场T3航站楼去全季酒店三里屯太古里店,行李很多。」

小滴AI旋即推荐了附近3辆后备箱大的车辆,供小李选择。

对每辆候选车,小滴精准总结关键特点,比如车内空间、司机服务态度等。

小滴通过智能匹配,对候选车辆综合打分:分数越高,越能满足个性化需求。而除了「后备箱大」等满足个性需求的标签外,还提供车龄、价格、服务等更多标签。

此外,每辆候选车均展示接驾距离、时间、车型等信息。

小李确认后一键下单,行李轻松装车,顺利入住酒店。

当天稍晚些时候,小李的4个朋友也都陆续到了酒店,他们5个人准备去故宫游玩。

小李对AI说:「我们5个人想坐同一辆车,从酒店去故宫。」

小滴AI推荐了六座的宽敞汽车,还自动提供了优惠价格。

5个人坐一辆车也不会嫌挤了,大家在车上聊得很嗨。

25分钟后我们顺利到达目的地,舒适地踏上了故宫之旅,尽情鉴赏祖国的瑰丽珍宝。

智能对比最优路线

游玩期间,小李的一位朋友不幸临时被通知要回公司加班。

朋友想多陪小李他们一会儿,想卡点去机场,那怎么到机场出行最方便?

直接询问小滴:

我想今晚6点从西二旗地铁站出发到首都机场T3航站楼,请为我规划最优出行方案。

小滴借助AI分析,给出了用时最短、花费最少和综合最优三种出行方案:

想最快最省力就全程打车,1小时出头直接到;

想省钱又能接受多走点路,地铁30元搞定;

要是折中一下,也可以先坐地铁再打车,性价比最高。

在执行过程中,小滴其实找到了5种出行方案,排除较弱的方案,再根据「全面对比原则」,最终保留了3个出行方案,涉及步行、打车、地铁等多种出行方式。

从执行结果上看,滴滴并没有因为自身是打车平台而无脑推荐全程打车,而是综合考虑时间和金钱成本等约束条件,综合考虑出最优方案,这也让我们能在滴滴里放心地完成一站式出行规划,而不是切换到专门的地图软件规划好路线再切回滴滴。

从这些细节,我们能看到滴滴以用户为中心的服务理念的贯彻落实。

提前叫车,确保准时出发

离京前一天,小李让小滴AI提前预约明天10点前往机场的车。

AI主动告知:

明天小滴会在7:55开始监测天气与附近空车情况,9:55安排车辆,如遇空车较少,将提前调度,确保10点准时出发。

第二天,小李准时出发,顺利踏上归程。

30天历史信息,任意查询

即将离京的当天,小李的一位北京朋友在陪他们游玩时,突然想起几天前一笔打车费忘记报销了。

小李便推荐他试试小滴AI的历史行程查询功能,并问道:「小滴,我在9月22号打车花了多少钱?」

AI快速反馈,给出了当天的打车时间、行程和费用。

据悉,目前小滴支持过去30天内的历史消息查询,直接对话,地点/订单/费用/目的地等任意查询。

此外,小滴利用AI还能总结出行规律、充当「出行记账管家」。

滴滴AI智慧出行,让我们每次出发更简单、更省心、更智能。

滴滴:AI让出行更美好

要做到这一点,只靠简单的大模型行不通。

当前的LLM虽然在科学推理、语言理解上很强,但在空间推理和时间计算方面明显不足。而叫车过程却高度依赖于对时空出行信息的理解,比如目的地和出发时间。

此外,叫车涉及多个因素(如等待时间、偏好车型、目的地)来匹配乘客和司机,这可能需要多轮对话。如何主动且自然地引导用户完成订单规划过程,也是一个重大挑战。

为了实现「用嘴打车」,这次滴滴利用「LLM+外部工具」开发了出行Agent「小滴」,可进行精确的时空推理和渐进式订单规划。

告别选车困难,颠覆传统打车

过去,滴滴打车的流程是「输入目的地→选品类→呼叫」,步步都要你来点

更麻烦的是,快车/出租车/专车/特惠等一长串选项,让人眼花。

可以上下滚动的图片

现在变成「表达需求→智能匹配→确认车辆」。

过去,打车的每一步都要你来确认;现在,你只要说句话,小滴就开始找候选车。

更关键的是,这不止是交互的优化,还给用户提供了更实在的体验:多次需求可以一次提出。

过去,滴滴出行主要可选的是时间、地点和车型,现在还可以对车内环境、大小、价格、服务、路线等提出个性化需求。

背后是滴滴借助AI对传统交易的颠覆。在已有的工程和知识积累之上,滴滴实现了AI「个性化叫车」:

首先通过空间映射和时间推理,小滴提取出出行意图(如起点、途经点与终点位置,以及出发与到达时间)。

随后,小滴分析个性化需求,更细致的出行意图分析。

最后,执行逐步的订单规划,生成具体的订单信息。

背后离不开滴滴过去10余年积累的丰富的打车品类、和司机服务评分体系等核心竞争力,以及对服务标签的精细化梳理和分析。

在这方面,滴滴有比较扎实的能力,是核心能力壁垒。

在满足个性化出行需求的同时,用户在最终下单时的选择权也更大了。

结合时间、路况、用户需求等实时信息,小滴一次最多可提供3辆车司机接驾,而过去只能由系统直接指派。

通过改造传统交易流程, 小滴不仅解决了选车困难,而且给用户更好、更自由、更直接的用户打车体验。

凭借行业积累,小滴一句话就能实现不同的出行需求:

个性化打车:不同需求,如空间、车型、价格、时间、环境等个性化需求都能理解

预约用车:提前预约,只需指定时间+地点

订单查询:30天之内历史行程,时间、地点、费用通通都能搞定

小滴不仅界面清爽,操作简单——关键是能「听懂」需求,基于滴滴丰富的车辆和司机信息,就近寻找满足要求的出行方案。

过去操作不仅繁琐,而且选择有限、固定,难以做到因人而异、因时而异。

随着AI能力提升与场景需求涌现,AI Agent进入爆发期。小滴顺势推出,贴合AI时代的出行新方式。

要做最好用的出行Agent,这事比想象中难

在出行场景做AI Agent,难在能不能把「人话」稳稳变成「订单」。

滴滴最近在arXiv挂了一篇出行Agent的论文,详细介绍了滴滴的科研工程攻坚与实践效果。

这篇论文给出的就是一整套硬核工程打法。

时空理解:行业公认的硬骨头

出行对话里,时间和地点的歧义是头号难题

「下周五」、「明早」、「T2」、「博物馆东门」这些词,对用户是日常用语,对模型却是迷宫。

滴滴实测过,哪怕是GPT-4o、Qwen2.5-72B这样的大模型,在出发时间理解只有不到80%的准确率,离生产门槛差一大截

滴滴的做法是直接给模型配上时空工具:

  • 用时间解析器把相对时间换算成绝对时间戳;

  • 用内部 POI 搜索和定位接口把模糊地名映射到唯一坐标;

  • 全部参数结构化后再交给订单系统。

论文消融实验显示,一旦去掉时间工具,订单准确率立刻大幅下滑。

这说明滴滴真正啃下了行业最硬的一块骨头。

多轮下单:从「聊天」到「结构化执行」

出行对话从来不是一句话搞定,往往要补全起点、时间、车型,中途还可能改单。

在这种多轮任务上的会话,业界常见的通用Agent(CoT/ReAct/Reflexion)准确率都显著偏低滴滴论文里把这个问题量化后,才设计了解决方案。

滴滴选择每个任务都变成结构化函数:创建订单、修改、取消各有模板。

模型每轮只需判断参数缺什么,缺了就问。

这种做法在实验里直接把完整对话的订单正确率从6成拉回到9成以上。

对比消融数据:去掉「按目标的结构化函数」,ROA从98.82%掉到66.32%,SOA从96.24%掉到23.28%。这就是硬指标证明。

多场景多模型:质量与时延两手抓

用户对话除了最核心的下单,还可能有问规则、问司机位置、报错澄清、闲聊。

业内常见做法是同一个大模型,结果要么慢要么不稳。

滴滴拆成三类Replier:

  • 专门处理下单补参的;

  • 处理出错和不可行需求的;

  • 检索知识库回答政策的。

简单问答调用微调后的开源小模型(论文中使用了Qwen2-72B等),复杂场景直接上滴滴自研原生大模型。

再加上AWQ量化和Medusa解码加速,把平均响应时间压到4秒以内

这是滴滴在工程上绞尽脑汁的地方——不仅要准,还要快,还要便宜,打破看似「不可能的三角」,才能真正上线服务百万用户。

据悉,滴滴也一直在大模型的前沿领域进行深度探索,目前已有几篇论文入选了今年的国际顶级学术会议如NeurIPS等,其中提到的技术方案相信也被充分运用在此次的AI出行助手中。

滴滴出行MCP服务,Agent打车就像开外挂

年初,黄仁勋说今年是AI Agent之年。

奥特曼发文称,OpenAI确信看到了通向传统意义上的AGI之路,今年Agent将首次进入职场。

据报道,OpenAI视Agent为推理模型之后的AGI第三阶段。之后,先后推出Operator、深度研究、Codex等AI Agent产品或功能。

特别是,OpenAI发布GPT-5,特意介绍了在Agent工具使用能力的基准测试中取得的进步。

DeepSeek最近更新,同样特意展示了Agent测评中的取得的成绩。

Agent真的来了。

不过,许多AI企业更聚焦编程等「硬核」场景。但大部分人更在意的是,Agent真能改变日常生活吗?

正如移动互联网改变了日常生活一样,滴滴用出行Agent小滴证明:AI正在让生活更美好。

今年6月,滴滴企业版也推出内测的AI小滴差旅助手、管理助手、解决方案助手Agent。

对于商务出差的人来说,Agent最终也许能像行政助理那样工作——

分析企业差旅政策如飞机火车标准、酒店金额限制,结合员工偏好,衔接大小交通,生成一站式行程规划,并以「购物车」结算方式交给用户进行预订。

而且国内在AI落地上具有天然优势——互联网用户多,应用场景丰富。

在出行领域,滴滴是绝对的头部玩家。

滴滴在出行领域的专注,积累了大量出行领域的底层基础、商业模式、交互逻辑、用户粘性。

特别是细分领域的扎实积累,更是AI时代价值千金的硬通货。 

凭借这些为滴滴带来的底气,AI Agent逐渐开始普及的今天,小滴也最有可能成为出行领域最好用的AI Agent。

为促进大模型应用创新,滴滴还同步上线了MCP服务,支持AI开发者接入滴滴出行MCP,定制专属智能出行助手。

目前,滴滴支持Cursor、Trae、Cherry Studio等平台接入小滴Agent,接入后自定义的Agent将拥有自主规划出行方案、打车、实时查询订单及自动支付的能力。

感兴趣的开发者参考官网的API调用文档:https://mcp.didichuxing.com/api

比如,小红书博主「AI产品自由」,利用MCP Pro账号30秒完成了打车全流程,推出老年人专属出行方案,Agent打车就像开外挂!


开发者还可将滴滴MCP与其他领域MCP服务组合,探索更多应用落地场景。

想亲自体验小滴带来的全新体验,只需按照下述步骤操作:

更新滴滴App → 目的地栏搜「AI叫车」→ 点「AI出行助手小滴」→ 输入口  令「AI出行用小滴」。

目前口令先到先得,如果抢完了,「AI叫车」输入「预约」也可以获得内测资格,大家快去滴滴App试试吧!

参考资料:
1,AdaR1: From Long-CoT to Hybrid-CoT via Bi-Level Adaptive Reasoning Optimization https://arxiv.org/pdf/2504.21659 
2,Panacea : Mitigating Harmful Fine-tuning for Large Language Models via Post-fine-tuning Perturbation https://arxiv.org/pdf/2501.18100


<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652631330&amp;idx=1&amp;sn=4fc5748c85f1d6914283999742a9a4a0&amp;chksm=f0eb4e3aecc4e58ac68cde19cdc8e45a767bfbbf3cebd312ecd0aa78a6c1fb47b86934f19380&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/jw8P5E9q7y&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们