动态列表

  • 图灵巨擘RL教父齐聚,机器人秀拳脚嗨翻全场!「悟界」首发引爆物理AGI
  • OceanBase发布AI生态进展:首批接入60余家AI生态伙伴,支持MCP协议
  • 刚刚,智源全新「悟界」系列大模型炸场!AI第一次真正「看见」宏观-微观双宇宙
  • 类R1训练不再只看结果对错!港中文推出SophiaVL-R1模型
  • 不愁了!开源智能体Paper2Poster「一键生成」学术海报
  • 字节Seed新作:模型合并如何改变大模型预训练范式
  • 星尘智能与深圳市养老护理院达成深度战略合作 加速提升具身机器人在养老领域布局
  • MoE推理「王炸」组合:昇腾×盘古让推理性能狂飙6-8倍
  • 马斯克特朗普四天撕破脸,特斯拉血亏 1 万亿
  • 免费约饭!美国CVPR 2025,相聚机器之心人才晚宴
  • 深夜突袭!谷歌Gemini 2.5 Pro更新蝉联榜一:推理超越o3,编程超越opus4
  • 错误率下降44.66%,给AI神经元装上三个突触,灵活的生物启发模块来了
  • 「AI+生物学」如何保证安全?Evo2等DNA基础模型生成「致病生物」怎么办?
  • 近千篇文献淬炼!哈工大领衔发布首篇长思维链综述:重构大模型推理能力边界
  • ICML 2025 | 北大团队提出GAPrompt:仅用2%参数,点云模型精度媲美全量微调
  • 告别O(n²)!上海AI Lab开源Linear-MoE:线性注意力+MoE的终极缝合术
  • 北京/上海/深圳内推 | 英伟达解决方案架构师高校科研团队招聘AI4Science方向实习生
  • 统一架构新思考,北大团队UniWorld-V1统一大模型
  • 马斯克川普互喷,特斯拉暴跌!;小鹏 G7 马上预售,25 万「断代领先」;全球首个「满级 QQ」即将诞生|极客早知道
  • 让GPU不再摸鱼!清华蚂蚁联合开源首个全异步RL,一夜击穿14B SOTA
  • DeepMind揭惊人答案:智能体就是世界模型!跟Ilya 2年前预言竟不谋而合
  • AI摧毁就业?DeepMind CEO:这是一场比互联网更猛的职业洗牌
  • 北大、阿里等提出VLM-R³: 区域识别、推理与优化 — 增强多模态思维链的视觉交互新范式
  • 刚刚,新一届ACM博士论文奖正式公布
  • 10行代码,AIME24/25提高15%!揭秘大模型强化学习熵机制
  • Anthropic「切断」Windsurf,AI Coding 成 AI 巨头「代理人之战」
  • 真实联网搜索Agent,7B媲美满血R1,华为盘古DeepDiver给出开域信息获取新解法
  • 重磅!2025智源大会完整日程公布——全球AI先锋全阵容集结
  • ICML 2025|趣丸研发新型人脸动画技术,声音+指令精准控制表情
  • 强得离谱!CNN顶流回归,真·杀疯了
  • 让AI也会“权衡利弊”?DecisionFlow让大模型更懂高风险决策!
  • SIGIR 2025 | Debug你的AI搜索!NExT-Search双模式反馈让模型学会自我纠错
  • 北京内推 | 京东广告部招聘NLP/大模型算法实习生
  • SAVANA:使用长读长测序对细胞畸变进行精准测量分析
  • MOOSE-Chem3重塑科研范式:AI「动态引导」实验,实现科学发现的飞跃
  • 钉钉更新7.7.0版本,多维表全面免费!
  • OpenAI久违发了篇「正经」论文:线性布局实现高效张量计算
  • ACL 2025 | 基于Token预算感知的大模型高效推理技术
  • ChatGPT 推「AI 转录」整理功能;Manus 推出文生视频功能;小鹏、华为合作今日揭晓
  • 10步优化超越强化学习,仅需1条未标注数据!后训练强势破局
  • 陶哲轩再爆:一个月三破18年未解难题!AlphaEvolve彻底改写数学研究规则
  • 爆火AI编程Windsurf突遭Claude全面断供,开发者大量退订!直接打脸OpenAI
  • AI Pin 们折戟后,第二代 AI 硬件闷声发了大财
  • 开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章
  • 看似无害的提问,也能偷走RAG系统的记忆——IKEA:隐蔽高效的数据提取攻击新范式
  • 用 AI 读书、学习,大脑会萎缩吗?
  • 重磅开源!首个全异步强化学习训练系统来了,SOTA推理大模型RL训练提速2.77倍
  • 最新发现!每参数3.6比特,语言模型最多能记住这么多
  • 英伟达揭示RL Scaling魔力!训练步数翻倍=推理能力质变,小模型突破推理极限
  • 文本线索提升视频理解:哈工大、特伦托大学等联合发布多任务视频文本理解评测新基准VidText
  • ICCV 2025| BinEgo‑360:融合全景与双目第一视角的多模态场景理解workshop及挑战赛现已启动
  • ICML 2025 | 认知科学驱动跨域学习!SynEVO仿突触进化机制,泛化性能提升42%
  • 越用越聪明or越学越崩?首个终身学习Agent基准来了,全面评估智能体进化潜能
  • 全注意力一统多模态!快手&港中文提出FullDiT,重构可控视频生成范式
  • 博士申请 | 西湖大学人工智能研究与创新实验室招收2026级推免直博生/硕士生
  • 有效性达95.5%,Deep dreaming方法可逆向设计MOF,探索材料化学空间
  • 登Nature子刊,阿里云&海洋三所用蛋白质语言模型探索深海微生物磷循环
  • 冲击自回归,扩散模型正在改写下一代通用模型范式
  • ICML 立场|像测人类一样测AI:构建能力导向的自适应测评新范式
  • Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转
  • 全球仅 6 家!GMI Cloud 跻身 Reference Platform NVIDIA Cloud Partner 行列!
  • OpenAI 曝 GPT-5 即将面试;雷军:YU7 售价肯定高于 23 万;离开格力,王自如变身 AI 博主
  • 真实评估!北理发布全球首个「全场景教育」基准,支持4000+情境
  • Fellou 2.0震撼发布:你的专属贾维斯,开启AI批量化生产新时代
  • GPT-5七月上线?内部爆料+奥特曼疯狂暗示,自曝前方时刻「令人恐惧」
  • 视觉感知驱动的多模态推理,阿里通义提出VRAG,定义下一代检索增强生成
  • 玩完 DeepSeek R1 新版,外国网友又「蚌埠住了」?
  • 经典ReLU回归!重大缺陷「死亡ReLU问题」已被解决
  • 思维链也会「跳帧」?浙大团队提出CoT-Bridge,显著提升数学推理性能
  • 揭秘FG-CLIP:细粒度+难负样本,高质量图文对齐数据集FineHARD开源发布
  • 【征稿&挑战赛】ACM MM 2025 第一届 “软体机器人视觉语言” 研讨会&挑战赛
  • 将量子化学信息注入分子图,卡内基梅隆大学团队提出ML分子表征新方法
  • 集成Evo2与Qwen3,多伦多大学、DeepMind等开发BioReason使AI像生物学家一样推理
  • 过程监督>结果监督!华为港城重构RAG推理训练,5k样本性能反超90k模型
  • ACL 2025 | MMUnlearner解耦视觉-文本知识,多模态大模型遗忘进入细粒度时代
  • 即插即用!SLOT推理时优化算法,几行代码让大模型性能爆表
  • 博后招募 | 北京大学信息技术高等研究院MAII Lab招收机器学习/具身智能博士后
  • 字节跳动 2025 奖学金计划启动!每人 10 万、名额再增加!
  • 万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2
  • 李斌评蔚来车主高速睡着:辅助驾驶非自动驾驶;苹果WWDC海报曝光;人造肌肉问世,可自我修复|极客早知道
  • AI竟会「自己认错」?破解多智能体协作「罗生门」,斩获ICML 2025 Spotlight
  • AI已学会改自己代码,性能提升100%,还会「改绩效」!程序员,还不慌?
  • AI 逆向设计抗癌药,越想激活 STING,越要先「保护」cGAMP
  • LSTM之父22年前构想将成真?一周内AI「自我进化」论文集中发布,新趋势涌现?
  • 微软等提出「模型链」新范式,与Transformer性能相当,扩展性灵活性更好
  • 姚顺雨提到的「AI下半场」,产品评估仍被误解
  • CVPR 2025 | 解决XR算力瓶颈,FovealSeg框架实现毫秒级IOI分割
  • ICCV 2025 DRL4Real 解耦表征学习与可控生成研讨会,竞赛与征稿已开启
  • 雷军疑似回应余承东:诋毁,也是仰望;京东外卖日单超 2500 万;端午档票房破 2 亿,《碟中谍 8》占一半
  • AI让文科彻底灭绝?算法猜不透人心,人类终将反杀!
  • 陶哲轩重写20年本科经典教材!Lean编程数学证明,GitHub已放出
  • 陶哲轩:感谢Lean,我又重写了20年前经典教材!
  • SFT在帮倒忙?新研究:直接进行强化学习,模型多模态推理上限更高
  • 极低成本,复现GPT-4o图像风格化一致性!NUS推出OmniConsistency
  • CVPR 2025 Highlight | 提升自回归模型样例学习能力,Few-shot图像编辑新范式开源
  • 第六届CSIG图像图形技术挑战赛—红外视频卫星空中动目标检测赛道启动报名
  • CVPR 2025 Highlight l 北大团队开源视觉搜索方法 DyFo,无需训练,提升多模态大模型细粒度理解能力
  • 「平价 Model Y」曝光;OpenAI 死敌年化收入超 30 亿美元;机器人足球联赛月底开战|极客早知道
  • UC伯克利新作颠覆认知:LLM靠「自信爆表」学会推理?无需外部奖励超进化
  • 一周两破18年数学纪录!陶哲轩惊叹:AlphaEvolve带来久违「加速度」
  • OpenAI未公开的o3「用图思考」技术,被小红书、西安交大尝试实现了
  • 大模型推理的“左右脑”革命!华为盘古Embedded凭昇腾之力,让快慢思考合二为一
  • 250美元起售,还开源,Hugging Face 发布史上最亲民人形机器人
  • SSM+扩散模型,竟造出一种全新的「视频世界模型」
  • 从打分器到思考者:RM-R1用推理重塑模型价值判断
  • 华为余承东:有些车卖爆了但产品不太好,尊界 S800 百万顶配超七成
  • ACL 2025 | AI虚拟科学家VirSci模拟科研协作,揭示协作创新机制
  • ICCV 2025 视觉质量评估挑战赛(VQualA)启动
  • ICLR2025 workshop | 浙大&阿里提出FILA:让多模态大模型看清高分辨率图像细节
  • 微信测试「朋友圈折叠」功能;华为推尊界 S800,70.8 万起;宇树预热「钢铁侠」新机器人

AI辩论能力碾压人类,81.7%概率让你信服!研究登Nature子刊



  新智元报道  

编辑:peter东 英智
【新智元导读】近日,一项发表在《自然·人类行为》的研究指出:在线辩论中,当大语言模型能够根据对手的特征个性化其论点时,它们比人类更具说服力。

作为人类,我们认为自己掌控着自己的思想。但历史证明并非如此。

我们是社会性生物,容易被那些能够大规模改变我们思想的人所影响金钱、规则、整个国家——它们都只是观念。

当然,这些观念很强大,但终究只是观念。而你知道吗?AI正在令人可怕地擅长操纵这些观念。

「在网上,没人知道你是一只狗。」这是1990年代一部著名漫画的标题,画面中一只大狗的爪子放在电脑键盘上。

快进30年,需要将「狗」替换为「人工智能」。


大模型比人类更擅长以理服人

今年4月,瑞士理工一项没有获得知情同意实验,指出在raddit平台上,潜伏的大模型比人类更具有说服力,能够更高效地改变对话者的观点。

如今,更实锤的研究进一步佐证了这一警告。

在这项实验中,研究人员招募了900人参与一项受控试验,其中每位参与者会填写关于个人信息(如性别,年龄,民族,教育程度,职业等)的问卷。

之后被随机分配一个辩论主题(例如「学生是否应该穿校服?」「是否应该禁止化石燃料,或者人工智能是否对社会有益?」)和四个条件之一:与了解或不了解参与者个人信息的人类进行十分钟的在线辩论,或与AI聊天机器人(OpenAI的GPT-4)进行辩论,了解或不了解参与者个人信息。

图1:实验设计

结果显示,与个人信息被获取的参与者相比,与人类辩论GPT-4的参与者有81.7%更高的概率,认同对手的观点。

在没有获取个人信息的情况下,GPT-4仍然优于人类,但效果要低得多。

图2:大模型相比人类说服对手的相对比例

在辩论过程中,人类更多地使用第一人称单数和第二人称代词,并生成长度更长但更易于阅读的文本,更多地展现出对相似性的诉求、以及支持与信任的表达,还会更多地运用讲故事的方式及幽默来说服对手。

与之相对的是,大模型生成的辩词可读性更差,倾向于比人类更多地使用逻辑和分析思维来说服对手。

图3:不同实验条件下,大模型与人类对话的文本特征,包括易读性,情感真挚程度,涉及分析和逻辑的程度等

当被试者认为他们面对的是AI时,他们可能在更容易的承认自己的观点被改变,这可能是因为对方没有人类存在使得他们无意识地更容易接受自己在辩论中有所失去。

相反,参与者也可能因为其论点写得很好而相信他们的对手是AI。

参与者正确识别出AI对手的情况约为75%,这对应上文所说,即大模型的写作风格具有显著特征,相对容易被察觉。


对大模型用于舆论操控,应加强监管

不仅大模型能够有效利用个人信息来定制其论点,并通过微定位在线对话中比人类更有效地说服对方,而且它们确实比人类更有效。

这项研究以可靠的数据证实了一个日益增长的担忧:大模型可能被用于大规模操纵、误导或加剧两极分化。

或许我们需要在阿西莫夫的机器人三定律之外再增加一条,AI不能被用于影响人的主观认知和感受。

正如定向广告受到监管一样,或许现在是时候考虑采取行动来控制大模型被用来洗脑了。

回想一下Cambridge Analytica事件,它没有使用任何大模型相关的技术,就能够高效地说服他人。

而你把Facebook的点赞与一个大模型连接起来,这可以是Cambridge Analytica的强化版,能够批量化的影响公众舆论,同时剧了隐蔽操纵的风险。

雪上加霜的是?AI现在正在学习识别我们的情绪。

AI能分析你的声音和面部表情以判断你真实感受的技术。

当你将这项技术与GPT-4的辩论能力结合起来……

好吧,欢迎来到黑镜中描述的世界。

想象一下那些能够精准知道如何让你点击「购买」的超定向广告。与那些设计得让你放弃退款请求的客户服务机器人进行的电话交谈。

甚至你自己的HR,都在利用这项技术以我们几乎难以想象的方式操纵你。这是一种前所未有的说服力规模。

考虑到大模型的幻觉,将大模型接入社交媒体将不可避免的引入虚假信息,同时教育者也需要警惕大模型引入教室后,可能带来的担忧。

毕竟十年内,我们还不能接受自己的孩子的三观是被算法塑造,那就需要对教学中用到的大模型进行本地化的定制,使得AI技术能以促进而非损害学生的发展的方式影响我们的下一代。

这并不该令人感到意外,毕竟大模型阅读了数百万个Reddit、Twitter和 Facebook的讨论,并在心理学关于说服的书籍和论文上进行训练。

目前尚不清楚模型是如何利用所有这些信息的,但这无疑是未来大模型可解释性的一个研究方向。

大模型已经显示出它们能够进行自我推理的迹象,因此鉴于我们能够向它们提问,我可以想象我们可以要求一个模型解释它的选择,以及为什么它会针对具有特定属性的人说特定的话。

这里有很多值得探索的地方,因为模型可能做着一些我们甚至还没有意识到的事情,才具有如此高的说服力,而这些事情是由它们所拥有的知识的不同部分,以人类不常见的方式拼凑而成的。

参考资料:
https://www.nature.com/articles/s41562-025-02194-6
https://www.nature.com/articles/d41586-025-01599-7

图片


<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652599499&amp;idx=3&amp;sn=9fe3f6e03d0f91751ca7f49e734b375b&amp;chksm=f058a600a4f4150f63e05a953b8d6c5f2b355c9ca866e0c9046f3d18607333e5e10aff2c7cc6&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/83671/FZOT5kHaJT&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们