动态列表

  • OpenAI开源霸权5天终结,百川M2一战夺冠!实测比GPT更懂中国医疗
  • 硅谷精英放弃生娃!MIT女记者揭秘:人类只是AI垫脚石,世界很快就毁灭
  • 41个榜单SOTA!智谱最新开源GLM-4.5V实测:看图猜地址、视频秒变代码
  • 2025全球大模型应用报告:红海混战「忠诚度」瓦解,用户脚踏4.7条船!
  • 昆仑万维发布新模型 SkyReels-A3,开启五天技术发布周
  • 世界机器人大会:笨拙的今天,与狂奔的明天
  • 「一只手有几根手指」,你的GPT-5答对了吗?
  • 4D空间智能:AI如何一步步「看懂」时空结构?一篇综述解析通往四维世界的五大层次
  • 智谱终于发布GLM-4.5技术报告,从预训练到后训练,细节大公开
  • 从捍卫者到引路人,上交&上海AI Lab提出LEGION:不仅是AI图像伪造克星,还能反哺生成模型进化?
  • ICCV 2025 | 机器人自主探索未知复杂空间?GLEAM破解主动探索建图的泛化难题
  • 脑子比不过AI,手也要沦陷了?这只灵巧手看得我有点慌
  • 第二届 “兴智杯” 全国人工智能创新应用大赛专题活动明天开启,技术解析 + 资源对接一站式平台重磅来袭!
  • 机器人上下文协议首次开源:阿里达摩院一口气放出具身智能「三大件」
  • Attention Sink产生的起点?清华&美团首次揭秘MoE LLM中的超级专家机制
  • 具身智能技术与应用论坛圆满举行,北京人形公布多项创新成果
  • ACL 2025 | 湖南大学、腾讯生命科学实验室等提出蛋白互作预测新方法,让LLM学会解读蛋白质网络
  • 宇树、银河通用都在用:英伟达「物理AI」技术亮相世界机器人大会
  • 毒液抗菌搭配深度学习,千万级数据组中筛得386条备选,91.4%体外验证成功
  • 马斯克:可能失去特斯拉控制权;何小鹏:听雷军劝,全新 P7 做 24 小时耐力测试;传华为将发 AI 推理突破成果
  • OpenAI惊人自曝:GPT-5真「降智」了!但重现「神之一手」,剑指代码王座
  • AI正在掏空大脑,思想沦为残废!未来只分AI的「主人」和「奴隶」
  • 刚刚,谷歌摊牌:Genie 3让你1秒「进入」名画,人人可造交互世界!
  • 突破40年Dijkstra算法瓶颈,清华教授等颠覆教科书!斩获STOC最佳论文
  • 小红书为什么要做“漫展”?
  • 腾讯张正友:具身智能必须回答的三个「真问题」
  • token危机解决?扩散模型数据潜力3倍于自回归,重训480次性能仍攀升
  • 联合理解生成的关键拼图?腾讯发布X-Omini:强化学习让离散自回归生成方法重焕生机,轻松渲染长文本图像
  • 40年后,Dijkstra算法极限再被突破,清华段然团队更快最短路径算法摘STOC最佳论文
  • GPT-5 发布后遭用户吐槽,GPT-4o 重新上线;苹果创五年多来最大单周涨幅;暑期档电影总票房破 80 亿元:《南京照相馆》超 20 亿|极客早知道
  • Gemini再揽金牌,力压大学学霸,AI数学推理时代来了!
  • 内幕曝光:OpenAI模型坦承不会第六题,3人俩月拿下IMO金牌!
  • 实测GPT-5 Pro:别被普通版骗了!Pro才是OpenAI真正的顶级模型
  • GPT-5问题太多,奥特曼带团回应一切,图表弄错是因「太累了」
  • ARPO:智能体强化策略优化,让Agent在关键时刻多探索一步
  • ICCV 2025 | 新型后门攻击直指Scaffold联邦学习,NTU联手0G Labs揭示中心化训练安全漏洞
  • 用户痛批GPT-5,哭诉「还我GPT-4o」,奥特曼妥协了
  • 上海AI Lab、浙大EagleLab等提出RRVF:利用「验证非对称性」,只输入图片学习视觉推理
  • 银河通用亮相 2025 世界机器人大会,搭载英伟达最新 Thor 芯片,Galbot 全球首发震撼登场
  • 李想称知道哪个品牌在黑理想;比亚迪:App 将继续使用「比亚迪」原名;世界机器人大会开幕 | 极客早知道
  • 银河通用WRC首发英伟达Thor,银河太空舱世界首创城市级机器人应用
  • OpenAI o3封王,4比0横扫马斯克Grok 4!全球大模型对抗赛完美收官
  • 单机狂飙4万亿参数,国产AI「四大天王」首次合体!这台超节点鲨疯了
  • 首篇WebAgents综述:大模型赋能AI Agent,实现下一代Web自动化
  • 维他动力Vbot:当遥控器被丢掉,才是机器狗「有生命感」的第一步?
  • 挤不动的世界机器人大会上,自变量秀出了真·通用具身智能
  • 4比0横扫Grok 4,o3强势夺冠,首届大模型对抗赛结果出炉
  • 扩散LLM推理新范式:打破生成长度限制,实现动态自适应调节
  • GPT-5真的拉胯吗?机器之心一手实测,网友:还我4o、还我4.5
  • 从Debugger到Developer : 低代码时代新基准NoCode-bench,SWE-Bench作者力荐
  • 上天入地,从内而外:大疆 DJI OSMO360 深度评测
  • 「贴地飞行」:大疆 ROMO 扫地机器人首发体验
  • 「油车智障」的招牌,被奥迪一脚踢开
  • GPT-5 来了,多项能力屠榜;OpenAI 给所有员工发 150 万美金奖金;特朗普喊话英特尔 CEO:必须立即辞职
  • 刚刚,奥特曼发布GPT-5!人人免费用「博士级」智能,基准图错误遭全网吐槽
  • 北大、字节跳动联手发布SWE-Swiss:一把修复代码Bug的「瑞士军刀」,完整配方直指开源SOTA
  • 刚刚,小红书开源了首个多模态大模型dots.vlm1,性能直追SOTA!
  • 一夜颠覆Sora神话,H200单卡5秒出片!全华人团队开源AI引爆视频圈
  • OpenAI GPT-5 发布:模型能力全面「屠榜」,构建「超级智能」的第一步
  • 从能展示到能顶岗,人形机器人的「上班时刻」到了吗?
  • 行业唯一大电池旗舰性能机,iQOO Z10 Turbo+ 2199元起正式发布
  • 云计算一哥首度牵手OpenAI,大模型「选择」自由,才是终极胜利
  • 颠覆互联网的下一波浪潮:Agentic Web来了!
  • 三重激励+全周期扶持,即梦升级这个计划,让AI创作者的成长有迹可循
  • DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO
  • 硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构
  • 让AI读懂「言外之意」:AI4SG团队发布首个心理健康污名语料库,破解隐性偏见识别难题
  • 谷歌开源DeepPolisher,基因组组装错误率减半,Jeff Dean:令人振奋!
  • AI 能造世界了?谷歌 DeepMind 的 Genie 3 分秒生成《死亡搁浅》
  • 一块钱的AI,开始审判人类
  • 您猜怎么着?Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了
  • 人大高瓴-华为诺亚:大语言模型智能体记忆机制的系列研究
  • 3秒级破百+820km续航,全新小鹏P7定义智能轿跑新标准
  • 傅利叶发布全新人形机器人“Care-bot”GR-3,定义"有爱的"交互新范式
  • GPT-5 发布时间定了;宝马 i 系列汽车设计主管 Kai Langer 宣布加入小米;消息称爱奇艺拟赴港上市融资 3 亿美元
  • 鼠标的未来是手环?解码肌肉信号,Meta黑科技登上Nature
  • Claude Opus 4.1代码实测惊人!OpenAI开源模型却只会写屎山?
  • 爆冷!首届大模型争霸,Grok 4下出「神之一手」?DeepSeek、Kimi惨遭淘汰
  • 全球独家首测Genie 3,实验室细节曝光超震撼!AGI最后一块拼图已实现
  • ICML2025|探索损失加权机制的本质以实现更好的LLM反学习
  • 快270倍,精度超93%,浙大侯廷军、康玉团队等全新扩散生成模型,树立蛋白质-多肽对接新标准
  • 群核科技InteriorGS数据集登顶全球开源榜首
  • Grok 新上的 AI 视频生成,自带「擦边」模式,马斯克靠「踩黄线」称霸 AI?
  • 闹玩呢!首届大模型对抗赛,DeepSeek、Kimi第一轮被淘汰了
  • Token成本下降,订阅费却飞涨,AI公司怎么了?
  • ICCV 2025 | SeaS: 工业异常生成+正常合成+精准掩码大一统框架,指标全面碾压SOTA
  • 第十三届互联网安全大会:多智能体蜂群掀起安全与 AI 融合革命
  • 震撼,世界模型第一次超真实地模拟了真实世界:谷歌Genie 3昨晚抢了OpenAI风头
  • 就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1
  • 北大、蚂蚁三个维度解构高效隐私保护机器学习:前沿进展+发展方向
  • OpenAI重新开源!深夜连发两个推理模型,o4-mini水平,笔记本、手机可跑
  • Discrete Tokenization:多模态大模型的关键基石,首个系统化综述发布
  • 今年CJ,AI 成了游戏产业的「必答题」
  • OpenAI 完成 80 亿美元融资,估值 3000 亿;宇树发布新一代机器狗;英伟达深夜发声:不存在后门、终止开关、监控软件|极客早知道
  • 面向6G环境感知通信!西电开源3Dx3D无线电地图数据集与生成式基准框架
  • 黄仁勋预言成真!AI智能体成GitHub主力,一天顶人类一年
  • 谢赛宁「踩雷」背后,竟藏着科研圈更黑真相:Science实锤论文造假+AI滥用!
  • AI将消灭中产阶级!前谷歌高管惊人预警:未来只剩金字塔尖0.1%和底层
  • 电商上演「魔法对轰」:卖家用AI假图骗下单,买家拿AI烂水果骗退款
  • 科研写作神器,超越Mathpix的科学公式提取工具已开源
  • Nature丨首个AI生成的基因编辑器,脱靶率更低、免疫更轻,兼容碱基编辑
  • 谷歌约战,DeepSeek、Kimi都要上,首届大模型对抗赛明天开战
  • 南大周志华团队最新力作:一个算法通吃所有,在线学习迎来新范式?
  • 这个WAIC展台旁,围满小朋友
  • 全球首个人形机器人通用视觉感知系统,Humanoid Occupancy建立多模态环境理解新范式
  • 技术岗位占比超90%,AI岗位占比近5成!淘天集团开启2026届秋招
  • OpenAI 官宣周活 7 亿;特斯拉宣布马斯克获授价值 290 亿美元股票;苹果脑控技术首次现场演示 | 极客早知道|极客早知道

AI「解码」古罗马,重现千年铭文真相!DeepMind新模型再登Nature



  新智元报道  

编辑:peter东 英智
【新智元导读】爱在西元前的歌词里唱到:当古文明只剩下难解的语言,传说就成了永垂不朽的诗篇。如今借助DeepMind推出的生成式AI工具Aeneas,考古学家面对古代碑文不再抓瞎了。

Aeneas原本是古希腊神话中流浪英雄。

出现在7月24日Nature主刊的Aeneas则是一个多模态生成式神经网络,它能帮助历史学家更好地解读、归属和修复残缺文本。

想象考古学家在欧洲发现了一块刻有古代文字的铭文,文本残缺不全、部分文字被风化或被故意破坏。

也没有语境信息,这使得恢复、确定年代和定位这块铭文的出处变得几乎是不可能的,尤其是在比较相似的铭文时。

考虑到在罗马世界,文字无处不在——从帝国纪念碑到日常用品,无不刻有文字。从政治涂鸦、爱情诗篇和墓志铭,到商业交易、生日邀请和魔法咒语。

图1 由Aeneas修复的,公元113/14年来自萨丁岛的青铜军事命令,由皇帝Trajan授予一艘战船上的水手

这些铭文为现代历史学家提供了丰富的见解,揭示了罗马世界日常生活的多样性。

但也增加了考古工作的难度,考古学家需要依赖其专业知识检索自身积累的数据库,方可识别相似文本——这些文本在措辞、句法、标准化公式或来源方面具有相似性。

然而检索相似的信息,为文章确定上下文,不就是生成模型适合的活吗?

于是Aeneas出现了,它能够跨越数千份拉丁铭文进行推理,在几秒钟内检索出文本和语境相似文本,这样的加速度,让考古学家从检索文本这项复杂且耗时的工作中解脱出来。

如今他们能快速地拿到对古代铭文的解释,并基于模型的发现进行进一步研究。

图2 Aeneas的使用界面


Aeneas的丰富功能

在Aeneas出现之前,2022年Deepmind推出了Ithaca,这是一个基于深度神经网络预测古希腊铭文年代,并补全缺失文本的工具。

Aeneas则更进一步,它能帮助历史学家解读文本,通过提供上下文,赋予孤立片段意义,从而得出更丰富的结论,并整合对古代历史的更好理解。

具体来看,它在庞大的拉丁铭文集合中搜索平行文本。通过将每个文本转化为一种历史指纹,Aeneas可识别出文本间的深层联系。

在年代和出处预测方面,Aeneas能够将文本置于历史学家提供的日期范围内13年内,以72%的准确率将铭文归入62个古代罗马行省之一。

作为首个利用多模态输入确定文本地理来源的模型。它可同时分析文本和视觉信息,例如铭文图像。

不同于只能预测单个词的Ithaca,Aeneas够修复文本中缺失长度未知的段落。

Aeneas能以73%的准确率修复最多十个字符缺失的损坏铭文。当修复长度未知时,准确率也会有58%。

这使得它成为处理严重损坏材料的史学家的更通用的工具。

Aeneas不仅适用于铭文,还可以适应其他古代语言、文字和媒介,从莎草纸到硬币,扩展其功能以帮助连接更广泛的历史证据。

想试用Aeneas的可登录predictingthepast.com,以交互式使用。

作为开源软件,中国的考古学家也可以调整Aeneas,让Aeneas能够用于解读诸如西夏文,契丹文等失传的中国古迹。

工作原理和典型案例

为了训练Aeneas,Deepmind的研究者精心策划了一个庞大且可靠的数据集,借鉴了数十年来历史学家的工作成果来创建数据集,其中包括了古希腊和罗马时代铭文的文本和图像。

Aeneas使用了NLP领域的大杀器transformer来处理碑文文本输入,并通过解码器检索相似的碑文,并按相关性排序。

对于每块铭文,Aeneas的语境化机制使用一种称为嵌入的技术检索一系列相似物——将每块铭文的文本和语境信息编码成一种包含文本内容、语言、来源时间地点以及与其他碑文关联性的历史指纹。

图3 Aeneas的架构,展示该模型如何接收文本和图像输入以生成省份、日期和修复预测

接下来看Aeneas解析古代文本的一个典型例子。

古罗马皇帝奥古斯都以第一人称成就记述《功业记》,这是古罗马历史中一块著名的石碑,这份铭文由奥古斯都亲自撰写、是其自我夸耀的终身成就的总结。

文本中出现了对帝国夸张的描述、无关的日期和虚假的地理标志,而且学界对其撰写的时间也存在争议。

历史学家们长期以来一直争论这块铭文的年代。Aeneas将所有碑文的模糊年代和来源特征进行语境化分析。

它捕捉到了拼写和词汇的线索,以及表明微妙政治意识形态和帝国归属的语言学细微差别。

其预测基于文本中提到的微妙语言特征和历史标志,如官方头衔和纪念碑。

通过将年代问题转化为基于语言和上下文数据的概率估计。

有趣的是Aeneas并没有预测一个固定的日期,而是产生了一个可能的日期分布的详细情况,如图4所示。

其预测呈现两个明显的峰值,一个较小的峰值出现在公元前10-1年左右,一个较大的、更自信的峰值在公元10-20 年之间。

这些结果说明Aeneas给出的预测是谨慎的,其反映了当前学者们意见的差异。

给出了两个可能的日期范围,而不是单一的预测,反而说明了Aeneas能够历史辩论提供了一种新的、定量的方法。

图4 Aeneas对《功业记》年代归属预测的直方图,该模型模拟了围绕这一著名碑文年代测定所展开的学术辩论

近期,有不少将AI技术应用于考古领域的尝试,从为无名老兵做面部复原,到博物馆里对古人构建数字虚拟替身,AI在考古及历史领域的应用值得关注。

去年复旦大学更是开设了AI考古的课程,华南理工大学深度学习与视觉计算实验室(SCUT-DLVCLab)也曾推出的专注于古籍文言文处理的通古大模型。

面对中国浩如烟海的古籍古碑,未来的考古学家,或许更需要像Aeneas这样的工具,来从海量数据中淘金。

参考资料:
https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/
https://www.nature.com/articles/d41586-025-02335-x
https://blog.google/technology/google-deepmind/aeneas/


<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652618457&amp;idx=3&amp;sn=010b1c845bf675a1d1dccacc5e8bf366&amp;chksm=f00a0f566aadb547db58e11f581b4a5c6f27614bf8a434a0d1f582450758fb39ce5160108482&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/l6vAer5luo&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们