动态列表

  • 天津大学与快手联手提出GRAG:仅需4行代码,实现图像编辑的“丝滑”微调
  • 美团开源LongCat-Video:136亿参数长视频生成,分钟级推理720p
  • 中科院SNELLA:视觉模型微调新范式,性能超越SOTA,内存占用降低近40%
  • 普林斯顿大学联手谷歌DeepMind,BOB让少样本细粒度分类精度飙升7.4%
  • IROS 2025 | 大连理工等提出STG-Avatar:25分钟训练,单目视频实时生成高保真数字人
  • 看似万能的 AI,其实比你想的更脆弱和邪恶
  • 重建超越RAE,还能做编辑!北大&通义提出UniLIP: 自蒸馏训练助力CLIP大一统
  • 世界模型是否需要显式的 3D?UT Austin 新作 PE-Field 给出答案
  • Feed-Forward 3D综述:三维视觉进入“一步到位”时代
  • CUPID:单图秒速重建3D,港大提出姿态引导新范式
  • 每周100万人与ChatGPT聊自杀;美团推全国骑手社保补贴;高通发AI芯片,股价暴涨20%
  • 美国大学排名出炉:哥大断崖式下滑,MIT稳居CS榜第一!
  • 奥特曼考虑给ChatGPT加广告了!用8亿用户,救万亿债务
  • VaseVQA:考古领域实现专家级,诊断+补弱RL框架
  • 弑母分尸案震惊世界,AI伪造语音骗过警察!
  • 一把吉他卖出 10 亿后,LiberLive 选择自我革命
  • 仅仅是 AI,并不能让硬件更「智慧」,更重要的其实是这个
  • RL记得更牢,SFT更健忘?普林斯顿陈丹琦团队改写后训练认知
  • 多人物也能“认得准”!阿里开源Identity-GRPO,刷新视频生成一致性上限
  • 北京/上海/杭州内推 | 蚂蚁集团保险大模型算法团队招聘大模型算法专家(P6-P7)
  • ICCV'25|开源AI3D数据集Objaverse++:更少的数据,却有更好的生成效果
  • 首个面向大模型的形式化数学竞赛正式启动:推动AI数学推理迈向可验证新高度
  • 川大等提出LG-CD:一句话精准锁定遥感影像变化,F1分数高达91.83%
  • “压缩不减智”!EPIC让多模态大模型以更少 Token 跑得更快、更稳|NeurIPS 2025
  • ​一个对话助理,如何盘活整个「夸克宇宙」?
  • 马斯克 xAI 上新款「虚拟女友」;传小米 17 Air 明年上;996 成美国创业者美德
  • AI黑化如恶魔附体!LARGO攻心三步,潜意识种子瞬间开花 | NeurIPS 2025
  • 可攻可防,越狱成功率近90%!六大主流模型全中招 | EMNLP'25
  • 硅谷的「十万大裁员」:Meta按代码量裁员
  • 超94%类别第一!3D点云异常检测与修复新SOTA | ICCV'25
  • AI人格分裂实锤!30万道送命题,撕开OpenAI、谷歌「遮羞布」
  • 思而不学则殆:通义实验室×北大联合提出RL-PLUS,突破大模型推理边界
  • 博士申请 | 香港中文大学陈玥老师招收人工智能/智能电网方向全奖博士生
  • NeurIPS 2025 | 理解能否反过来教生成?VideoREPA让视频生成模型“懂物理”
  • 上海交大与上海AI lab联手推出RAPO++:跨阶段提示优化,让文生视频模型“更懂你心”
  • NeurIPS 2025 | 港中文等提出COS3D:协同语言与分割,革新开放词汇3D分割
  • 传OpenAI正开发新的生成式音乐工具;苹果将AirPods印度产能扩大一倍;《王者荣耀世界》官宣2026春天见
  • Atlas来了!ChatGPT嵌入浏览器,用谷歌的引擎,革谷歌的命
  • 奥特曼抢走小扎印钞机!Meta「占领」OpenAI,20%都是前同事
  • StereoAdapter:北大首提自监督,适配水下双目深度估计
  • AI杀入美股,DeepSeek又是第一!港大90后开源,AI股神人人都能造
  • 从“Spider”到SAM 3:概念提示分割小考
  • ChatGPT 上线「公司知识库」;Optimus 机器人因「手」再次延期;理想回应 MEGA 起火事件|极客早知道

开源即登榜!登顶全球前十AI编程智能体,UCL初创团队开源Prometheus



  新智元报道  

编辑:KingHZ
【新智元导读】学界杀入主赛道!UCL 校园团队 EuniAI 抛出开源智能体 Prometheus,在 SWE-bench Verified 上 71.2% Pass@1、主榜实锤合并;成本低至 $0.23/issue。

来自伦敦大学学院(UCL)的初创团队EuniAI开源发布了AI软件智能体Prometheus

该系统在SWE-bench Verified上取得71.2%的Pass@1成功率,成绩已被官方确认并合并至主榜单。

令人瞩目的是,这一成果来自高校科研团队,却已与产业巨头同台竞技,展现出学术研发在AI工程领域的产业级突破。

从学术论文到全球榜单
高校科研的「产业级突破」

Prometheus源自论文:

论文地址:https://arxiv.org/abs/2507.19942

开源代码:https://github.com/EuniAI/Prometheus

官网Demo:https://euni.ai/

官方榜单确认:https://github.com/SWE-bench/experiments/pull/339

它不仅通过开源代码和Neo4J知识图谱技术,让AI「读懂代码」,还能在实际GitHub项目中实现自动修复错误、验证补丁,甚至生成可直接提交的修复说明。

🔥全球榜单:成绩亮眼
  • SWE-bench Verified:71.2% Pass@1(官方确认 merge)

  • SWE-bench Lite:35.33% Pass@1(开源模型SOTA)

  • 平均API成本:仅$0.23/issue

技术亮点:让AI真正「理解」代码结构

Prometheus的突破在于:它不是提示工程的产物,而是图结构推理的系统性设计。

统一知识图谱(Unified Knowledge Graph将代码结构整合文件结构、AST抽象语法树和文档信息,将复杂代码库转化为可推理的知识网络,实现多语言语法理解与跨文件依赖分析。

多智能体协作框架(Multi-Agent System)包含六个专职Agent,从问题分类、环境重现到补丁生成与验证,实现端到端自动化开发闭环。

跨语言与可扩展性覆盖Python、Java、Rust、C/C++、Go、TypeScript、PHP、Ruby等主流语言,支持真实世界项目自动构建与测试。

低成本+高可复现性 Prometheus使用DeepSeek-V3模型,性能与GPT-4o相近,但成本仅为其1/9。支持在笔记本级硬件上运行完整修复流程。

在线Demo
从论文到真实工程的桥梁

为展示Prometheus的工程化能力,EuniAI团队在官网上线了交互式演示平台:👉https://euni.ai/

该平台支持用户直接连接项目,选择待修复任务,系统将自动完成以下全自动流程操作:

  1. 自动环境构建与依赖安装

  2. 问题分析与知识图谱检索

  3. 补丁生成与自动验证

  4. 结果可视化与差异对比(Diff View)

目前Demo版本支持Python与多语言项目,提供限量邀请码注册体验,并持续向学术机构与开发者开放内测合作。

我们希望AI不再只是「补代码」,而是理解项目结构、能独立调试和修复的工程伙伴。  ——EuniAI团队


EuniAI团队由UCL助理教授叶荷(HeYe)领衔,成员来自伦敦大学学院、KTH皇家理工学院和CMU等国际高校。

他们以「科研与开源并行」的方式,推动AI智能体真正落地,让学术创新真正服务于软件开发一线。

未来展望

EuniAI团队对下一代智能代码分析与自动修复系统的展望:

Prometheus的愿景,是让AI不仅写代码、修代码,更能理解整个软件生态,并与人类工程师共同进化。

未来,EuniAI团队计划让Prometheus拥有更强的「工程意识」:

  • 智能修复代理(Issue Resolution Agent):自动检测、修复并提交补丁,实现端到端自动化修复。

  • 知识图谱生成(Codebase → Graph):一键将代码库结构化,提升上下文检索与跨语言理解。

  • 项目记忆与学习(Agent Memory + Post-Train Model):让智能体具备项目经验与长期记忆,不断自我优化。

  • 自动构建与验证(Automated Build Agent):生成补丁后自动测试与验证,保障修复质量。

  • 生态集成(MCP & TerminalAutomation):支持Model Context Protocol与终端自动化,构建完整的AI工程流水线。

Prometheus不止是一款智能体系统,它是下一代代码理解与自动修复平台的起点。

🚀立即体验Demo!

👉https://euni.ai/

上传一个项目与待修复任务,见证AI从识别问题、生成补丁、到自动验证的全过程。

(限量邀请码正在开放中🔑)

参考资料:
https://arxiv.org/abs/2507.19942


<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652639180&amp;idx=2&amp;sn=eadaca0d6c178e8aac12dd2b3d4a08b1&amp;chksm=f027ca04cdb620a5dbcb50e7adac2cfa39236778e3e9ad0e2000c48c363b7726f7e38374e056&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/83671/WCQNdKrCUs&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们