动态列表

  • Karpathy「疯狂之作」:100美元、4小时,就能训练你自己的「小型GPT」
  • 英伟达AI超算3999开售,「掌心之中」可部署所有大参数开源模型!
  • AI圈再颠覆!中国AI翻译耳机通话翻译,实测震撼
  • 一个模型装下整个物种树!伯克利GPN-Star斩获基因预测双料冠军
  • vivo X300 Pro:以「水桶旗舰」之躯,重登旗舰山巅
  • 直到毕业我才懂:原来延期的博士,不止我一个
  • 让论文自己讲!Paper2Video一键生成论文讲解视频,赶顶会DDL不慌了
  • 8美元“驯服”DeepSeek-V3.2?Training-Free GRPO把RL成本打到地板
  • NeurIPS 2025 | 让AIGC视频变为可探索场景:Instant4D实现单目动态场景的分钟级重建
  • NeurIPS 2025 | PPFN:渐进式提示融合,让红外图像增强在复杂场景下性能提升8.76%
  • 库克抖音带货 iPhone 17 Air,22 日开售;小米客服回应「SU7 门把手」;「丐版」特斯拉明年国内投产
  • 他用一生证明AI没有意识!「中文屋」提出者逝世,享年93岁
  • 今年诺奖成果曾遭质疑无用,但华人团队用它研制了未来芯片的「钥匙」
  • 剑桥揭开大模型翻车黑箱!别再怪它不懂推理,是行动出错了
  • ICLR神秘论文曝光!SAM3用「概念」看世界,重构视觉AI新范式
  • 硅谷爆发反AI「起义」!程序员拒用Cursor被一周解雇
  • 如果RL可预测,我们还需要把训练跑满吗?中科大揭示参数更新的线性秘密
  • 强化学习再迎范式切换:Sergey Levine团队把目标改写成“到达时间”
  • 国行 eSIM 尘埃落定,iPhone Air「下周见」
  • 为什么谷歌搜不到「没有条纹的衬衫」|AI 上新
  • SAM 3揭开面纱:不止分割万物,更能理解概念,交互式分割迎来新篇章!
  • ACM MM2025 Oral | MoSEAR:为多模态情感推理补齐“冲突场景”的短板
  • 雷军亲自测试,小米YU9实车谍照曝光;宇树获「秧歌机器人」专利;微团开卖「Win XP」蓝天白云拖鞋
  • 永别了,人类冠军!AI横扫天文奥赛,GPT-5得分远超金牌选手2.7倍
  • 濒死3次,医生判他死刑!宾大教授奇迹自救,誓用AI攻克14000种绝症
  • 告别「解码器饥饿」!中国科学院NeurIPS推SpaceServe,高并发克星
  • Bug变奖励:AI的小失误,揭开创造力真相!
  • 复旦张军平:人类是硅基生命过渡体?
  • Meta Ray-Ban Display 首发体验合集:悬浮在现实中的一张便签
  • OriginOS 6 深度体验:当操作系统回归「体验为王」
  • Mamba-3惊现ICLR 2026投稿:三重升级打满“推理优先”范式
  • 93%成功率!从“改提示”到“写剧情”:STaR-Attack用叙事推理攻破大模型防线
  • NeurIPS 2025 | Latent Harmony:潜空间和谐共生,实现UHD图像修复新SOTA
  • NeurIPS 2025 | NTN-Diff:一石二鸟,利用空文本与频率感知破解图像修复难题
  • 马斯克脑机公司展示脑机控制机械臂;三星中国发布折叠屏新机,16999 元起售;滴滴自动驾驶获 20 亿元融资 | 极客早知道
  • 77岁「AI教父」Hinton:AI早有意识!我们打造的智能,可能终结人类文明
  • 全球首款1.8nm芯片亮相!华人CEO打响关键一战,英特尔杀回来了
  • 清华万引教授:万倍加速催化剂设计,AI突破DFT瓶颈!
  • 陶哲轩亲测!GPT-5 Pro 40分钟破解3年难题,登顶最难数学考试
  • 刚刚,Meta风雨飘摇中发了篇重量级论文,作者几乎全是华人
  • Attention is NOT All You Need:让“深度”重新流入时间,而非堆叠在参数之上
  • NeurIPS 2025 Oral | 1个Token零成本,REG让Diffusion训练收敛快20倍!
  • OpenAI 卖货做视频,Anthropic 专心写代码,谁能赢?
  • 一颗 1.8 纳米芯片,成了英特尔「最后的救赎」
  • 这款 AI 调研神器,让我一键产生 1000 个「种子用户」|AI 上新
  • 都用 GPT,为什么你没法中「百万大奖」?
  • ChatGPT 变身 App Store,「对话即应用」时代到了
  • IROS 2025 Oral | RAG-6Dpose:三大创新模块,利用 CAD 作为知识库进行检索增强 6D 姿态估计
  • IROS 2025 | 速度飙升24倍!巴黎萨克雷大学等提出HARP-NeXt:实时3D激光雷达分割新标杆
  • 「丐中丐」版特斯拉来了,Model 3/Y降价超3.5万元
  • 高德扫街榜的 23 天奇袭
  • 张一鸣近年来首次公开亮相;微软上海开始新一轮裁员,补偿N+4;罗永浩锐评 iPhone 17
  • GPT-5王者归来?奥特曼称AI已跨科学门槛,三大学科正迎来实质性突破
  • 老黄押宝「美版DeepSeek」!谷歌天才叛将创业,一夜吸金20亿美元
  • 任意Agent皆可强化学习!微软推出Agent Lightning框架,无需修改任何代码
  • 13万被引!ImageNet作者苏昊或将加盟复旦
  • 250份文档投毒,一举攻陷万亿LLM!Anthropic新作紧急预警
  • 和两位 CEO 聊 Sora: 应用层爆发的里程碑事件,创业者的机会来了
  • 新一代短剧人,涌向郑州「淘金」
  • 社交媒体的黄金时代,结束了
  • U-Bench:U-Net十年“大乱斗”终结者,100个变体、28个数据集的终极对决
  • 东京大学、牛津大学等联合发布VLA万字综述:机器人迈向通用智能的全栈指南
  • 北京/上海内推 | 阶跃星辰招聘RL for AIGC方向算法研究员/实习生
  • EMNLP 2025 | 拨云见日:知识电路分析揭示大语言模型“知识遮蔽”幻觉之源
  • DeepSeek苦练1T,清华只用5B?InfLLM-V2把稀疏注意力玩明白了
  • Sora 下载量破 100 万次;国庆中秋假期国内游总花费超过 8000 亿元;智驾多位核心高管离职,蔚来回应|极客早知道
  • 谷歌杀入诺奖神殿,两年三冠五得主!世界TOP3重现贝尔实验室神话
  • OpenAI×英伟达,可能创造了人类史上最大万亿级泡沫
  • H-1B正在筛掉「下一个英伟达」?
  • 全球AI视频大战升级!「中国版Sora」Vidu Q2参考生月底发布,能力对标Sora 2
  • 第二代InfLLM开源,同尺寸快三倍!零参数,可训练稀疏注意力
  • 腾讯推出TRM:让大模型像人类一样批判性思考,从文本依赖到事实正确
  • 马毅团队重磅发布新书:从MCR²到白盒Transformer,重构深度学习的第一性原理
  • 稳住训练、跑出泛化:STAGE重写「自回归图像生成」的强化学习范式
  • Diffusion²来袭:威斯康星大学&华盛顿大学等提出双扩散模型,“回溯历史-预测未来”,破解自动驾驶“鬼探头”难题
  • 北大等提出TrackVLA++:赋予机器人推理与记忆,跟踪成功率飙升12%
  • 把我的第一次日本旅行,完全交给 AI 是什么体验?
  • 英伟达将投资马斯克的 xAI;低价版Model 3/Y 「阉割」智驾功能;微信推出批量撤回信息功能
  • 刚刚,清华物理传奇Yao Shunyu,跳槽谷歌DeepMind!
  • 赚100亿,烧1万亿!OpenAI算力神话:英伟达撒钱、AMD送股、全硅谷陪跑
  • 英伟达垄断AI算力局面或将被颠覆!AMD赌上身家发起决斗,奥特曼窃喜
  • 刚刚,2025年诺贝尔化学奖揭晓!偷溜进图书馆的少年,改变了世界
  • 小心,AI依赖会让你变笨!吴恩达等专家教你如何正确使用AI
  • 无RLHF,7M小模型反超DeepSeek-R1:三星团队用递归思考取代规模堆叠
  • 告别深度传感器!慕尼黑工业大学提出DropD-SLAM:仅用单目RGB即可实现RGB-D级的SLAM精度
  • IROS 2025 | Waymo与谷歌DeepMind联手提出Drive&Gen:用生成视频评估自动驾驶,虚拟测试更逼真

登顶Hugging Face GAIA全球榜首!中兴超级智能体终结「AI黑盒」时代



  新智元报道  

编辑:好困
【新智元导读】在杭州奥体中心演唱会现场,一套名为「Co-Sight 2.0」的AI系统成功保障了网络稳定,其背后是中兴通讯研发的、新近登顶Hugging Face GAIA全球权威榜单的超级智能体。


演唱会现场,数万个手机屏幕汇成一片星海,网络性能正面临极限的挑战

后台,没有一群焦头烂额的工程师,只有一套AI系统在冷静地调度。

它预测到流量洪峰,提前规划了网络重路由方案,并派出一个「行动智能体」执行,同时还有一个「验证智能体」在旁监督,确保万无一失。

这不是科幻电影,而是发生在杭州奥体中心的真实一幕。

这套系统的核心,正是刚刚登顶Hugging Face全球权威榜单的「中国造」超级智能体——Co-Sight 2.0。


Hugging Face榜一被「中国造」拿下
Co-Sight2.0凭什么领跑全球?

在Meta与Hugging Face联合打造的GAIA评测基准(覆盖复杂任务规划、跨工具调用、多模态理解等12类核心能力的全球权威榜单)中,中兴通讯开源的Co-Sight超级智能体2.0以87.04%的综合成绩蝉联榜首,其登顶底气源于对传统智能体三大核心痛点的精准击破:

这一突破并非偶然。中兴与中国移动联合开发的「多智能体协同赋能端到端网络自动化运维」方案,已在杭州奥体中心演唱会、西安大唐不夜城等场景验证实效。其中,前者实现监控人员投入减少30%,后者达成场景流量提升20%。

不仅如此,该方案更斩获2025年GSMA Foundry网络效率及优化大奖,成为技术落地的有力佐证。


从「痛点」到「突破」
Co-Sight 2.0以创新架构领跑


据前瞻产业研究院数据,2025年国内智能体相关公司单笔融资均值较2023年增长280%,但快速增长的背后仍面临诸多痛点:

智能体在垂直行业遭遇「私域鸿沟」难以落地、暴力检索信息利用率低、扁平化记忆引发的「认知短视」、AI黑盒化带来的决策信任危机等,让多数智能体始终停留在「能用」却「不敢放心用」的阶段。


中兴通讯Co-Sight 2.0之所以能在GAIA榜单中脱颖而出,核心在于它针对传统智能体的核心短板,给出了能落地、可验证的解决方案。

全链路可信计算框架:筑牢数据信任基石


针对通信行业「认知断层(难获隐形知识)」与「数据壁垒(跨系统数据难关联)」,Co-Sight 2.0构建「可信信息金字塔」五级架构,为每一步数据处理打上「可信钢印」:

  • 五级架构落地(以通信网络为例)

1. 多源异构感知层:接入SNMP trap、Syslog、视频、代码等全量通信数据源,奠定数据基础;

2. 原子事实提取层:通过广义图谱技术,将非结构化日志(如「process xxx crashed with code 0x1f」)转化为结构化事实({时间:T, 事件:进程崩溃,关联:CPU尖峰}),挖掘资深工程师的「隐形知识」;

3. 权威知识验证层:对照CMDB拓扑、厂商文档等权威库,验证数据真实性(如确认RouterA及接口存在性),剔除错误信息;

4. 逻辑自洽推理层:构建事件关联图谱(如RouterA接口Down导致ServerB无法访问),校验推理链条无矛盾;

5. 可信决策生成层:筛选高可信度信息形成「黄金上下文」,输入大模型生成决策,避免「垃圾进、垃圾出」。

破局价值既通过原子事实提取将隐性经验转化为机器可理解知识,又通过跨域数据溯源(如关联BSS投诉与EMS基站告警并提供完整证据链),打通数据壁垒并建立信任,为后续决策提供可信基座。

孪生推理引擎机制:深思熟虑、预见风险


针对传统AI「线性推理鲁莽、执行效率低、专业度不足」的问题,Co-Sight 2.0以三大解决方案构建孪生推理引擎机制,适配通信行业高风险、复杂任务需求:

方案1:深度思考预测——多路径推演规避风险

接收任务(如「解决A区域视频会议卡顿」)后,不直接执行,而是生成多套计划(调整基站QoS、承载网重路由、重启UPF),通过潜变量建模预测每步结果(如计划A有15%影响VoLTE、计划B需5分钟迁移),选择最优低风险方案,避免「试错式」决策。

方案2:DAG并行思考——结构化提升效率与鲁棒性

分解复杂任务(如「开通5G企业专线」)为DAG结构,识别并行子任务(如「核心网配置」「承载网隧道建立」「无线网参数下发」同步执行),既缩短耗时,又能单独纠错(某子任务失败不影响整体),解决传统线性工作流「脆弱低效」问题。

方案3:多智能体子空间——专家分工提升精度

如细分「规划Agent」与「行动Agent」,规划Agent制定宏观策略(如「限流→疏导→扩容」解决拥塞),在总体解决方案子空间寻优最佳方案;行动Agent聚焦细分领域,在行动或执行子空间选择执行策略,避免单一智能体「全能但不精」的缺陷,适配通信网络多厂商、多技术域场景。

AI工具进化引擎:主动破壁、自我迭代


针对「数据壁垒(系统无接口)」与「工具失配(异构工具难调用、经验难传承)」,Co-Sight 2.0打造「感知-决策-进化」飞轮,实现工具动态进化:

破壁:动态架设数据桥梁

发现数据孤岛(如厂商私有网管与统一告警平台无接口)时,自动分析API文档 / 数据格式,生成连接器工具(Python脚本),实时打通数据链路,解决「遇壁垒无计可施」问题。

进化:安全边界内迭代工具与经验

支持AI自主优化工具(如重构低效诊断脚本),并学习人类经验(将工程师复杂故障处理流程固化为自动化工作流),且所有进化均在推理孪生引擎的安全验证体系内进行,形成「探索→创造工具→能力提升」的正反馈。

核心牵引:全链路可信评价机制

以信息可信为约束,确保工具进化方向符合业务需求,既解决当下工具失配问题,同时又赋予系统应对未来未知挑战的持续生命力。


智能体工厂+开放互通标准


智能体工厂是一个「易用、开放」的智能体开发与管理平台。它将上述所有创新能力,封装为模块化的组件。

企业用户无需成为AI专家,就可以通过拖拽式编排或自然语言定义任务的方式,像在生产线上组装汽车一样,快速构建出满足自身特定场景需求的专属AI智能体应用。

它内置了丰富的行业模板库(如「光缆中断应急处置」、「VIP客户网络质量保障」),让智能体的构建从「发明」变成「配置」。

三大开放标准:为了打破智能体生态的孤岛,Co-Sight 2.0率先开源了业界首个三层智能体交互协议Co-TAP,该协议包含三部分内容,包括:

  • 人机协同协议(HAI):标准化人和Agent之间的任务分配、进度汇报、权限确认接口。

  • 统一的多智能体协作协议(UAP):标准化不同功能Agent之间的工作流交接、上下文传递和目标协同规范。

  • 知识共享协议(MEK):标准化跨Agent的知识、经验、工具的共享和复用机制。

这三大标准为构建一个开放、可互操作的智能体生态系统奠定了坚实的技术基石。

目前,中兴通讯开源的Co-Sight超级智能体及其协议可在github上下载使用:

项目的开源地址:https://github.com/ZTE-AICloud/Co-Sight

协议开源地址:https://github.com/ZTE-AICloud/Co-TAP)


智能体的「应用爆发时刻」已至


2025年的AI智能体赛道,既充满资本热潮的喧嚣,也暗藏技术落地的阵痛。

中兴Co-Sight2.0的登顶与实践证明,只有精准解决行业痛点、构建开放生态、平衡技术与商业,才能在竞争中脱颖而出。

随着协同化、可信化、生态化趋势的深化,智能体将真正从「概念热点」走向「产业刚需」,但是产业落地还需要不断探索,走出一条从技术到产品实际落地的路经,而那些掌握核心技术与生态话语权的企业,将成为这一轮智能体爆发的引领者。

<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652634425&amp;idx=2&amp;sn=2bfb069a58362011417feea2e2b7d86c&amp;chksm=f07414e5ff7b24a9324deb770a29cd19b37b1c8396fb3f44ca622e186e30ee717ec89afdff28&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/83671/znKVqEvjGR&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们