动态列表

  • 一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器
  • Z世代生存、学习与未来宣言!伯克利学霸预言课堂,用AI设计人生
  • AI来了!记者、UP主、写手,谁能逃过这场「灭绝浪潮」?
  • Hinton预言成真!AI接管美国一半白领,牛津哈佛扎堆转行做技工
  • 为什么「游戏」是 AI 陪伴落地的好场景?
  • 新加坡 AI 办公系统 Agnes:200 个 Agent 并行研究,让 AI 主动「找茬」打磨设计
  • 机器人也会「摸鱼」了?宇树G1赛后葛优瘫刷美女视频,网友:比人还懂享受生活
  • 从GPT-2到gpt-oss,深度详解OpenAI开放模型的进化之路
  • NextStep-1:一次在图像生成上自回归范式的探索
  • 开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍
  • 一张图,开启四维时空:4DNeX让动态世界 「活」起来
  • AI发现新物理定律:纠正等离子体理论多年错误假设
  • 多模态大模型在化学与材料学的「体检表」——哪些能力靠谱,哪些还差很远?
  • Altman:希望 AGI 能提高生育率;与辉同行否认董宇辉年收入二三十亿元;今年国内智能眼镜市场同比增长121.1%
  • 刚刚!谷歌内部揭秘Genie 3:Sora后最强AI爆款,开启世界模型新时代
  • 硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码
  • 黄仁勋子女逆袭上位!4万亿「皇储」成长史首曝:一个学烘培,一个开酒吧
  • GPT-5首次会推理,OpenAI联创曝AGI秘诀!超临界学习吞噬算力,2045金钱无用?
  • 400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?
  • CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力
  • SEAgent:开启从实战经验中自我进化的GUI智能体新纪元
  • OpenAI估值达5000亿美元;「原道」联手小岛秀夫,推《死亡搁浅》耳机;苹果手表将「大幅重新设计」
  • 奥特曼神秘晚宴讲话曝出!OpenAI的CEO或将是个AI,Chrome我也想买
  • 谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草
  • 最惨就业季!CS学霸GPA 3.98,投2500份简历仅10次面试,AI吞噬入门级岗位
  • Yann LeCun最新纪录片首曝!传奇AI教父的双面人生,深度学习幕后40年
  • 机器人全产业链接会 FAIR plus 2026新闻发布会在京召开
  • 大模型如何推理?斯坦福CS25重要一课,DeepMind首席科学家主讲
  • 当AI比我们更聪明:李飞飞和Hinton给出截然相反的生存指南
  • 简单即强大:全新生成模型「离散分布网络DDN」是如何做到原理简单,性质独特?
  • Sam Altman:AI存在泡沫;宇树机器人夺金,王兴兴:用遥控追求极致速度;蔡浩宇AI游戏上架,27.19元|极客早知道
  • 吞下17亿图片,Meta最强巨兽DINOv3开源!重新定义CV天花板
  • 打开高德的理由又多一条!全球首个「需求链智能调度」AI地图上线
  • 核心模型被曝蒸馏DeepSeek?前女友一纸控诉,曝出欧版OpenAI塌房真相!
  • 一句话搞定多任务出行,高德用空间智能重新定义地图
  • GPT-5、Grok 4、o3 Pro都零分,史上最难AI评测基准换它了
  • 谷歌开源Gemma 3 270M,性能超越Qwen 2.5同级模型
  • 追剧不断网,可能背后有个AI在加班,故障诊断准度破91.79%
  • Meta视觉基座DINOv3王者归来:自监督首次全面超越弱监督,商用开源
  • 多突触神经元模型问世,国内团队打造类脑计算新引擎,登上《自然·通讯》
  • Science封面:高效精准模拟构象变化,微软研究院用生成式AI重塑蛋白质功能研究
  • 扎克伯格看OpenAI直播挖人,北大校友孙之清加入Meta
  • AI 模特时代到来:字节x清华推出商用级视频换装模型DreamVVT,保真度显著领先SOTA
  • LeetCode刷够100小时,学会找人内推,OpenAI员工下场教你拿Offer
  • xAI元老离职干风投,传奇人物Babuschkin长文追忆与马斯克创业战友情
  • 链式思维是幻象吗?从数据分布视角重新审视大模型推理,马斯克回复,Grok破防
  • 李想:i8 反响不错,产品力没对手;库克暗示:苹果将推桌面机器人;中国日均消耗 30 万亿 Token,暴涨 300 倍
  • ChatGPT会让大脑退化?OpenAI高管用它救下自己「读写障碍」的女儿
  • 谷歌超级编码智能体正式上岗!125刀大会员,每天300任务任意跑
  • Meta华人天才毕树超「叛逃」预言:OpenAI未竟交互革命,暗藏万亿赛道
  • 美国CS就业梦碎!狂投5000家0 Offer,名校毕业00后被麦当劳惨拒
  • 3 分钟,我学会了像鸟儿一样飞行 | New Things
  • 从隐私计算迈向六大数据流通全栈技术,“隐语”开源社区升级
  • 7天,一场风暴!理想 i8「刮骨疗毒」,怒砍两个版本
  • 小订过万!打死不说价格的全新小鹏 P7,用颜值吊起了所有人的胃口!
  • 对话理想智驾负责人:撕掉「奶爸车」标签,智驶是理想的「新引擎」
  • 告别「偏科生」时代!36 万的坦克500,让对手从此无路可走
  • 万字长谈王小川:不再迎合他人做学霸,我要解自己的命题
  • 刚刚,全网最懂图文调研的智能体模型震撼上线,看完我直接卸了浏览器
  • ICCV 2025 | HVPL:分层视觉提示学习,让“视频实例分割”模型告别灾难性遗忘
  • 复旦&微软提出StableAvatar: 首个端到端“无限时长”音频驱动的人类视频生成新框架!
  • 千支队伍争锋!首届「启智杯」算法大赛圆满落幕,助推AI应用落地
  • 冗长响应缩减80%,DeepSeek GRPO获得颠覆性改进,微软GFPO问世
  • ICCV 2025 | HERMES:首个统一3D场景理解与生成的世界模型
  • 苹果 AI 下半场:年底问世的新 Siri,要彻底改变 iPhone 的交互
  • GNN+KAN,把三角函数当「激活」选项,山大、南洋理工让分子图更会读化学子结构
  • 港大联手月之暗面等开源OpenCUA:人人可造专属电脑智能体
  • 破解「长程智能体」RL训练难题,腾讯提出RLVMR框架,让7B模型「思考」比肩GPT-4o
  • AI独角兽498家,估值2.7万亿美元;《王者荣耀》连续三年成全球最吸金手游;抖音测试「快递」服务|极客早知道
  • 奥特曼公然叫板马斯克!重金杀入脑机接口,硅谷两大巨头彻底决裂
  • AI女友24h陪玩,全球800万人上头!这群AI创企靠百度开挂
  • 马斯克删除xAI「研究员」职位引爆网络!LeCun怒批:如此暴力将扼杀创新
  • OpenAI女CEO太狠了!智商148,GPT-5才是真印钞机
  • AI 和海外游戏发力,腾讯重回 7000 亿美金
  • ICML 2025 | 奖励模型还用人标?APEC用对抗模仿生成偏好,泛化能力直线上升
  • Attention Sink的起源找到了?清华×美团首次锁定MoE中的「超级专家」
  • 博士申请 | 休斯敦大学计算机系刘锦阳老师招收高性能计算/数据压缩方向博士生
  • Kimi K2背后的冷门绝招:海量语料“重写”如何榨干每个token?
  • 告别Transformer,重塑机器学习范式:上海交大首个「类人脑」大模型诞生
  • AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」
  • Agent狂欢下的冷思考:为什么说Data&AI数据基础设施,才是AI时代Infra新范式
  • AI顶会模式出了问题? 「不发表,就出局」的恶性循环,正在压垮整个AI学界
  • 研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现
  • 多模态大脑建模技术迈入新纪元:Meta 10亿参数模型获Algonauts 2025大脑建模竞赛冠军
  • 当人们怀念 GPT-4o,他们在「怀念」什么?
  • OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了
  • IEEE TPAMI 南洋理工&哈工大提出 MARCONet++ 攻克中文文本图像超分难题
  • 耶鲁&大连理工&南洋理工等提出MDCNeXt:X射线下的“动力电池缺陷精准检测”新范式
  • 6秒造一个「视频博主」,Pika让一切图片开口说话
  • 破解AI创企的「不可能三角」,解药不止「大模型」
  • OpenAI和奥特曼将投资一家脑机接口公司,直接与马斯克的Neuralink竞争
  • 大型语言模型稳定强化学习的新路径:几何平均策略优化GMPO
  • 传 DeepSeek-R2 8 月发布;微信测试信用借款功能;Perplexity 要 345 亿美元收购 Chrome
  • 一觉醒来,GitHub没了?CEO辞职,微软接管,开发者天塌了
  • AI全国榜单爆冷,全网吃瓜大狂欢!这家黑马竟靠DeepSeek杀进全国TOP 2
  • 物理学「AlphaGo时刻」?40年未竟之事被AI一举攻破,顶尖物理学家集体傻眼
  • 刚刚,商汤内部两万字复盘曝光:多模态通往AGI核心路线首次公开
  • 让强化学习快如闪电:FlashRL一条命令实现极速Rollout,已全部开源
  • 从物竞天择到智能进化,首篇自进化智能体综述的ASI之路
  • 破解效率与成本难题:华为UCM技术推动AI推理体验升级
  • SIGGRAPH上,英伟达发布物理AI开源新技术,更新RTX Pro产品线
  • 身家25亿刀,是四家公司创始人,这位伯克利教授还在给本科生上课
  • 商汤王晓刚:世界模型将加快AI从数字空间进入物理世界,「悟能」想做那个桥梁
  • 北京内推 | 度小满金融视觉和多模态团队招聘视觉多模态算法实习生
  • 后训练轻量「小枝」强势出击!极限剪裁视觉token,推理加速154%
  • 实验室抢显卡抢破头?A800/H800骨折价来袭,超值返券助你轻松冲DDL!
  • TCSVT 2025 | 跨模态学习助力复杂工业过程异常检测:FmFormer框架与基准测试新突破
  • ICCV 2025 | LightSwitch:CMU提出材质引导的扩散模型,2分钟实现高质量三维场景重打光
  • AI全面挖掘微蛋白价值:首次引入合成负样本训练,剔除92%噪声,摆脱保守依赖
  • 是「福尔摩斯」,也是「列文虎克」,智谱把OpenAI藏着掖着的视觉推理能力开源了
  • 东方理工·甬江论坛|新大学、新使命,邀你共启未来
  • LLM总是把简单任务复杂化,Karpathy无语:有些任务无需那么多思考
  • ICCV 2025 | 小红书AIGC团队提出图像和视频换脸新算法DynamicFace
  • 聚焦前沿,见证未来!「X·创新』产品SHOW圆满举办!
  • 刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌
  • Lumina-mGPT 2.0:自回归模型华丽复兴,媲美顶尖扩散模型
  • 雷军:小米YU7改名,被误会是丐版;传淘宝闪购周末峰值超美团;低价 MacBook 或年底亮相,599 美元

KDD 2025 | UoMo来了,首个无线网络流量预测模型,一个框架搞定三类任务

图片

你有没有想过,未来的移动网络能像 “预知未来” 一样提前感知用户需求?在今年的 ACM KDD 2025 大会上,清华大学电子系团队联合中国移动发布了 UoMo,全球首个面向移动网络的通用流量预测模型。UoMo 能同时胜任短期预测、长期预测,甚至在没有历史数据的情况下生成全新区域的流量分布。它结合了前沿的扩散模型与 Transformer 结构,还能理解城市中的地理信息与人流变化,把网络规划和优化做得更聪明、更精准。

图片
  • 标题:UoMo: A Universal Model of Mobile Traffic Forecasting for Wireless Network Optimization

  • 作者:Haoye Chai(柴浩野), Shiyuan Zhang(张诗源),Xiaoqian Qi(齐效乾),Baohua Qiu(邱宝华),Yong Li(李勇)

  • 机构:清华大学,中国移动 

  • 论文链接:https://dl.acm.org/doi/10.1145/3711896.3737272

  • 数据及代码链接:https://github.com/tsinghua-fib-lab/UoMo

为什么要做 UoMo

图片

在大规模移动网络中,流量预测是实现智能化网络运营与优化的核心能力。它让运营商能够在复杂网络环境中,提前感知流量变化,从而主动执行一系列网规网优操作(如调度资源、部署基站、降低能耗)。然而,现有方法往往针对单一任务,缺乏跨区域、跨任务的统一预测能力,难以支撑智能化网络在多样化场景下的长期稳定运行:

泛化能力不足

不同城市在人口分布、城市布局和地理环境上差异极大,导致流量模式也随之变化,现有专用模型难以捕捉多样化时空特征,更难迁移到新场景。

任务适应性受限

短期 / 长期预测对数据特征的关注点不同,传统做法往往为每个任务单独设计模型,导致部署复杂、维护成本高。

UoMo 目标:在统一框架下同时支持短期预测、长期预测、生成三类任务。

移动网络流量预测任务是什么

论文把移动网络的流量预测归纳为三类

  • 短期预测:用较长历史 图片预测近未来图片 ,强调短时波动,典型的网规网优任务包括资源分配、用户接入控制等。

  • 长期预测:用较短历史 图片预测较长未来 图片,强调周期与规律,典型的网规网优任务包括基站休眠节能、网络容量扩展等。

  • 生成(无历史):仅用区域环境特征直接生成 图片,用于新区域的潜在需求评估,典型网规网优任务包含频段规划、小区选址等。

UoMo 的统一架构  数据词元化→ 模型预训练 → 模型微调

图片

(一) 数据词元化:异构时空流量变成统一 “token”

将城市区域图片、时间 图片 的张量图片切分基础单元图片获得 token 序列图片 ,并通过嵌入层 图片 转换为低维表征,以此将不同时空粒度(小区 / 栅格,1 小时 / 15 分钟)投影到相同低维空间。

(二) 基于扩散模型预训练

图片

UoMo 骨干网络结合扩散模型 + Transformer,采用扩散模型建模大规模移动数据的复杂时空分布,采用 Transformer 学习流量数据序列相关性。同时,UoMo 采用掩码 - 复原的自监督训练范式,定义如下四种掩码策略:

  • 短期掩码:遮掩未来短时间内,对应短期预测任务;

  • 长期掩码:遮住更长时间段,对应长期预测任务;

  • 生成掩码:将目标时空区域全部数据进行遮掩,用周围区域 + 环境上下文完成生成任务;

  • 随机掩码:随机遮掩时空点,帮助模型学习数据普适时空规律。

训练目标:定义前向过程加噪后数据表示为e,可观测部分数据为o,掩码策略为m,可以表示如下:

图片

去噪网络用于还原原始添加噪声,最小化掩码部分的 MSE 损失:

图片

(三) 城市环境微调:把人和城市注入模型

图片
  • 城市环境两大来源:(1)移动网络用户数:与网络流量格式相同的时空序列,表征不同时空地点人类移动规律;(2)POI 分布:表示某一时空区域的 POI 数量,通过与时间戳进行组合映射,能够获得具备时间属性的 POI 分布。

  • 基于对比学习的环境对齐:相同时空区域内的流量与环境信息作为正样本,文章中通过理论分析,指出扩散模型中训练目标实际上等价于对比学习中优化 InfoNCE 目标,可以表示:

图片

实验与结论

作者从真实世界 9 座规模不同的城市中采集下行移动流量数据,时间粒度为 15 分钟至 1 小时。在每个数据集中,城市环境环境数据通过公开地图服务抓取各城市的 POI 信息,覆盖居住、娱乐等 15 个相关类别。

图片

实验结果表明,无论是短期预测、长期预测、生成任务,UoMo 相比于现有 baseline 算法,均体现卓越的预测能力,充分说明 UoMo “一模多用” 的能力,具备良好的通用性。

图片
图片
图片

本文还对数据预测效果进行了可视化展示,充分说明 UoMo 所预测数据不仅仅是 “数值指标最优”,能够很好地还原真实流量数据的波动模式,这也为移动网络规划与优化提供重要实用基础。 

图片

对于 UoMo 零样本 / 小样本的学习能力, UoMo 相比于其他算法同样能够展示强大的泛化迁移能力,尤其是在小样本数据(如 5%/10% 数据)训练之后,能够进一步拉近与真实的误差。

图片

部署与应用

基于 UoMo 预测的移动网络流量,文章测试了三类典型的应用场景(基站选址规划、无线资源分配、基站休眠控制),验证移动流量预测能力以及对网规网优的能力支撑。部署过程遵循三步闭环范式:

图片
  • UoMo 流量预测:基于城市多源数据(历史流量、用户数、POI 等),UoMo 执行相应流量预测任务(长期 / 短期 / 生成),产生可用于后续优化的预测流量。

  • 基于生成数据的优化策略求解:在获得预测流量后,将其输入到网络优化求解器中(站点选址、容量规划、节能优化、QoS 优化等),获得网规网优策略。

  • 基于真实数据的策略验证与评估:应用平台按照真实网络数据验证网规网优策略,从覆盖、吞吐、时延等指标对优化策略进行量化评估,当最终系统性能越高,则说明基于 UoMo 预测流量所制定的规划优化策略效果越好。

总结

UoMo 是一种结合扩散模型的移动流量预测通用模型,该模型能够同时支持多种预测任务(短期 / 长期预测与生成)。通过建模移动流量在时间、空间、城市环境之间的联合分布,UoMo 在多城市的预测任务中具备优越的性能表现,并且具备较好的零样本 / 小样本学习能力,体现出卓越的通用性与泛化能力。

]]>

联系我们