CV君 2025-09-30 16:05 江苏
专为边缘部署而生
作者:Ranjan Sapkota, Rahul Harsha Cheppally, Ajay Sharda, Manoj Karkee
机构:康奈尔大学、堪萨斯州立大学
论文地址:https://arxiv.org/abs/2509.25164
相关资料:
https://docs.ultralytics.com/zh/models/yolo26/#overview
就在大家对YOLO系列的演进速度感到惊叹时,Ultralytics在2025年9月又投下了一颗重磅炸弹,正式推出了YOLO家族的最新成员——YOLO26。这不仅仅是一次常规的升级,更是一场专为边缘和低功耗设备设计的架构革新。来自康奈尔大学和堪萨斯州立大学的研究者们详细介绍了YOLO26的设计理念、技术突破和部署优势,目标直指在真实世界的边缘计算场景中,实现效率和精度的再次飞跃。
ps.也许很多人会疑惑,为什么突然YOLO就跳到26了?别的原因不知道,但这个命名方式让学术界很难跟是很显然的。
核心架构革新:四大亮点
YOLO26的设计哲学围绕着三个核心原则:简洁、高效与创新。为了实现这一目标,它引入了四项关键的架构增强,彻底改变了以往YOLO模型的训练和推理方式。
上图清晰地展示了YOLO26的四大核心创新点:
移除DFL(Distribution Focal Loss):以往的YOLO模型(如YOLOv8)普遍采用DFL来提升边界框回归的精度,但这无疑增加了计算开销和模型导出的复杂度。YOLO26果断地移除了DFL模块,将边界框预测回归到更直接的回归任务,极大地简化了模型结构。这一改变不仅提升了推理效率,还使得模型能够更轻松地导出到ONNX、TensorRT、CoreML等不同平台。
端到端无NMS(NMS-free)推理:非极大值抑制(NMS)作为目标检测后处理的标配,一直是推理速度的瓶颈之一,并且需要手动调整超参数。YOLO26通过重新设计预测头,实现了真正的端到端无NMS推理。模型可以直接输出无冗余的检测框,彻底告别了后处理的烦恼。这一突破性的改进,使得YOLO26在CPU上的推理速度相比前代模型提升了高达 **43%**(以nano模型为例),对于延迟敏感的移动设备、无人机和嵌入式平台而言,这无疑是巨大的福音。
引入ProgLoss与STAL:为了解决训练稳定性和小目标检测这两大难题,YOLO26引入了两种新策略。ProgLoss(Progressive Loss Balancing)能够在训练过程中动态调整不同损失成分的权重,防止模型在训练后期对某些类别过拟合,从而提升了泛化能力。而 STAL(Small-Target-Aware Label Assignment)则是一种专门针对小目标的标签分配策略,它在训练时会优先考虑那些像素占比小、易被忽略的目标,显著增强了模型在拥挤场景或远距离视角下对小目标的识别准度。
采用MuSGD优化器:借鉴近年来大语言模型(LLM)训练中的优化技术突破,YOLO26引入了一种名为 MuSGD 的混合优化器。它结合了传统随机梯度下降(SGD)的鲁棒性和Muon优化器的自适应特性,能够在多样化的数据集上实现更快、更稳定的收敛。这意味着开发者可以用更少的训练周期和计算资源,达到理想的模型精度。
性能基准:速度与精度的完美平衡
当然,架构的革新最终要用性能数据来说话。研究者们将YOLO26与YOLOv10、RT-DETR系列等当前主流的实时检测器在COCO数据集上进行了详细的性能对比。
结果显示,YOLO26在精度与延迟之间取得了卓越的平衡。例如,YOLO26-m和YOLO26-l模型在mAP上可以媲美基于Transformer的RT-DETRv3等重量级选手,但推理延迟却大幅降低。与同为CNN架构的YOLOv10相比,YOLO26在所有尺度上都展现出更低的延迟,同时通过ProgLoss和STAL等机制保持甚至提升了检测精度。
这种“又快又准”的特性,再次印证了YOLO26以“边缘为中心”的设计哲学是成功的。它没有盲目堆砌复杂的模块去冲击排行榜的最高精度,而是通过精巧的架构简化,在保证高精度的前提下,将推理效率推向了新的高度。
部署与应用:从机器人到智能制造
YOLO26的价值不仅在于 benchmarks 上的数字,更在于其强大的部署潜力和广泛的应用前景。
由于其无NMS和简化的架构,YOLO26可以非常方便地进行量化(FP16或INT8),在NVIDIA Jetson、高通骁龙AI芯片等资源受限的硬件上保持高精度和稳定性。这使得它在机器人领域,能够帮助机械臂更精准地抓取动态物体,或让移动机器人更可靠地避障。
在智能制造领域,YOLO26可以作为产线上的“火眼金睛”,进行实时缺陷检测。其高吞吐量和低运营成本的特性,相比之前的YOLOv12或基于Transformer的方案,更具规模化部署的优势。
大家对YOLO26的这些新特性怎么看?它会成为边缘设备上的新霸主吗?欢迎在评论区聊聊你的看法!
更多阅读: