原创 让你更懂AI的 2025-09-05 13:05 北京
本文构建了一个面向 GAD 的图基础模型。
介绍
图异常检测(Graph Anomaly Detection,GAD)旨在识别与图中大多数节点不同的异常节点,近年来已受到广泛关注。
现有的一般化图模型虽然在多种图任务中取得了显著成功,但在推广到 GAD 任务时仍然面临挑战。这一局限主要源于其难以学习可泛化的知识来捕捉跨不同领域图中固有的低频、不规则和异质的异常模式。
为应对这一挑战,我们提出了 AnomalyGFM,一个面向 GAD 的图基础模型,能够在多样化的图数据集上支持零样本推理和小样本提示调优(prompt tuning)。其核心洞察在于,需要图无关的正常与异常类表示,才能支持跨不同图的有效零/小样本 GAD。
受此启发,AnomalyGFM 通过预训练,将数据无关、可学习的正常和异常类原型,与节点表示残差(即节点与其邻居的表示偏差)进行对齐。残差特征实质上将节点信息投射到统一的特征空间中,使得我们能够以一致的方式衡量来自不同图的节点异常性。
这为学习图无关、具有判别性的正常与异常类原型提供了驱动力,并可直接用于在新图上进行零样本 GAD,包括超大规模图。如果在新图中存在少量标注的正常节点,AnomalyGFM 还可以进一步支持提示调优,以利用这些节点实现更好的适应。
在覆盖社交网络、金融网络和共同评论网络的 11 个广泛使用的真实异常 GAD 数据集上的综合实验表明,AnomalyGFM 在零样本和小样本 GAD 设置下均显著优于现有的最新方法。
论文题目:
AnomalyGFM: Graph Foundation Model for Zero/Few-shot Anomaly Detection
论文作者:
乔贺辙*,牛朝西*, 庞观松,陈玲
作者单位:
新加坡管理大学,悉尼科技大学
论文地址:
https://arxiv.org/abs/2502.09254
代码地址:
https://github.com/mala-lab/AnomalyGFM
方法
尽管图基础模型在通用图分类任务上取得了较好的效果,目前仍然缺乏一种基础模型,能够在跨不同领域的图中有效捕捉异常,并同时支持零样本和小样本的图异常检测。
为填补这一空白,本文提出 AnomalyGFM,一个面向 GAD 的图基础模型(Graph Foundation Model,GFM),能够在零样本和小样本场景下都有效地解决 GAD 问题。
其核心洞察在于:为了避免对预训练图数据的过拟合,需要学习图无关的正常类和异常类表示,从而支持跨不同图的有效零/小样本 GAD。在这一动机的驱动下
AnomalyGFM 通过预训练,将数据无关、可学习的正常类和异常类原型,与节点表示残差(即节点与其邻居节点的表示偏差)进行对齐。
与原始特征空间中正常与异常模式在不同数据集里呈现的不规则和异质性分布(见图 (b))相比,残差特征本质上将节点信息投射到一个统一的特征空间中,在该空间里我们能够以一致且相同的方式有效衡量来自不同图的节点异常性(见图 (c))。
这是因为无论节点来自哪个图,正常节点都预期与其邻居之间的残差/偏差较小,而异常节点的残差通常较大。
通过学习将这些残差特征与可学习的正常和异常类原型对齐,AnomalyGFM 将基于残差特征的异常可判别性蒸馏到两个图无关的原型中,从而在无需额外调优/训练的情况下,实现对新图中 GAD 的强泛化能力。
进一步地,如果在新图中存在少量标注的正常节点,AnomalyGFM 还能支持图提示调优(graph prompt tuning),以利用这些节点实现更好的适应性。
在推理时异常分数由目标节点的表示残差与两个原型的相似性计算得到。除此之外,通过学习图无关的原型,AnomalyGFM 可以通过一种基于子图的推理方法推广到超大规模图。
AnomalyGFM 能够在无需考虑整个图结构的情况下有效推断异常分数,从而消除在 GAD 推理中必须加载完整图的瓶颈。该子图推理方式在隐私敏感的场景中同样具有优势,因为在这些场景下我们不希望将完整的图结构暴露给检测模型。
实验
我们建立了一个覆盖零样本和小样本设置的综合基准,使用了 11 个真实世界的 GAD 数据集,在此基准上:
i) AnomalyGFM 的表现显著优于最新的无监督、监督以及通用 GAD 方法;
ii) 在小样本 GAD 场景下,AnomalyGFM 在大多数数据集上的 AUROC 和 AUPRC 指标上均优于一些通用方法。
iii) AnomalyGFM 具有良好的可扩展性,能够应用于超大规模图。
结论
本文构建了一个面向 GAD 的图基础模型 AnomalyGFM,能够在小样本和零样本场景下均有效工作。AnomalyGFM 通过预训练,将可区分且数据无关的原型与图无关的节点表示残差进行对齐,从而学习到判别性原型。
这种方式为异常性测度提供了一种一致且统一的途径,即通过比较节点残差表示与已学习类原型之间的相似性来判断,从而在零样本和小样本推理中都具备强泛化能力。在 11 个数据集上的大量实验结果验证了 AnomalyGFM 的有效性和泛化性。
更多阅读
#投 稿 通 道#
让你的文字被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。
📝 稿件基本要求:
• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注
• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题
• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算
📬 投稿通道:
• 投稿邮箱:hr@paperweekly.site
• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者
• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿
△长按添加PaperWeekly小编
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
·