CV君 2025-09-19 17:03 江苏
数字水印是保护图像版权、验证内容真实性的重要技术。然而,传统的水印技术非常脆弱,一张带水印的图片,只要经过简单的裁剪、旋转、缩放等几何变换,水印信息就可能“失之毫厘,谬以千里”,导致无法被正确提取。这个问题被称为“同步”问题,即如何在图像被“攻击”后,依然能准确地找到原始的坐标系,从而正确地读取水印。
为了解决这一业界难题,来自 Meta 和 苏黎世联邦理工学院(ETH Zurich) 的研究者们提出了一种名为 SyncSeal 的全新方法。SyncSeal,可以理解为“同步封印”,它并非要取代现有的水印技术,而是作为一种强大的“升级补丁”,专门用来抵抗几何变换攻击。它通过在图像中嵌入一个不可见的“同步水印”,使得即使图像被任意裁剪、旋转,接收方也能精确地反解出原始的变换参数,将图像恢复到“出厂设置”,从而让隐藏在其中的“主水印”能够被成功读取。实验证明,SyncSeal能让现有多种主流水印技术在几何攻击下的鲁棒性获得巨大提升。
论文标题: Geometric Image Synchronization with Deep Watermarking
作者: Pierre Fernandez, Tomáš Souček, Nikola Jovanović, Hady Elsahar, 等
机构: Meta, 苏黎世联邦理工学院 (ETH Zurich)
代码地址: https://github.com/facebookresearch/wmar/tree/main/syncseal
研究背景:脆弱的数字水印与“同步”的挑战
数字水印技术的核心是在图像中嵌入肉眼不可见的信息。解码时,需要在一个确定的坐标系下提取这些信息。然而,一旦图像被进行几何变换,例如:
裁剪 (Cropping)
旋转 (Rotation)
缩放 (Scaling)
甚至更复杂的透视变换 (Perspective Transformation)
解码器就“找不着北”了,无法对齐坐标系,自然也就无法读取水印。图像同步(Image Synchronization) 的任务,就是要在这些变换发生后,精确地估计出变换的参数,并将图像“逆变换”回原始状态。
现有的水印方法,有的完全不具备同步能力,有的仅能抵抗部分简单的变换,而能实现完全同步的方法又往往不是独立的模块。SyncSeal的目标就是提供一个独立的、强大的、可用于任何水印方法的通用同步解决方案。
SyncSeal方法:端到端学习“找回坐标”
SyncSeal的核心思想非常巧妙:它不直接在图像中编码需要传递的消息,而是编码用于“对齐坐标系”的同步信息。整个框架通过一个编码器-解码器(嵌入器-提取器)的结构,进行端到端的训练,以学会预测和反转任意的几何变换。
其工作流程如下图所示:
嵌入器 (Embedder): 这是一个神经网络,它接收一张原始图像,并生成一个“同步水印”。这个水印被以一种肉眼几乎无法察觉的方式添加到原始图像中,生成带水印的图像。从下图的视觉对比可以看出,水印对原图的修改极小,主要集中在纹理丰富的区域,人眼难以分辨。
几何变换 (Geometric Augmentations): 在训练过程中,带水印的图像会经过一系列随机的、严苛的几何变换(如裁剪、旋转、缩放、透视变换的组合),模拟真实世界中可能发生的各种攻击。
提取器 (Extractor): 这是另一个神经网络,它的任务是接收被变换后的图像,并 直接预测出该图像四个角点在原始图像坐标系中的位置。只要能准确预测这四个点的坐标,就能计算出完整的单应性矩阵(Homography Matrix),从而可以完美地反演出图像所经历的任何几何变换。
端到端训练: 整个系统的训练目标是让“提取器”预测的角点坐标与真实的角点坐标尽可能接近(即最小化同步损失)。同时,为了保证水印的不可感知性,还引入了一个 判别器 (Discriminator) ,它负责区分原图和加了水印的图。嵌入器的目标是“欺骗”判别器,让它无法分辨,从而确保水印的隐蔽性。
实验结果:强大的同步与升级能力
SyncSeal在多种几何变换和质量变换(如JPEG压缩、模糊)的组合测试中,展现了出色的性能。
高精度的同步能力
实验结果表明,SyncSeal能够非常精确地预测出变换后图像的角点位置。下表显示,在各种几何和质量变换的组合攻击下,预测角点与真实角点之间的平均距离误差非常小(单位:像素)。
下图直观地展示了预测的精确性,即使在复杂的变换下,预测的角点(蓝色)与真实的角点(红色)也几乎完全重合。
与其他同步方法相比,SyncSeal在精度上同样具有明显优势。
赋能现有水印技术
SyncSeal最大的价值在于其“即插即用”的升级能力。研究者们将SyncSeal与多种现有的主流水印方法(包括后处理添加型和生成式)相结合,测试它们在几何攻击下的表现。
结果如上表所示,堪称惊人。在没有SyncSeal(✗)的情况下,这些水印方法在面对裁剪(Crop)等几何攻击时,比特误码率(Bit Error Rate)接近50%,意味着水印信息完全丢失。然而,在集成了SyncSeal(✓)之后,几乎所有方法的水印都能被完美恢复,误码率骤降至接近于0。这充分证明了SyncSeal作为一个独立的同步模块,能够极大地增强现有水印技术对几何变换的鲁棒性。
总结与贡献
SyncSeal 提出了一种为图像同步任务量身定制的深度水印方法。它不直接解决水印信息的编解码,而是专注于解决更底层的“同步”问题。其核心贡献在于:
提出了一种创新的、端到端的图像同步框架,通过预测变换参数来反转几何攻击,具有非常高的精度。
展示了其强大的“即插即用”能力,可以作为一个独立的模块,显著提升现有各种水印技术抵抗几何攻击的能力,解决了行业的一大痛点。
代码已经开源,为数字版权保护、内容认证等领域的研究者和开发者提供了一个强大而实用的工具。
CV君认为,SyncSeal的设计思想——将特定任务(如同步)从主任务(如信息编码)中解耦出来,并用专门的深度学习模型去解决——为许多复合型问题提供了新的解决思路。它不仅是水印技术的一大进步,也为其他需要几何对齐的计算机视觉任务带来了启发。
了解最新 AI 进展,欢迎关注公众号:我爱计算机视觉感谢点赞支持。