TeleAI 提出深度环绕感知网络 SurANet，精准检测隐蔽物体

2025-03-10 09:00

如何描述一朵兰花？

陶渊明说：“幽兰生前庭，含熏待清风。”

苏东坡说：“春兰如美人，不采羞自献。”

如果是看图说话呢？

AI 说：

“一片绚烂的兰花静静绽放，粉紫与莹白交织的花瓣，如梦幻羽翼舒展，纹路细腻似天然绘就的诗篇。”

等等！

“不经意间定睛细看，竟发现其中藏着一只兰花螳螂！它与兰花巧妙相融，似是花魂的灵动化身。”

生物界的拟态现象比比皆是，从人们熟知的变色龙，到科普视频中经常出现的枯叶蝶、竹节虫，还有草原上猎豹的条纹，以及大海中藏匿于砂石里的红毛蟹......这些生物通过自我伪装隐蔽在杂乱的环境中，有的躲避天敌，有的守株待兔。

对于隐蔽于复杂环境中的生物和物体进行识别和检测有着重要的应用价值。

在物种保护方面，隐蔽物体检测（COD）技术能够帮助研究人员准确掌握某种生物的数量、分布及习性等信息。

在工业生产过程中，COD 技术可以对生产线上的产品进行时时检测，快速发现产品表面的缺陷或异物，提升良品率。

在医学领域，一些病变在正常组织的掩盖下难以被发现，而 COD 技术则可以辅助医生准确筛查，提高疾病的早期诊断率。

然而，由于隐藏目标与背景高度相似，通过传统目标检测方法很难有效区分。其主要障碍是目标内外边界区域之间存在微小的特征差异，使得现有方法难以获得准确的结果。

为此，中国电信人工智能研究院（TeleAI）科研团队考虑利用周围环境信息来识别隐蔽物体，创新提出了一种新颖的深度环绕感知网络（Surrounding-Aware Network，简称 SurANet），能够将周围信息引入特征提取和损失函数中，以提高判别能力。

SurANet 主要由级联提取器和分类器组成，其中提取器负责隐藏目标的关键特征，分类器对提取的特征进行高效区分。

首先，为了更好地区分隐藏目标和其周围环境特征，在物体特征提取器中引入了周围感知增强模块（SAE），进一步增强对隐藏目标周围环境的感知。

此模块在网络不同层级提取周围感知特征，通过与隐藏目标特征图融合，放大目标与周围环境差异。

其次，在分类器的设计中，使用了周围感知对比损失函数（SACLoss），使得周围特征和隐藏目标特征之间的差异更加明显。

SACLoss 构造了一组由目标、周围区域和背景组成的三元组损失，并在训练过程中推开由目标与周围区域的像素形成的负样本对，拉近背景与周围区域像素形成的正样品对，从而进一步提升网络周围区域感知能力。

此外，为进一步降低训练成本，采用空间压缩关联传输（SCCT）的训练策略，通过对特征空间进行堆叠压缩，有效降低网络训练过程的损失计算代价。

该策略通过交叉的分离和堆叠操作，可将网络提取的特征图转换为紧凑的表示，使周围感知对比损失函数能够在较小计算代价下有效学习。

实验结果表明，在四个 COD 数据集（COD10K、CAMO、CHAMELEON、NC4K）和三个实际应用（包括战场伪装目标探测、微光视频监控和烟草生产线杂物检测）中，本研究提出的 SurANet 优于当前最先进的隐蔽物体检测方法。

深度环绕感知网络（SurANet）为特殊场景下的识别检测任务执行带来了重要推动作用，能够促进多领域的发展与创新。

除了医疗、工业、安防、生物保护等，SurANet 还能在地震、火灾等应急救援场景中，赋能救援设备快速定位隐蔽目标，从而提高救援效率，增加被困人员的生存几率。这也为应急救援技术的创新发展提供了新的思路和方法。

此外，考虑到在实际应用中，许多 COD 任务受限于隐藏目标标签不足。因此，如何在较少的监督信息下高效地学习隐藏目标特征仍然是一大挑战。未来，TeleAI 团队还计划使用弱监督数据开展 COD 任务，进一步研究高效的隐藏目标特征学习方法。

目前此研究相关论文已被 Elsevier 出版的期刊《Neurocomputing》接收，相关代码已在 GitHub 开源。

论文地址：

https://arxiv.org/abs/2410.06842

开源地址：

https://github.com/kyh433/SurANet