研究进展

当前位置: 网站首页 - 新闻列表 - 研究进展 - 正文

研究进展 | IEEE/CVF CVPR 2025 | 探索单幅图像中的内在正常原型以实现通用异常检测

作者:罗威时间:2025-06-16阅读量:
  

2025年6月11日-15日,精密仪器研究中心余文勇副教授赴美国田纳西州纳什维尔市参加了2025年度IEEE/CVF计算机视觉与模式识别会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)。研究中心论文“Exploring Intrinsic Normal Prototypes within a Single Image for Universal Anomaly Detection(探索单幅图像中的内在正常原型以实现通用异常检测)”被主会接收。该会议是计算机视觉与模式识别领域的国际知名学术会议,今年录用率为22.1%。2023届本科生罗威为论文第一作者(现为清华大学博士生),余文勇副教授为论文通讯作者。


图1 会议录用论文


图2 余文勇副教授参会交流


工业异常检测的常规方法是将测试图像与训练集里学习到的正常模式进行比较,但面对外观和位置变化时容易产生对不齐问题,从而导致误检或漏检。注意到在异常样本中,有价值的正常信息仍然存在,并且与异常更融合。受此启发,论文提出了一种全新的方法INP-Former。

该方法不依赖于训练集的正态性,而是直接根据一张测试图像就能提取内在正态原型(INP),并利用这些 INPs 指导图像重建,通过重建误差实现异常检测。为此,论文设计了INP提取器,提出了INP相干损失,以确保INP能够忠实地表示测试图像的正态性,并设计软挖掘损失来处理训练过程中难以优化的样本。该方法在异常检测国际权威数据集MVTec-AD、VisA和Real-IAD的单类、多类和小样本异常检测任务,以及零样本任务中实现了较先进的性能,检测指标在最新异常检测排行榜上全球排名第二。


图3 算法模型

(a) 模型由预训练编码器、INP提取器和INP引导解码器组成。INP提取器动态地从单个图像中提取固有的正常原型,INP引导解码器利用这些原型抑制异常特征。(b) INP提取器结构。(c) INP引导解码器的结构。(d) INP引导注意与自我注意的计算复杂度比较。


图4 多类产品检测模型在三个权威数据集上取得了SOTA结果


图5 异常检测排行榜全球排名第二


论文方法主要解决了通用工业异常检测难题,即:在试生产或正式生产时期,通过某个产品的少量样本,便可训练检测模型;在扩大再生产时期,多类产品只需训练一个检测模型;另外该方法计算效率较高,训练耗时1.5小时(GPU 4090),推理耗时40ms(未优化前),有潜在的工业应用价值。

该研究得到了国家自然科学基金项目(52375494)的资助。


论文信息:

W. Luo, Y. Cao, H. Yao, X. Zhang, J. Lou, Y. Cheng, W. Shen, and W. Yu, "Exploring Intrinsic Normal Prototypes within a Single Image for Universal Anomaly Detection," in2025 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR), Nashville, TN, USA, 2025, pp. 9974-9983.

代码地址

https://github.com/luow23/INP-Former

新闻链接

http://news.hust.edu.cn/info/1004/54975.htm

  • 通讯地址:华中科技大学机械学院东楼B316
  • 邮政编码:430074
  • 联系电话:027 8755 9543
  • 中心邮箱:pirc@hust.edu.cn

2026 © Powered by Precision Instrument Research Center (PIRC). All Rights Reserved.