AAAI 2024 | 浙大&腾讯优图提出DiAD：第一个基于扩散模型的多类异常检测工作

如题所述

第1个回答 2024-04-16

```html

DiAD：革新异常检测领域的新里程碑——首个基于扩散模型的多类检测框架</

浙江大学与腾讯优图联合开发的DiAD，是异常检测领域的一项重大突破。这款框架巧妙地利用Stable Diffusion技术，成功解决了多类异常检测中的类别识别和语义保留问题，MVTec-AD和VisA数据集的性能表现令人瞩目，一举超越了当前最先进的模型，如UniAD和RD4AD。

背景与挑战</

在工业生产中，高效准确的异常检测对于保证产品质量和生产安全至关重要。传统方法往往为每类异常单独训练模型，效率低下且无法处理类内多样性大的情况。DiAD的诞生，正是为了寻求一种通用的框架，能够在各类物体中识别异常，而无需过多的类别特定训练。

尽管扩散模型因其强大的生成能力广受关注，如DDPM和LDM，它们在多类异常检测中遇到的挑战包括类别混淆和保持语义一致性的问题。DDPM在去噪过程中容易将图像转变成随机噪声，而LDM虽解决了类别错误，但无法保证在去噪过程中保持图像的原始语义。DiAD正是在解决这些难题上的创新之作。

创新设计</

DiAD的网络结构包括语义引导网络和空间感知特征融合模块。语义引导网络在去噪过程中保持输入图像与重构图像的语义一致性，通过Semantic-Guided Network确保钉子的方向、齿轮的方位等关键信息的保留。而Spatial-aware Feature Fusion Block则整合不同尺度特征，提升模型的识别精度。

卓越成果</

在MVTec-AD和VisA数据集上，DiAD在图像和像素级别上分别展示了令人瞩目的AUROC、AP、F1max和PRO等七项指标，全方位超越了竞争对手。具体结果可见：

总结与未来</

DiAD的诞生，标志着在多类异常检测领域的一大跃进，它不仅解决了现有模型的局限，还展示了强大的异常区域重构能力。关注@CVer官方知乎账号，获取更多前沿的计算机视觉和AI工作动态，紧跟技术发展前沿。

```
改写后的文章更注重讲述DiAD的创新之处、挑战以及在实际数据集上的优秀表现，同时保持了关键信息的传递，使得文章更具吸引力和可读性。

相似回答

AAAI 2024 | 腾讯优图实验室27篇论文入选,含表格结构识别、异常图像生成...答：在备受瞩目的AAAI 2024会议上，腾讯优图实验室凭借其深厚的技术底蕴，一举提交并成功入选27篇论文，展示了在多个关键领域内的突破性研究。这些论文涵盖了表格结构识别的"抓取你所需"GrabTab、异常图像生成的DiAD框架，以及医学图像分割等前沿技术，向业界展示了腾讯在智能视觉领域的强大实力和创新能力。首先，...

aaai2024什么时候出结果答：1. AAAI 2024全球大模型数学推理竞赛的 results 将在2024年1月10日公布。2. 2023年10月12日的最新消息显示，国际先进AI协会（AAAI）宣布，学而思将担任主导，与谷歌、暨南大学等机构和企业的专家学者合作，共同举办AAAI 2024全球大模型数学推理竞赛。3. 这项竞赛分为中文数学解题和英文数学解题两个方向...

大家正在搜

浙大优学哪一本好浙大优学每日一题怎么样浙大优学每日一题浙大优辅浙大优辅怎样解题浙大优势浙大优选浙大优学官网浙大优青待遇