bevictor伟德-bv伟德国际体育官方网站

搜索

您的关键词

新闻公告

首页 > 新闻公告 > 新闻动态 > 正文

实验室在自适应表征学习、异常检测和SAR目标识别取得新进展

时间：2025/07/12 09:33:11 作者：点击数：

近日，2025年国际机器学习会议（The Forty-second International Conference on Machine Learning，简称ICML2025）在温哥华会议中心举行。实验室陈渤教授团队和张鹏教授团队的三位学生论文分别被录用，《Beyond Matryoshka: Revisiting Sparse Coding for Adaptive Representation》（文添圣）、《OmiAD: One-Step Adaptive Masked Diffusion Model for Multi-class Anomaly Detection via Adversarial Distillation》（冯耀轩）和《Gamma Distribution PCA-Enhanced Feature Learning for Angle-Robust SAR Target Recognition》（张翀）。

ICML是人工智能领域最具影响力的顶级学术会议之一，被中国计算机学会（CCF）评为A类国际会议，与NeurIPS和ICLR并称为人工智能与机器学习领域的三大权威国际顶会。据ICML官方统计，今年大会共收到12107篇投稿，较去年增加了28%，共有3260篇论文被接收，接收率为26.9%。其中，文添圣同学的论文进入“Oral Presentation”, 入选率仅为1%，也是学校首次有论文出现在该环节。

自适应特征学习相关成果进展

在延迟敏感的大规模系统中，高质量深度表示对检索、搜索和生成任务至关重要，尤其需支持高效索引。本文重新审视稀疏编码潜力，提出“稀疏对比表示”（Contrastive Sparse Representation, CSR）这一“即插即用”模块。 CSR通过结合稀疏自编码和高效系数矩阵运算，实现高保真、自适应表示。其性能在图像（>9%）、文本（>15%）、多模态（>7%）检索任务上大幅超越现有方法，且检索速度相较原始表示有卓越提升（69倍加速）。成果题目：《Beyond Matryoshka: Revisiting Sparse Coding for Adaptive Representation》

论文链接：https://openreview.net/forum?id=z19u9B2fCZ

大型系统检索/搜索依赖高质量特征。现有自适应表示学习（如MRL）虽提供可变嵌入长度，但局限性显著：需全参数微调模型，且在短长度下性能急剧下降，同时计算开销大、效率低。

图1 CSR模型架构总览

为应对这些挑战，本文提出对比稀疏表示学习（CSR），重新审视稀疏编码。与MRL截断密集预训练嵌入不同，CSR将预训练嵌入稀疏化到高维但选择性激活的特征空间，并通过引入重构损失和对比学习损失，在稀疏空间内最大限度保持原始语义信息。其“即插即用”特性允许在冻结预训练骨干模型之上训练简单稀疏模块，显著减少训练工作量和计算开销。

图2、部分实验结果

实验证明，CSR在图像、文本和多模态基准测试上均显著优于MRL及其变体，实现了准确性和效率的显著提升。例如，在ImageNet-1k 1-NN任务上，CSR实现了69倍的检索速度提升，同时保持了与全表示相近的性能。在相同计算成本下，其性能比MRL高出9%（ImageNet分类）、15%（MTEB文本检索）和7%（MS COCO检索）。

CSR已获国内外研究机构广泛关注（相关推文12w+浏览，开源代码100+ Star），并已集成至Sentence-Transformer库，极大提升了可用性。CSR与现有加速技术正交，可提供互补性能提升，其“即插即用”特性和卓越性能使其在内存受限、对延迟敏感的真实世界应用中具有巨大潜力。

异常检测相关成果进展

扩散模型在异常检测中凭借高保真建模能力表现优异，但其易依赖局部像素致异常区域重构不准，且多步采样过程导致推理缓慢，难符工业实时需求。为此，OmiAD引入自适应掩码策略实现精准重构；并通过对抗蒸馏机制将多步扩散压缩为单步生成，显著提升推理效率并保持高精度检测性能。

论文链接：https://openreview.net/forum?id=859NdHQv0Z&

为此，本文提出OmiAD（One-step Adaptive Masked Diffusion），一个兼顾高精度与高效率的多类异常检测一步扩散重构框架，旨在解决扩散模型部署瓶颈。OmiAD包含两大创新：自适应掩码扩散建模（AMDM）和对抗分数蒸馏压缩（ASD）。

图1 对抗分数蒸馏压缩(ASD)模型图

自适应掩码扩散建模（AMDM）：设计与噪声强度动态匹配的掩码策略。去噪早期，大掩码促模型依赖广泛上下文，避免局部像素依赖（解决pixel-level shortcut）；噪声减弱时，掩码缩小，引导模型聚焦细节，提升异常特征敏感性和定位精度。该机制平衡全局与局部信息，增强异常识别与重构质量。

对抗分数蒸馏压缩（ASD）：实现单步高效推理。ASD包含单步生成器、教师分数网络（源自AMDM）、学生分数网络和判别器。学生分数网络学习逼近教师网络在加噪数据上的分数估计，将多步扩散过程知识迁移到单步生成。通过基于Diffusion GAN的对抗训练（学生编码器复用为判别器），提升生成样本真实性和检测性能。

OmiAD在MVTec-AD、VisA、MPDD和Real-IAD等工业异常检测基准数据集上进行系统评估，结果显示其在图像级检测与像素级定位均取得当前最优性能，展现卓越鲁棒性与跨类别泛化能力。同时，OmiAD的推理速度显著优于主流Transformer-based和Diffusion-based方法，具备极强的实际部署潜力。

SAR目标角度鲁棒特征学习与识别相关成果进展

雷达目标散射特性随观测角度变化，但全角域样本数据通常难以获取，导致传统雷达目标识别模型在非完备样本条件下角度敏感性高，对地面车辆、驻坪飞机等重要目标的识别性能不稳健。

本论文聚焦于合成孔径雷达（SAR）目标识别角度敏感性高的问题，提出了基于**Gamma分布主成分分析（Gamma-Distribution Principal Component Analysis, ΓPCA）**的SAR目标特征学习与角度鲁棒识别方法。成果题目：《Gamma Distribution PCA-Enhanced Feature Learning for Angle-Robust SAR Target Recognition》

论文链接：https://openreview.net/forum?id=si1iynl5y7

本论文的两个主要贡献是：1.ΓPCA充分考虑SAR目标非高斯统计分布特性，推导一致性投影矩阵以提取低秩信息，从而有效捕获角度不敏感特征，增强了在非完备角域样本下特征提取模块对抗观测角度变化的能力，解决了深度学习模型的协变量偏移问题。2. ΓPCA可作为“即插即用”的角度鲁棒特征提取模块，无额外训练负担和参数地嵌入主流深度网络，在俯仰角和方位角同时偏移的复杂情景下，仍能为识别模型带来不低于10%的性能提升。

图1 ΓPCA角度鲁棒识别模型架构总览

实验表明，在MSTAR典型装甲车辆数据集上，提出的ΓPCA-ViT识别模型在面对训练数据75%方位角缺失、测试数据俯仰角大幅偏移的困难场景（如AD-R Test）时，识别准确率达到70.67±0.16%，相较于传统ViT模型提升了10.56%，在重复性实验中的识别稳定性也有一定提升。此外，该方法还被证明能显著提高抗噪能力。

本论文提出的ΓPCA能够提取SAR目标角度鲁棒特征，将其作为“即插即用”模块嵌入到主流深度网络后，有效降低了SAR目标识别网络对观测角度的敏感性，在全角域目标样本非完备条件下显著提升了SAR目标的识别概率。本成果在战场侦察与态势感知领域具有较高的应用价值。

上一篇：给太空“千里眼”戴上“矫正镜” 西电团队13年破解卫星成像变形难题

下一篇：研究生毕业生毛智在学院毕业典礼上的发言

通信地址：bevictor伟德邮编：710071 联系电话：029-88202280
图文传真：029-88202260 电子信箱：rsp@xidian.edu.cn 办公地址：伟德国际体育官网科技实验楼

雷人说是

视频号二维码

新闻公告

新闻公告

实验室在自适应表征学习、异常检测和SAR目标识别取得新进展

时间：2025/07/12 09:33:11 作者：点击数：

上一篇：给太空“千里眼”戴上“矫正镜” 西电团队13年破解卫星成像变形难题

下一篇：研究生毕业生毛智在学院毕业典礼上的发言

雷人说是

视频号二维码

新闻公告

新闻公告

实验室在自适应表征学习、异常检测和SAR目标识别取得新进展

时间：2025/07/12 09:33:11 作者： 点击数：_showDynClicks("wbnews", 1803160799, 4284)

上一篇：给太空“千里眼”戴上“矫正镜” 西电团队13年破解卫星成像变形难题

下一篇：研究生毕业生毛智在学院毕业典礼上的发言

时间：2025/07/12 09:33:11 作者：点击数：