搜索

您的关键词

新闻公告

近日,2025年国际机器学习会议(The Forty-second International Conference on Machine Learning,简称ICML2025)在温哥华会议中心举行。实验室陈渤教授团队和张鹏教授团队的三位学生论文分别被录用,《Beyond Matryoshka: Revisiting Sparse Coding for Adaptive Representation》(文添圣)、《OmiAD: One-Step Adaptive Masked Diffusion Model for Multi-class Anomaly Detection via Adversarial Distillation》(冯耀轩)和《Gamma Distribution PCA-Enhanced Feature Learning for Angle-Robust SAR Target Recognition》(张翀)。

ICML是人工智能领域最具影响力的顶级学术会议之一,被中国计算机学会(CCF)评为A类国际会议,与NeurIPS和ICLR并称为人工智能与机器学习领域的三大权威国际顶会。据ICML官方统计,今年大会共收到12107篇投稿,较去年增加了28%,共有3260篇论文被接收,接收率为26.9%。其中,文添圣同学的论文进入“Oral Presentation”, 入选率仅为1%,也是学校首次有论文出现在该环节。


自适应特征学习相关成果进展

在延迟敏感的大规模系统中,高质量深度表示对检索、搜索和生成任务至关重要,尤其需支持高效索引。 本文重新审视稀疏编码潜力,提出“稀疏对比表示”(Contrastive Sparse Representation, CSR)这一“即插即用”模块。 CSR通过结合稀疏自编码和高效系数矩阵运算,实现高保真、自适应表示。其性能在图像(>9%)、文本(>15%)、多模态(>7%)检索任务上大幅超越现有方法,且检索速度相较原始表示有卓越提升(69倍加速)。成果题目:《Beyond Matryoshka: Revisiting Sparse Coding for Adaptive Representation》

论文链接:https://openreview.net/forum?id=z19u9B2fCZ

大型系统检索/搜索依赖高质量特征。现有自适应表示学习(如MRL)虽提供可变嵌入长度,但局限性显著:需全参数微调模型,且在短长度下性能急剧下降,同时计算开销大、效率低。

图1 CSR模型架构总览

为应对这些挑战,本文提出对比稀疏表示学习(CSR),重新审视稀疏编码。与MRL截断密集预训练嵌入不同,CSR将预训练嵌入稀疏化到高维但选择性激活的特征空间,并通过引入重构损失和对比学习损失,在稀疏空间内最大限度保持原始语义信息。其“即插即用”特性允许在冻结预训练骨干模型之上训练简单稀疏模块,显著减少训练工作量和计算开销。

图2、部分实验结果

实验证明,CSR在图像、文本和多模态基准测试上均显著优于MRL及其变体,实现了准确性和效率的显著提升。例如,在ImageNet-1k 1-NN任务上,CSR实现了69倍的检索速度提升,同时保持了与全表示相近的性能。在相同计算成本下,其性能比MRL高出9%(ImageNet分类)、15%(MTEB文本检索)和7%(MS COCO检索)。

CSR已获国内外研究机构广泛关注(相关推文12w+浏览,开源代码100+ Star),并已集成至Sentence-Transformer库,极大提升了可用性。CSR与现有加速技术正交,可提供互补性能提升,其“即插即用”特性和卓越性能使其在内存受限、对延迟敏感的真实世界应用中具有巨大潜力。


异常检测相关成果进展

扩散模型在异常检测中凭借高保真建模能力表现优异,但其易依赖局部像素致异常区域重构不准,且多步采样过程导致推理缓慢,难符工业实时需求。为此,OmiAD引入自适应掩码策略实现精准重构;并通过对抗蒸馏机制将多步扩散压缩为单步生成,显著提升推理效率并保持高精度检测性能。

论文链接:https://openreview.net/forum?id=859NdHQv0Z&

为此,本文提出OmiAD(One-step Adaptive Masked Diffusion),一个兼顾高精度与高效率的多类异常检测一步扩散重构框架,旨在解决扩散模型部署瓶颈。OmiAD包含两大创新:自适应掩码扩散建模(AMDM)和对抗分数蒸馏压缩(ASD)

图1 对抗分数蒸馏压缩(ASD)模型图

自适应掩码扩散建模(AMDM):设计与噪声强度动态匹配的掩码策略。去噪早期,大掩码促模型依赖广泛上下文,避免局部像素依赖(解决pixel-level shortcut);噪声减弱时,掩码缩小,引导模型聚焦细节,提升异常特征敏感性和定位精度。该机制平衡全局与局部信息,增强异常识别与重构质量。

对抗分数蒸馏压缩(ASD):实现单步高效推理。ASD包含单步生成器、教师分数网络(源自AMDM)、学生分数网络和判别器。学生分数网络学习逼近教师网络在加噪数据上的分数估计,将多步扩散过程知识迁移到单步生成。通过基于Diffusion GAN的对抗训练(学生编码器复用为判别器),提升生成样本真实性和检测性能。

OmiAD在MVTec-AD、VisA、MPDD和Real-IAD等工业异常检测基准数据集上进行系统评估,结果显示其在图像级检测与像素级定位均取得当前最优性能,展现卓越鲁棒性与跨类别泛化能力。同时,OmiAD的推理速度显著优于主流Transformer-based和Diffusion-based方法,具备极强的实际部署潜力。


SAR目标角度鲁棒特征学习与识别相关成果进展

雷达目标散射特性随观测角度变化,但全角域样本数据通常难以获取,导致传统雷达目标识别模型在非完备样本条件下角度敏感性高,对地面车辆、驻坪飞机等重要目标的识别性能不稳健。

本论文聚焦于合成孔径雷达(SAR)目标识别角度敏感性高的问题,提出了基于**Gamma分布主成分分析(Gamma-Distribution Principal Component Analysis, ΓPCA)**的SAR目标特征学习与角度鲁棒识别方法。成果题目:《Gamma Distribution PCA-Enhanced Feature Learning for Angle-Robust SAR Target Recognition》

论文链接:https://openreview.net/forum?id=si1iynl5y7

本论文的两个主要贡献是:1.ΓPCA充分考虑SAR目标非高斯统计分布特性,推导一致性投影矩阵以提取低秩信息,从而有效捕获角度不敏感特征,增强了在非完备角域样本下特征提取模块对抗观测角度变化的能力,解决了深度学习模型的协变量偏移问题。2. ΓPCA可作为“即插即用”的角度鲁棒特征提取模块,无额外训练负担和参数地嵌入主流深度网络,在俯仰角和方位角同时偏移的复杂情景下,仍能为识别模型带来不低于10%的性能提升。

图1 ΓPCA角度鲁棒识别模型架构总览

实验表明,在MSTAR典型装甲车辆数据集上,提出的ΓPCA-ViT识别模型在面对训练数据75%方位角缺失、测试数据俯仰角大幅偏移的困难场景(如AD-R Test)时,识别准确率达到70.67±0.16%,相较于传统ViT模型提升了10.56%,在重复性实验中的识别稳定性也有一定提升。此外,该方法还被证明能显著提高抗噪能力。

本论文提出的ΓPCA能够提取SAR目标角度鲁棒特征,将其作为“即插即用”模块嵌入到主流深度网络后,有效降低了SAR目标识别网络对观测角度的敏感性,在全角域目标样本非完备条件下显著提升了SAR目标的识别概率。本成果在战场侦察与态势感知领域具有较高的应用价值。

上一篇:给太空“千里眼”戴上“矫正镜” 西电团队13年破解卫星成像变形难题

下一篇:研究生毕业生毛智在学院毕业典礼上的发言