异常检测方法可以识别偏离数据集正常行为的样本。它通常是针对包含多个标签类的正常数据的训练集或单一的无标签类的训练集。目前的方法在面对由多个类组成但没有标签的训练数据时很困难。在这项工作中,我们首先发现通过自我监督的图像聚类方法学习的分类器为无标签的多类数据集的异常检测提供了一个强大的基线。也许令人惊讶的是,我们发现用预先训练的特征初始化聚类方法并不能改善其自我监督的对应方法。相反,我们建议采用两个阶段的方法。我们首先使用自监督的方法对图像进行聚类,并为每张图像获得一个聚类标签。我们使用聚类标签作为分布外(OOD)方法的 "伪监督"。具体来说,我们在按聚类标签对图像进行分类的任务上对训练过的特征进行了微调。我们对我们的方法进行了广泛的分析,并证明了我们两阶段方法的必要性。我们对该方法与最先进的自我监督和预训练方法进行了评估,并证明了其优越性。
《Out-of-Distribution Detection without Class Labels》
论文地址:http://arxiv.org/abs/2112.07662v1