天天看点

CVPR 2021 Sequential Graph Convolutional Network for Active Learning

CVPR 2021 Sequential Graph Convolutional Network for Active Learning

深度学习在计算机视觉方面展现出非常大的进步,其代价是大规模的标注数据集。数据标注是耗时的,需要人工和雇佣成本。在许多领域,数据标注更具挑战性,如医学成像领域。此外,在优化深层神经网络架构时,数据的代表性存在差距。为了克服这些问题,主动学习已被成功地用于有效地选择最有意义的样本。

大多数前人的研究将抽样方法和学习者结合在一起。这将模型限制为特定类型的任务。与这些工作不同的是,本论文提出了一种新的通用序列图卷积网络(GCN)主动学习训练方法。该方法分别训练学习者和抽样方法,是任务无关的。

图卷积网络是一种强大的工具,通过在邻近节点之间执行消息传递操作来诱导节点的高阶表示。本论文目标是利用GCN来丢弃多余的未标注样例,以得到有效的标注。为此,本论文将所有可用的数据用图表表示出来。每个节点表示图像描述,而边则表示图像的相似度。一开始,随机选择几个例子进行标注。这些带标注的实例作为种子,将带标注的数据信息传播到邻近的节点,并识别出类似于未带标注的实例。然后,学习图的参数以最小化二叉熵损失来识别有标注和无标注的样本。采用不确定性抽样的方法,根据置信度对样本进行分类,并对样本进行子样本标注。将最新的标注实例的标签从无标签更新为有标签,并训练图,优化图的参数,使修改的目标最小化。从而能够识别多余的未标注的数据流。在四个公开可用的图像分类基准上评估了该方法。实验证明优于几个具有竞争力的基准以及现有的方法。