本文的研究者提出了一种整合两个优化目标的拓扑感知鲁棒优化(TRO)方法,通过无缝地集成拓扑信息,以增强模型的分布外(OOD)泛化性能。实验结果证明,TRO在包括分类、回归和语义分割在内的广泛任务中相对于SOTA具有更优越的性能。目前,该工作已被ICLR 2023收录。
论文链接:https://openreview.net/pdf?id=ylMq8MBnAp
代码链接:https://github.com/joffery/TRO
一、 研究背景
近年来,机器学习(ML)被广泛应用在高风险和安全关键型应用中。这类应用提出了前所未有的“分布外(OOD)泛化挑战”:ML模型不断接触到训练空间之外的未知分布。尽管在“内插”问题上取得了巨大的成功,但现代ML模型(如深度神经网络)在“外推”问题上非常薄弱;即使平均准确性很高的模型在面对罕见或未知分布时也可能发生灾难性失败。例如,针对美国2000年至2020年间所有89次重大洪水事件进行训练的洪水预测模型,会错误地对2021年的“飓风艾达”事件进行预测。如果不解决这个挑战,模型的应用场景及其相关风险将变得不清楚。
一种解决分布外泛化问题的有效方法是进行分布鲁棒优化(DRO)[1]。DRO通过构建一个“不确定性集合”以最小化潜在测试分布的“最坏”(worst-case)预期风险。这个不确定性集合通常被构造为一个围绕训练集的散度球。与最小化平均风险的方法(ERM)相比,DRO对来自虚假相关性、对抗攻击、子群体或自然变化等因素引起的“分布漂移”更具有鲁棒性[2]。然而,构建一个能够真正近似未知分布的不确定性集合来是一个非常具有挑战性的任务。一方面,为了对抗广泛的分布漂移,不确定性集合必须足够大,这增加了包含不可信分布(例如异常值)的风险,从而导致过于悲观的模型和低预测置信度[3]。另一方面,最坏分布不一定是与未知分布真正相关的“有影响力的分布”;优化最坏分布而不是有影响力的分布会牺牲模型的鲁棒性。
二、方法介绍
因为模型不可能泛化到任意的未知分布,我们假设数据分布的拓扑结构对构建真实的“不确定性集合”至关重要。更具体地说,我们提出了一种整合两个优化目标的拓扑感知鲁棒优化(TRO)方法:
- 拓扑学习:我们将数据分布建模为位于共同低维流形上的多个离散组,通过使用物理先验或测量分布之间的多尺度推土距离(EMD)来“探索”分布拓扑。
- 拓扑上的学习:然后,利用获得的分布拓扑来构建一个真实的不确定性集合,其中鲁棒优化将泛化风险限制在拓扑图中,而不是盲目地泛化到未知分布上。
图1 拓扑感知的鲁棒优化(TRO)概述
2.1 拓扑学习:探索分布拓扑
数据分布的拓扑结构可以通过一个图
来表示,其中实体
表示数据分布,边
表示分布之间的相互作用。拓扑图的构建包括:1.识别实体: 我们假设实体由给定的分布ID定义;2.揭示相互作用: 我们考虑两种情况来衡量离散分布之间的距离,如图 1所示。
-
基于物理的分布拓扑:在邻接信息已知的场景下,我们可以通过简单地施加预定义的邻域信息来获得拓扑
。
例如,为了捕捉美国各州的天气事件相似性,可以构建一个图,其中每个州表示一个实体,两个州之间的物理邻接关系形成一条边(见图 1)。在这种情况下,
作为物理先验约束引入到2.2介绍的鲁棒优化中。
-
基于数据的分布拓扑: 在缺乏
的情况下,我们提出了一种数据驱动的方法来从训练数据中学习拓扑
。
具体而言,我们根据数据的关联矩阵,将各个分布嵌入到一个共享的数据图上。受 [4] 的启发,这样的数据图可以被视为黎曼流形的离散化。通过在图上模拟时间依赖的扩散过程,我们将获得每个组在多个尺度上的密度估计,这将用于计算两个组之间的
距离。这种多尺度的
距离已被证明在拓扑上等价于流形测地线上的推土距离,但将
个分布
个数据点的计算复杂度从
降低到
[5]。虽然
的计算成本高于
,但我们在实验结果表明,使用
可以进一步提高模型的鲁棒性。此外,消融研究也表明,
与领域知识一致,并且增强了TRO的可解释性。最后,基于数据的方法完全可微分,可以以端到端的方式共同进行拓扑学习和拓扑上的学习。我们将其留作未来的工作。
2.2 拓扑上的学习:利用拓扑进行鲁棒优化
接下来,我们提出了一种基于分布拓扑的优化方法来开发 TRO。关键挑战在于如何利用
构建一个“不确定性集合”以降低模型在未见分布上的泛化风险。我们的主要思想是评估数据分布的中心度。结点中心度在社交网络分析中被广泛使用[6],用于衡量每个实体的信息传播程度。在这里,我们引入“分布中心度”来识别与未见分布真正相关的“有影响力的分布”。分布中心度可以使用图计量,如度、中介度和紧密度来计算。更具体地说,我们首先计算
中每个实体的中心度,得到一个拓扑先验
,以识别有影响力的分布。然后,我们使用训练集分布的任意混合以构建“不确定性集合” Q。最后,在鲁棒优化中我们使用先验
来约束不确定性集合 Q:
直观上, 具有高训练损失和中心度的分布将被赋予较大的权重;这可以在拓扑图内极大地限制OOD泛化风险。
其中
表示分布
的权重,
是一个
维的概率单纯形。
是任意分布距离度量。例如,
距离或KL散度。
三、实验结果
我们在广泛的任务中对TRO进行了评估,包括分类、回归和语义分割。我们将TRO与最先进的基准模型进行了OOD泛化性能的比较,并对TRO的关键组成部分进行了消融研究。
3.1 气温预测
图2 (左) TPT-48上 N
S泛化任务。(中) 基于物理的拓扑的分布中心度。(右)基于数据驱动的拓扑的分布中心度。TRO将“PA”识别为物理拓扑中影响力较大的分布;TRO将“NY”,“PA”和“MA”识别为数据驱动拓扑中影响力较大的分布。数据拓扑的均方误差低于物理拓扑。数据集。TPT-48[7] 包含了美国48个相邻州从2008年到2019年的月平均温度数据。我们专注于回归任务,根据前6个月的温度预测接下来6个月的温度。我们考虑了两个泛化任务:1、E(24)
W(24):我们将24个东部州作为训练组,24个西部州作为测试组;2、N(24)
S(24):我们将24个北部州作为训练组,24个南部州作为测试组。与最近的训练组相距一条边的测试组定义为Hop-1测试组,相距两条边的测试组定义为Hop-2测试组,其余组定义为Hop-3 测试组。TPT-48数据集上的N(24)
S(24)的可视化结果如图 2 (左) 所示。
表1 E (24)
W (24)和N (24)
S (24)两个任务在TPT-48上的均方误差(MSE)。TRO(基于数据驱动的拓扑)在这两个任务中始终优于TRO(基于物理的拓扑),表明数据驱动的拓扑更准确地捕捉到了分布关系。结果。我们在上表中展示了TPT-48的结果。TRO在两个任务中均获得了最低的平均均方误差(MSE)。我们还报告了两个任务中Hop-1、Hop-2和Hop-3测试组的平均均方误差。尽管在N(24)
S(24)任务中,REx在Hop-1和Hop-2组上的误差最低,但在Hop-3组上的预测误差最高。结果表明,REx在面对较大的分布漂移时可能会产生性能上的妥协。TRO在Hop-3组上表现出最佳性能,表明它在面对较大的分布漂移时具有强大的泛化能力。
3.2 洪水分割
图3 (左)Sen1Floods11 上的11个洪水事件的位置。我们将事件 “BOL” 用于测试,其他事件用于训练。(右) Sen1Floods11 上的基于数据驱动的分布拓扑。(1)TRO将“IND” 和 “NGA” 识别为最具影响力的分布。一个可能的解释是,“IND” 和 “NGA” 都是由于暴雨引起的,而暴雨是导致洪水的最常见灾害。(2)TRO将“GHA”和“KHM”识别为影响力最小的分布。一个可能的解释是,“GHA”和“KHM”都是由于边缘情况,如水坝破坏,而引起的。基于数据驱动的分布拓扑与领域知识一致,并有助于解释TRO的结果。
数据集。Sen1Floods11[8] 是一个用于全球洪水映射的公共数据集。该数据集提供了全球范围内的4,831个512 x 512的分辨率为10米的卫星图像,涵盖了11个不同的洪水事件,总共覆盖了120,406平方千米的区域。每个图像都附带有像素级的标签。11个洪水事件的位置如图 3(左)所示。不同的洪水事件在边界条件、地形和其他潜在因素上存在变化,对现有模型的可靠性和可解释性提出了显著的OOD挑战。按照[8]的约定,事件“BOL”被保留作为测试集,其他事件的数据随机划分为训练集和验证集,比例为80%和20%。
表2 Sen1Floods11的分割结果(IoU)。TRO在未见的洪水事件上比其他基准模型表现出更好的性能。
结果。我们在上表中展示了Sen1Floods11的结果。ERM在验证集上获得了最高的Intersection over Union (IoU),而TRO在测试集上获得了最高的IoU。结果证明,TRO在未见的洪水事件上比其他基准模型表现出更好的性能。
四、结语
我们的贡献包括:
- 一种新的优化方法,通过无缝地集成拓扑信息,以增强模型的分布外(OOD)泛化性能。
- 理论分析证明我们的方法在凸和非凸损失函数下都具有快速收敛性,同时对泛化风险进行了严格的界定。
- 在包括分类、回归和语义分割在内的广泛任务中的实验结果证明我们的方法相对于SOTA具有更优越的性能。
- 数据驱动的分布拓扑与领域知识一致,并增强了模型的可解释性。
参考文献
[1] Namkoong et al. Stochastic gradient methods for distributionally robust optimization with f-divergences. NeurIPS 2016
[2] Robey et al. Model-based domain generalization. NeurIPS 2021
[3] Hu et al. Does distributionally robust supervised learning give robust classifiers? ICML 2018
[4] Leeb et al. Hölder–lipschitz norms and their duals on spaces with semigroups, with applications to earth mover’s distance. Journal of Fourier Analysis and Applications, 2016
[5] Tong et al. Diffusion earth mover’s distance and distribution embeddings. ICML 2021
[6] Newman. A measure of betweenness centrality based on random walks. Social networks, 2005
[7] Xu et al. Graph-relational domain adaptation. ICLR 2022
[8] Bonafilia et al. Sen1floods11: A georefer- enced dataset to train and test deep learning flood algorithms for sentinel-1. CVPR Workshops, 2020
招生信息
特拉华大学(University of Delaware)计算机系(Computer and Information Sciences) 招收2024 Spring/Fall全奖博士生
研究方向:
导师:彭曦(Dr. Xi Peng, Assistant Professor)关于实验室:我们持续在顶会发表工作包括NeurIPS, ICLR, CVPR, ICCV, ECCV, KDD, AAAI, IJCAI;近些年入学的几位同学已经在CVPR’20-23,AAAI’21,TPAMI'22,ICLR'23,ICCV'23 发表一作论文并且荣获 NeurIPS’21 Workshop Best Paper Award;我们与北美多家工业界实验室合作紧密可推荐优秀学生前往暑期实习Google Research, Snap Research, Amazon AWS, IBM Watson Research.更多信息:https://deep-real.github.io/邮件:[email protected]邮箱主题/简历命名格式:博士申请+姓名作者:乔逢春
- Robust and Explainable DL;
- Human-centered Computer Vision.
Illustration by IconScout Store from IconScout-The End-
扫码观看!
本周上新!
“AI技术流”原创投稿计划
TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线480+期talk视频,2400+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。
投稿内容
// 最新技术解读/系统性知识分享 //
// 前沿资讯解说/心得经历讲述 //
投稿须知
稿件需要为原创文章,并标明作者信息。
我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励
投稿方式
发送邮件到
或添加工作人员微信(chemn493)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。
>>> 添加小编微信!
关于我“门”▼
将门是一家以专注于数智核心科技领域的新型创投机构,也是北京市标杆型孵化器。公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。
将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。
如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:
⤵一键送你进入TechBeat快乐星球