天天看点

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

作者:测绘学报
中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

本文内容来源于《测绘学报》2024年第1期(审图号GS京(2024)0107号)

知识引导的碎片化栅格地形图比例尺智能识别

任加新1,2,3

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

, 刘万增2,3,4

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

, 陈军2,3, 张蓝2,3,5, 陶远2,3,5, 朱秀丽2,3,4, 赵婷婷2,3,4, 李然2,3,4, 翟曦2,3,4, 王海清2,3,4, 周晓光1, 侯东阳1, 王勇6 1. 中南大学地球科学与信息物理学院, 湖南 长沙 410083;

2. 国家基础地理信息中心, 北京 100830;

3. 自然资源部时空信息与智能服务重点实验室, 北京 100830;

4. 湖北珞珈实验室, 湖北 武汉 430079;

5. 中国矿业大学环境与测绘学院, 江苏 徐州 221116;

6. 中国测绘科学研究院, 北京 100830基金项目:国家自然科学基金重大项目(42394062);国家重点研发计划(2022YFB3904205);湖北珞珈实验室开放基金资助项目(220100037)摘要:比例尺是确定地形图秘密等级的重要依据。本文针对碎片化栅格地形图比例尺判定的难题, 通过凝练地图尺度特征先验知识, 引导构建专家知识图像金字塔数据集(EKIPD), 然后使用深度卷积神经网络算法进行建模, 构建以知识为引导, 以数据为驱动, 以算法为核心的知识、数据与深度卷积神经网络耦合的混合智能模型。统计EKIPD中不同尺寸碎片化地形图的样本分布得到最优识别尺寸(ORS), 然后以ORS为步长对待识别地形图进行切分; 对每个子图分别使用模型进行预测, 集成子图的预测结果得到碎片化栅格地形图的比例尺。经过试验验证, 本文方法的识别精度在97%左右, 证明了本文方法的有效性。关键词:智能化测绘 专家知识 混合智能 栅格地形图 比例尺识别 深度卷积神经网络

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期
中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

引文格式:任加新, 刘万增, 陈军, 等. 知识引导的碎片化栅格地形图比例尺智能识别[J]. 测绘学报,2024,53(1):146-157. DOI: 10.11947/j.AGCS.2024.20230005

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

REN Jiaxin, LIU Wanzeng, CHEN Jun, et al. Knowledge-guided intelligent recognition of the scale for fragmented raster topographic maps[J]. Acta Geodaetica et Cartographica Sinica, 2024, 53(1): 146-157. DOI: 10.11947/j.AGCS.2024.20230005 阅读全文:http://xb.chinasmp.com/article/2024/1001-1595/20240113.htm

引 言地形图是按照制图规范,对地球表面的居民地、道路、水系、境界、地形、植被等自然和人文地理要素进行抽象、概括和表达,广泛运用于经济建设、国防建设和科学研究,是国家重要的基础性、战略性信息资源和生产要素。同时,地形图又是战场态势感知与可视化的基础,是赢得现代战争主动权的重要战略资源,是“国之重器,不可与人”。根据自然资源部、国家保密局关于印发《测绘地理信息管理工作国家秘密范围的规定》的通知(自然资发〔2020〕95号)中第6、7及18条的规定,大陆地形图属于国家秘密,其生产、管理、流转、使用、销毁都要遵守国家相关保密规定,实行全生命周期可追溯管理。保密鉴定是对地形图进行可追溯管理的重要技术环节,是按照国家涉密测绘成果相关管理规定,对疑似涉密地形图数据的保密等级进行评估,给出是否涉密及相应保密等级的鉴定意见。碎片化栅格地形图主要是指个别非法用户为逃避检查,蓄意将地形图上能够显性判断地形图比例尺的图号、坐标、比例尺等信息删除(图 1(a)),或者从完整的地形图裁出的部分内容不完整的地形图(图 1(b))。对碎片化栅格地形图进行比例尺判断一直是地形图保密鉴定工作的难点,需要有经验的制图专家根据不同的地理要素在不同比例尺地形图上表达的特征,结合自身制图经验进行综合评估,推定地形图的比例尺,进而确定其保密等级。

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期
图 1 不同类型的碎片化栅格地形图Fig. 1 Different types of fragmented raster topographic maps
图选项

地图符号的形状、色彩、大小往往与地形图比例尺息息相关,因而成为地图比例尺鉴定的重要依据。然而,在不同比例尺地形图上,同一地物具有不同的形状和大小,反过来,不同的地物也可能具有相同形状和尺寸,出现了“同物异谱”“异物同谱”现象(图 1(c))。进一步地,比例尺相近的地形图(如1∶25 000、1∶50 000、1∶100 000)由于采用相同的地图符号体系,在地图上表现出来的差异极小,地图专家需要花费更多精力确定该地形图的比例尺,导致人工检测速度慢,大大降低了地形图检核的效率,不利于涉密地形图的保护。近年来,人工智能技术由于能够代替专家自动设计特征,在测绘领域得到广泛运用[1-4]。文献[5]利用深度卷积神经网络(deep convolutional neural network,DCNN)实现了多尺度下的“问题地图”显著错误区域的智能检测,识别正确率可达80%以上。文献[6]将矢量数据与栅格图像相结合,利用神经网络学习区分立交桥类型的高层次模糊性特征,从而对OSM(open street map)中的复杂立交桥结构进行分类。文献[7]提出基于图卷积网络的高光谱影像分类方法,通过影像的空间光谱信息构建拓扑图,利用图卷积网络聚合邻近节点的特征信息,能在训练样本较少的情况下取得较高的分类精度。文献[8]提出一种基于参数自适应脉冲耦合神经网络模型和保持能量属性融合策略相结合的非下采样剪切波变换的遥感影像融合方法,可以融合复杂的遥感影像且适应性大大增强。由于碎片化地形图的比例尺是一种隐性信息,对碎片化地形图进行密级鉴定需要将不同比例尺的地图符号、注记、信息负载、地图语义、制图综合等知识与人工智能算法进行多节点耦合、多因素综合评估,才能得到相对合理的结果,目前还没有一种很好的解决方案。因此,本文提出一种碎片化地形图比例尺鉴别的知识、数据与深度卷积神经网络耦合的混合智能模型(knowledge-data-deep convolutional neural network coupled hybrid intelligence model,KDD-HIM)。由专家凝练地形图知识,结合DCNN逐步对图像进行抽象并自动设计特征的特点,引导构建专家知识图像金字塔数据集(expert knowledge image pyramid dataset,EKIPD),然后使用流行的DCNN进行多尺度训练;通过统计最优识别尺寸(optimal recognition size,ORS)对子图进行切分,集成子图预测结果得到最终的地形图比例尺。1 碎片化栅格地形图比例尺智能识别的总体思路栅格地形图与矢量地形图的最大不同在于栅格地形图是由规则的阵列构成,同一空间目标会被分解为阵列中相互独立,互不影响的多个元素(像元);不似矢量地形图,每个目标都有严格的数学模型,可以通过对空间目标进行空间计算求解比例尺信息。因而碎片化栅格地形图比例尺的识别,不是简单的空间计算,而是一种地图认知问题,其核心在于如何基于已有制图知识,挖掘地形图要素特征与相应比例尺之间的映射关系。为方便阐述,本文中的地形图均限定为碎片化栅格地形图。如图 2所示,本文借鉴智能化测绘[9-10]及知识服务[11-12]的思路,对地形图和深度卷积神经网络知识进行挖掘、提取、描述与表达,进而归纳凝练出地形图比例尺相关知识;利用先验知识构建用于地形图比例尺识别的专家知识图像金字塔数据集,通过该数据集代理专家先验知识,实现先验知识与卷积神经网络的深度耦合,提高了算法对比例尺的关注程度;设计了一套端到端的混合智能计算思路,挖掘地形图要素与比例尺之间的数学关系,实现地形图要素与比例尺高层次语义概念的逻辑自洽,能够快速、精确地对地形图的比例尺进行识别。

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期
图 2 知识引导的碎片化地形图比例尺智能识别总体思路Fig. 2 Overall idea of knowledge-guided intelligent recognition of the scale for fragmented topographic maps
图选项

2 知识引导的碎片化栅格地形图比例尺智能识别模型与算法为实现知识引导的碎片化栅格地形图比例尺智能识别,本文以知识为引导构建专家知识图像金字塔数据集,通过深度学习算法训练数据集,形成了知识、数据与深度卷积神经网络耦合的混合智能模型,主要分为3个部分:①专家知识图像金字塔数据集构建,利用地形图先验知识对原始地形图进行预处理,构建知识引导的多尺度金字塔数据集,增强算法对尺寸的敏感性,提高比例尺识别精度;②顾及专家知识的实时数据增强方法,顾及地形图专家先验知识,结合mixup[13]与小样本场景下的实时数据增强方法[5],在内存中实时生成训练样本,提高算法稳健性;③最优识别尺寸下的集成推理,通过统计与测试探索最优识别尺寸,采用集成算法优化识别结果。模型架构如图 3所示。

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期
图 3 KDD-HIM混合智能计算模型架构Fig. 3 Hybrid intelligent computing architecture of KDD-HIM
图选项

2.1 专家知识图像金字塔数据集构建地形图是按照严格的制图规范,依照统一的符号、颜色系统进行绘制,具有强烈的人为先验知识约束。DCNN特征图的尺寸随网络深度加深而变小,同一对象在不同网络层有不同的表达方式,这与相同地物在不同比例尺地形图下按“面-线-点”逐步精简尺寸的特性不谋而合。通过专家对地形图知识进行凝练,结合上述DCNN的特征,构建专家知识引导的数据集可以放大DCNN对尺寸的敏感性,提高比例尺识别精度。由表 1凝练的专家知识可以总结出尺寸是识别碎片化地形图比例尺的关键,需要在保证地形图信息的同时,对地形图按不同的切割方式并缩放到同一尺寸,使得DCNN根据该尺寸下同一类地物不同比例尺的差异表达识别地形图比例尺。据此提出固定尺寸、宽高比等比例切割及固定子图数变形切割方法(图 4),以构建用于地形图比例尺识别的专家知识图像金字塔数据集。

表 1 用于比例尺识别的DCNN和地形图专家知识Tab. 1 Expert knowledge of DCNN and topographic maps for scale recognition

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

表选项

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期
图 4 专家知识图像金字塔数据集构建流程Fig. 4 Flowchart of expert knowledge image pyramid dataset
图选项

2.1.1 固定尺寸、宽高比等比例切割方法如图 4(a)所示,将切割尺寸固定,对原始地形图进行切分,保存切分得到的子图并缩放为统一输入尺寸(unified input size,UIS)至专家知识图像金字塔数据集中。由于切割尺寸和输入尺寸均为正方形,经缩放后的子地形图宽高比例保持不变,不会发生变形,故称为等比例切割方法

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

(1)式中,BS表示基础尺寸(base size),目前流行的DCNN分类算法的UIS一般为299像素,若以该尺寸进行切割,无法携带足够的地物信息且会带来极大的计算量,故将BS设定为2×UIS,即598像素;factor表示切割系数,为保证切割得到的子图具有较大变化,一般取2的倍数;split size表示切割尺寸,在每一轮切割前,以BS为基础通过切割系数确定。通过多次改变切割尺寸后循环上述步骤,得到等比例数据集D1。

2.1.2 固定子图数变形切割方法如图 4(b)所示,参考2.1.1节中的等比例切割方法,每次切割前固定子图数,对原始地形图进行切分。由于一幅具有完整幅面的地形图一般为矩形,切分得到的子图往往也是矩形,缩放为正方形的UIS时必会产生形变,故称为变形切割方法

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

(2)式中,side表示子图数的行列数,一般情况下取行列数相等,为保证切割后的子图具有较大差异性同时兼顾计算效率,限定side为10以内的质数;subimage为子图数,即side的平方,在每一轮切割前,由side确定。通过多次改变子图数后循环上述步骤,得到变形数据集D2。通过上述2种方式构建EKIPD,模拟现实世界不同尺寸大小的碎片化地形图,生成模型对地形图比例尺的注意力机制,实现精确识别碎片化地形图的比例尺。

2.2 顾及专家知识的实时数据增强方法数据增强利用旋转、裁剪、加噪等多种变换方法,在现有数据基础上人为地扩大训练数据集,可提高DCNN的精度与泛化能力,在DCNN的训练中被广泛使用。但地形图与自然图像存在显著差异,需要结合地形图知识优选数据增强方法,对EKIPD进行扩充。根据2.1节凝练的专家知识,尺寸是影响DCNN识别地形图比例尺的关键,改变图像尺寸会影响比例尺识别精度。区别于传统的数据增强方法,不能使用尺寸相关的数据增强方法(如随机裁剪、水平拉伸、竖直拉伸等)处理EKIPD。如图 5所示,顾及2.1节凝练的专家知识,排除改变尺寸的数据增强方法,优选出基于知识的地形图增强方法(knowledge-based topographic map augmentation,KTMA)

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

(3)

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期
图 5 基于知识优选的地形图增强方法集合Fig. 5 Knowledge-based topographic map augmentation collection
图选项

如图 3(c)所示,结合mixup与文献[5]提出的小样本场景下的实时数据增强方法,在KTMA的基础上,对mixup算法进行改进,发展出顾及专家知识的实时数据增强方法

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

(4)式中,k表示本轮训练有k种数据增强方法;

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

表示向下取整;|KTMA|表示地形图增强方法集合中增强方法的数量;n表示当前训练轮次;E表示总的训练轮次数;aug表示本轮训练中随机选择的数据增强方法集合;x′和y′表示合成后的图像数据和标签;(xi, yi)和(xj, yj)为训练数据中随机抽取的2个样本,xi与xj表示原始图像数据,yi与yj表示原始标签;Beta表示贝塔分布;α∈(0, ∞);λ∈[0, 1]表示混合比例,本文认为所有图片贡献相同,则取λ=0.5,图 6展示了不同λ生成的样本。

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期
图 6 不同混合比例生成的训练样本Fig. 6 Training samples generated by different mixing ratios
图选项

该数据增强算法通过凝练专家知识优选适用于地形图比例尺识别的数据增强方法,在训练过程中,实时生成训练样本并两两配对,得到最终的混合样本及标签,在快速提高样本数量的同时不带来额外的时间、空间开销,且能够增加模型的准确性和稳健性。

2.3 基于深度卷积神经网络的地形图比例尺识别模型模型的选择需要结合具体问题及样本数据的特点[6, 17]。DCNN的性能与样本数据的分辨率、模型的深度,以及模型的宽度息息相关;而DCNN的模型设计往往依靠工程经验,没有明确的数学公式可以参考。研究人员往往通过修改某一项参数(如增加模型的深度),在一定范围内提高模型的性能,但很快会遭遇性能瓶颈,甚至出现精度下降[18]。为解决上述问题,EfficientNet[15]在有限的显存和计算资源限制下,通过复合缩放方法,同时探索样本分辨率、模型深度、模型宽度之间的相互影响,实现了模型精度和速度的最优权衡,在图像识别相关任务上达到SOTA(state-of-the-art)性能

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

(5)式中,d、w、r分别是用于缩放模型宽度、深度及分辨率的系数;⊙表示连续运算;

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

表示具体的运算操作;X表示输入的张量;

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

分别表示X的高度、宽度和通道数;target_memory是受限的显存大小;target_flops是受限的计算量。考虑到地形图比例尺事关保密鉴定的严肃性,对模型精度提出了要求;待鉴定地形图尺寸一般较大,需要拆分为子地形图进行比例尺识别,需要模型具备较快的推理速度。为兼顾精度和速度,本文采用轻量且高性能的EfficientNet进行特征提取与模型训练。

2.4 最优识别尺寸下的集成推理DCNN模型的性能与图像的分辨率有关,一般图像分辨率越大模型性能也越强[15, 19]。但在现实世界中,即使是碎片化的地形图尺寸也远超DCNN算法的统一输入尺寸,需要研究最优识别尺寸集成策略,避免识别尺寸太小,误导模型产生错误预测;或因识别尺寸太大,受限于显存容量因缩放显著丢失地形图信息,导致识别失败。如图 3(d)所示,为保持训练和预测阶段图像尺寸的一致性,兼顾解决大尺寸地形图因缩放带来的信息丢失问题,按最优识别尺寸ORS对待识别地形图进行图像切割,然后将子图的识别结果进行集成学习,得到最终的预测结果。

2.4.1 最优识别尺寸下的地形图切割在模型训练和预测阶段,应保持相同的分辨率,才能充分发挥模型的推理效果[20-22]。为克服不同尺寸下识别结果产生较大差异的问题,通过统计EKIPD中不同尺寸地形图的样本数量,得到表 2所示的样本数量top 5分布。为保持训练与预测过程的一致性,兼顾预测效率,设定ORS为样本数量最多的598像素,根据待检测地形图尺寸进行动态切割或缩放

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

(6)

表 2 EKIPD中样本数量top 5分布Tab. 2 Distribution of top 5 samples in EKIPD

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

注:†表示由于不同的原图像分辨率存在微小差异,固定子图数变形切割方法得到的子图像分辨率也存在微小的差异,故使用切割参数代替这部分图像的分辨率,下文也如此。表选项

式中,size(·)为待检测地形图的最短边;I为待检测地形图;Iwidth和Iheight分别为待检测地形图的宽和高;resize(·)表示当待检测地形图的最短边小于或等于ORS时,直接将该地形图缩放到UIS进行预测;split(·)表示当待检测地形图的最短边大于ORS时,依照ORS逐窗口对该地形图进行切割,然后将子图缩放到UIS进行预测。

2.4.2 基于概率加权的集成推理集成学习(ensemble learning)[23]通过组合多个简单模型以获得一个性能更优的组合模型,而且允许研究者可以针对具体的机器学习问题设计组合方案以得到更为强大的解决方案[24-27]。文献[28]从数学角度阐释集成学习比单个分类器更好的3个基本原因:统计、计算和代表性。借鉴集成学习的思想,在得到各分割子图的推理结果后,集成各子图得到的推理向量,得到最终的地形图比例尺,使得集成结果具有更低的方差和更好的泛化能力

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

(7)式中,pi为第i个分割子图的推理向量;T表示待检测地形图总共被切割为T张子图;argmax表示取得最大概率值时的索引即比例尺。3 试验与分析3.1 试验设备及数据试验的硬件环境为64 GB内存,Intel(R) Xeon(R) Gold 5222 [email protected] GHz处理器,Nvidia Quadro P4000 8 GB显卡。本文所有的DCNN全部基于Python语言和深度学习库Tensorflow实现。根据自然资源部、国家保密局关于印发《测绘地理信息管理工作国家秘密范围的规定》的通知(自然资发〔2020〕95号),1∶5000及更大比例尺标准图幅的地形图无法满足25 km2的面积要求,其衍生的碎片化地形图更加达不到25 km2的面积要求,因此不在本文鉴定范围内。据此,试验数据集选择1∶10 000、1∶25 000、1∶50 000、1∶100 000、1∶250 000及1∶500 000比例尺地形图各100幅,分辨率11 000×7000至13 000×8000,剔除破损的地形图后,共计557幅原始地形图。利用上述原始地形图构建的EKIPD包含141 798张图像分辨率为598×598至13 000×8000不同尺寸的碎片化地形图,按4∶1的比例划分为训练集和测试集。

3.2 试验设计为充分验证本文方法的有效性,本文采用精确度(precision)、召回率(recall)、F1值(F1 score)、准确率(accuracy)、宏平均精确度(macro-average precision)、宏平均召回率(macro-average recall)、宏平均F1值(macro-average F1 score)、基于样本数量的加权平均精确度(weighted-average precision)、加权平均召回率(weighted-average recall)和加权平均F1值(weighted-average F1 score)全方位评价模型综合性能。试验中采用在ImageNet上经过预训练的EfficientNet在EKIPD上进行迁移学习。其中不采用本文提出的KDD-HIM进行迁移学习的EfficientNet作为对比基准算法,记作Baseline-EfficientNet。算法的训练迭代轮次(epoch)统一设置为30,采用随机梯度下降法[29](stochastic gradient descent,SGD)对模型进行优化,初始学习率为0.003,依照式(8)衰减

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

(8)式中,lr表示每一轮所采用的学习率;lr0表示初始学习率;decay表示衰减系数,取0.95;epoch表示当前训练轮次;factor表示衰减频率,取2表示隔2轮衰减一次学习率;每个算法完成全部轮次的训练后,取验证精度最高的模型作为该算法的最终模型。

3.3 试验结果与分析通过与外部算法对比,表 3给出了KDD-HIM与Baseline-EfficientNet在EKIPD上的预测结果,可以看出,KDD-HIM在全部的7个指标中均大幅度优于Baseline-EfficientNet,有效地证明了所提算法的有效性。图 7给出了KDD-HIM与Baseline-EfficientNet在EKIPD上的混淆矩阵,Baseline-EfficientNet能够对1∶10 000比例尺地形图准确识别,但其他比例尺出现严重的错分,尤其是将615张1∶500 000比例尺的地形图错分为1∶ 50 000比例尺。KDD-HIM在全部6个比例尺均取得最好的分类效果,显著减少1∶25 000~1∶500 000比例尺的错分情况。

表 3 Baseline-EfficientNet与KDD-HIM对比Tab. 3 Comparison between Baseline-EfficientNet and KDD-HIM

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

表选项

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期
图 7 Baseline-EfficientNet与KDD-HIM在EKIPD测试集上的混淆矩阵Fig. 7 The confusion matrix of Baseline-EfficientNet and KDD-HIM with EKIPD
图选项

表 4展示了KDD-HIM在全部6个比例尺下每个比例尺的识别性能,所有指标均在90%以上,特别是1∶10 000、1∶25 000比例尺全部做到正确识别,其他比例尺上存在少部分识别错误。分析发现上述错误识别案例中主要包含两种情况:①地物元素太过单一(如含有大量的水体),由于这种情况属于极端情况,在训练集中为极少出现,模型需要优先考虑大部分样本的地物要素分布情况,因此对这部分样本产生了错分情况;②较小比例尺(相对于1∶ 10 000),由于携带的地物符号太过粗略,缺乏地物细节信息,导致模型识别错误。

表 4 KDD-HIM在各比例尺下的性能对比Tab. 4 Performance comparison of KDD-HIM at various scales

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期

表选项

为进一步研究地形图尺寸对识别精度的影响,对EKIPD中各切割方式得到的地形图独立进行训练,得到单一尺寸下的模型试验结果(图 8)。其中,黑线代表固定尺寸、宽高比等比例切割方法得到的模型预测结果。由图 8可以看出,随着图像尺寸的增加,模型性能随之增加(黑色、实心标记),这可能是因为样本中包含了更多的信息。当地形图尺寸增加到897×897时,模型性能达到最高,进一步增加地形图尺寸反而会降低模型性能(黑色、空心标记)。这可能是因为过于增加地形图尺寸虽包含大量的地物,但由于缩放为UIS丢失大量的细节信息,导致识别错误。红线代表固定子图数变形切割方法,随着子图数的增多,图像尺寸变小,性能反而提升。特别是299×299与2行2列两种尺寸的模型性能显著低于其他尺寸,分别证明过小或过大的训练尺寸均会削弱模型的性能。

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期
图 8 单一尺寸地形图对模型性能的影响Fig. 8 Influence of single-size topographic map on model performance
图选项

图 9给出了单一尺寸数据模型在EKIPD测试集上的具体混淆矩阵,可以看出单尺寸的地形图无法彻底兼顾全局的6种比例尺,只能在少数比例尺取得优异性能,即使是性能最优异的897×897模型依然存在将116张1∶250 000地形图错分为1∶500 000地形图的情况。EKIPD通过将单尺寸的训练数据充分混合形成多尺度数据集,相同类型下只有36张错分为1∶500 000地形图,错误比例降低接近70%,显著提升了本文方法对全局比例尺的识别性能。

中南大学任加新博士:知识引导的碎片化栅格地形图比例尺智能识别 |《测绘学报》2024年53卷第1期
图 9 单一尺寸数据模型在EKIPD测试集上的混淆矩阵Fig. 9 The confusion matrix of a single-scale model with EKIPD
图选项

4 结语地理信息保密鉴定是当前国家地理信息安全监管工作实施的迫切需求。本文针对碎片化栅格地形图保密等级智能化判定的难题,通过凝练DCNN和地形图知识,提出知识、数据与深度卷积神经网络耦合的混合智能模型,成功挖掘出地形图要素特征与相应比例尺之间的映射关系,通过试验得出本文方法的识别准确率为0.974 91,对比原始DCNN网络提高近一倍性能,能够有效识别碎片化地形图的比例尺。基于本文方法构建的密级鉴定系统已经在国家基础地理信息中心进行应用,代替传统费时费力的人工检核工作,为涉密地理信息的安全监管提供了有效的手段。虽然本文方法已能够有效识别碎片化地形图比例尺,但仍有少部分待检测地形图会被错分,后续将研究精度进一步提升的方法。作者简介第一作者简介:任加新(1993—),男,博士生,研究方向为智能化测绘。E-mail:[email protected]通信作者:刘万增 E-mail:[email protected]

初审:张艳玲复审:宋启凡

终审:金 君

资讯

继续阅读