天天看點

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

作者:測繪學報
中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

本文内容來源于《測繪學報》2024年第1期(審圖号GS京(2024)0107号)

知識引導的碎片化栅格地形圖比例尺智能識别

任加新1,2,3

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

, 劉萬增2,3,4

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

, 陳軍2,3, 張藍2,3,5, 陶遠2,3,5, 朱秀麗2,3,4, 趙婷婷2,3,4, 李然2,3,4, 翟曦2,3,4, 王海清2,3,4, 周曉光1, 侯東陽1, 王勇6 1. 中南大學地球科學與資訊實體學院, 湖南 長沙 410083;

2. 國家基礎地理資訊中心, 北京 100830;

3. 自然資源部時空資訊與智能服務重點實驗室, 北京 100830;

4. 湖北珞珈實驗室, 湖北 武漢 430079;

5. 中國礦業大學環境與測繪學院, 江蘇 徐州 221116;

6. 中國測繪科學研究院, 北京 100830基金項目:國家自然科學基金重大項目(42394062);國家重點研發計劃(2022YFB3904205);湖北珞珈實驗室開放基金資助項目(220100037)摘要:比例尺是确定地形圖秘密等級的重要依據。本文針對碎片化栅格地形圖比例尺判定的難題, 通過凝練地圖尺度特征先驗知識, 引導建構專家知識圖像金字塔資料集(EKIPD), 然後使用深度卷積神經網絡算法進行模組化, 建構以知識為引導, 以資料為驅動, 以算法為核心的知識、資料與深度卷積神經網絡耦合的混合智能模型。統計EKIPD中不同尺寸碎片化地形圖的樣本分布得到最優識别尺寸(ORS), 然後以ORS為步長對待識别地形圖進行切分; 對每個子圖分别使用模型進行預測, 內建子圖的預測結果得到碎片化栅格地形圖的比例尺。經過試驗驗證, 本文方法的識别精度在97%左右, 證明了本文方法的有效性。關鍵詞:智能化測繪 專家知識 混合智能 栅格地形圖 比例尺識别 深度卷積神經網絡

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期
中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

引文格式:任加新, 劉萬增, 陳軍, 等. 知識引導的碎片化栅格地形圖比例尺智能識别[J]. 測繪學報,2024,53(1):146-157. DOI: 10.11947/j.AGCS.2024.20230005

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

REN Jiaxin, LIU Wanzeng, CHEN Jun, et al. Knowledge-guided intelligent recognition of the scale for fragmented raster topographic maps[J]. Acta Geodaetica et Cartographica Sinica, 2024, 53(1): 146-157. DOI: 10.11947/j.AGCS.2024.20230005 閱讀全文:http://xb.chinasmp.com/article/2024/1001-1595/20240113.htm

引 言地形圖是按照制圖規範,對地球表面的居民地、道路、水系、境界、地形、植被等自然和人文地理要素進行抽象、概括和表達,廣泛運用于經濟建設、國防建設和科學研究,是國家重要的基礎性、戰略性資訊資源和生産要素。同時,地形圖又是戰場态勢感覺與可視化的基礎,是赢得現代戰争主動權的重要戰略資源,是“國之重器,不可與人”。根據自然資源部、國家保密局關于印發《測繪地理資訊管理工作國家秘密範圍的規定》的通知(自然資發〔2020〕95号)中第6、7及18條的規定,大陸地形圖屬于國家秘密,其生産、管理、流轉、使用、銷毀都要遵守國家相關保密規定,實行全生命周期可追溯管理。保密鑒定是對地形圖進行可追溯管理的重要技術環節,是按照國家涉密測繪成果相關管理規定,對疑似涉密地形圖資料的保密等級進行評估,給出是否涉密及相應保密等級的鑒定意見。碎片化栅格地形圖主要是指個别非法使用者為逃避檢查,蓄意将地形圖上能夠顯性判斷地形圖比例尺的圖号、坐标、比例尺等資訊删除(圖 1(a)),或者從完整的地形圖裁出的部分内容不完整的地形圖(圖 1(b))。對碎片化栅格地形圖進行比例尺判斷一直是地形圖保密鑒定工作的難點,需要有經驗的制圖專家根據不同的地理要素在不同比例尺地形圖上表達的特征,結合自身制圖經驗進行綜合評估,推定地形圖的比例尺,進而确定其保密等級。

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期
圖 1 不同類型的碎片化栅格地形圖Fig. 1 Different types of fragmented raster topographic maps
圖選項

地圖符号的形狀、色彩、大小往往與地形圖比例尺息息相關,因而成為地圖比例尺鑒定的重要依據。然而,在不同比例尺地形圖上,同一地物具有不同的形狀和大小,反過來,不同的地物也可能具有相同形狀和尺寸,出現了“同物異譜”“異物同譜”現象(圖 1(c))。進一步地,比例尺相近的地形圖(如1∶25 000、1∶50 000、1∶100 000)由于采用相同的地圖符号體系,在地圖上表現出來的差異極小,地圖專家需要花費更多精力确定該地形圖的比例尺,導緻人工檢測速度慢,大大降低了地形圖檢核的效率,不利于涉密地形圖的保護。近年來,人工智能技術由于能夠代替專家自動設計特征,在測繪領域得到廣泛運用[1-4]。文獻[5]利用深度卷積神經網絡(deep convolutional neural network,DCNN)實作了多尺度下的“問題地圖”顯著錯誤區域的智能檢測,識别正确率可達80%以上。文獻[6]将矢量資料與栅格圖像相結合,利用神經網絡學習區分立交橋類型的高層次模糊性特征,進而對OSM(open street map)中的複雜立交橋結構進行分類。文獻[7]提出基于圖卷積網絡的高光譜影像分類方法,通過影像的空間光譜資訊建構拓撲圖,利用圖卷積網絡聚合鄰近節點的特征資訊,能在訓練樣本較少的情況下取得較高的分類精度。文獻[8]提出一種基于參數自适應脈沖耦合神經網絡模型和保持能量屬性融合政策相結合的非下采樣剪切波變換的遙感影像融合方法,可以融合複雜的遙感影像且适應性大大增強。由于碎片化地形圖的比例尺是一種隐性資訊,對碎片化地形圖進行密級鑒定需要将不同比例尺的地圖符号、注記、資訊負載、地圖語義、制圖綜合等知識與人工智能算法進行多節點耦合、多因素綜合評估,才能得到相對合理的結果,目前還沒有一種很好的解決方案。是以,本文提出一種碎片化地形圖比例尺鑒别的知識、資料與深度卷積神經網絡耦合的混合智能模型(knowledge-data-deep convolutional neural network coupled hybrid intelligence model,KDD-HIM)。由專家凝練地形圖知識,結合DCNN逐漸對圖像進行抽象并自動設計特征的特點,引導建構專家知識圖像金字塔資料集(expert knowledge image pyramid dataset,EKIPD),然後使用流行的DCNN進行多尺度訓練;通過統計最優識别尺寸(optimal recognition size,ORS)對子圖進行切分,內建子圖預測結果得到最終的地形圖比例尺。1 碎片化栅格地形圖比例尺智能識别的總體思路栅格地形圖與矢量地形圖的最大不同在于栅格地形圖是由規則的陣列構成,同一空間目标會被分解為陣列中互相獨立,互不影響的多個元素(像元);不似矢量地形圖,每個目标都有嚴格的數學模型,可以通過對空間目标進行空間計算求解比例尺資訊。因而碎片化栅格地形圖比例尺的識别,不是簡單的空間計算,而是一種地圖認知問題,其核心在于如何基于已有制圖知識,挖掘地形圖要素特征與相應比例尺之間的映射關系。為友善闡述,本文中的地形圖均限定為碎片化栅格地形圖。如圖 2所示,本文借鑒智能化測繪[9-10]及知識服務[11-12]的思路,對地形圖和深度卷積神經網絡知識進行挖掘、提取、描述與表達,進而歸納凝練出地形圖比例尺相關知識;利用先驗知識建構用于地形圖比例尺識别的專家知識圖像金字塔資料集,通過該資料集代理專家先驗知識,實作先驗知識與卷積神經網絡的深度耦合,提高了算法對比例尺的關注程度;設計了一套端到端的混合智能計算思路,挖掘地形圖要素與比例尺之間的數學關系,實作地形圖要素與比例尺高層次語義概念的邏輯自洽,能夠快速、精确地對地形圖的比例尺進行識别。

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期
圖 2 知識引導的碎片化地形圖比例尺智能識别總體思路Fig. 2 Overall idea of knowledge-guided intelligent recognition of the scale for fragmented topographic maps
圖選項

2 知識引導的碎片化栅格地形圖比例尺智能識别模型與算法為實作知識引導的碎片化栅格地形圖比例尺智能識别,本文以知識為引導建構專家知識圖像金字塔資料集,通過深度學習算法訓練資料集,形成了知識、資料與深度卷積神經網絡耦合的混合智能模型,主要分為3個部分:①專家知識圖像金字塔資料集建構,利用地形圖先驗知識對原始地形圖進行預處理,建構知識引導的多尺度金字塔資料集,增強算法對尺寸的敏感性,提高比例尺識别精度;②顧及專家知識的實時資料增強方法,顧及地形圖專家先驗知識,結合mixup[13]與小樣本場景下的實時資料增強方法[5],在記憶體中實時生成訓練樣本,提高算法穩健性;③最優識别尺寸下的內建推理,通過統計與測試探索最優識别尺寸,采用內建算法優化識别結果。模型架構如圖 3所示。

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期
圖 3 KDD-HIM混合智能計算模型架構Fig. 3 Hybrid intelligent computing architecture of KDD-HIM
圖選項

2.1 專家知識圖像金字塔資料集建構地形圖是按照嚴格的制圖規範,依照統一的符号、顔色系統進行繪制,具有強烈的人為先驗知識限制。DCNN特征圖的尺寸随網絡深度加深而變小,同一對象在不同網絡層有不同的表達方式,這與相同地物在不同比例尺地形圖下按“面-線-點”逐漸精簡尺寸的特性不謀而合。通過專家對地形圖知識進行凝練,結合上述DCNN的特征,建構專家知識引導的資料集可以放大DCNN對尺寸的敏感性,提高比例尺識别精度。由表 1凝練的專家知識可以總結出尺寸是識别碎片化地形圖比例尺的關鍵,需要在保證地形圖資訊的同時,對地形圖按不同的切割方式并縮放到同一尺寸,使得DCNN根據該尺寸下同一類地物不同比例尺的差異表達識别地形圖比例尺。據此提出固定尺寸、寬高比等比例切割及固定子圖數變形切割方法(圖 4),以建構用于地形圖比例尺識别的專家知識圖像金字塔資料集。

表 1 用于比例尺識别的DCNN和地形圖專家知識Tab. 1 Expert knowledge of DCNN and topographic maps for scale recognition

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

表選項

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期
圖 4 專家知識圖像金字塔資料集建構流程Fig. 4 Flowchart of expert knowledge image pyramid dataset
圖選項

2.1.1 固定尺寸、寬高比等比例切割方法如圖 4(a)所示,将切割尺寸固定,對原始地形圖進行切分,儲存切分得到的子圖并縮放為統一輸入尺寸(unified input size,UIS)至專家知識圖像金字塔資料集中。由于切割尺寸和輸入尺寸均為正方形,經縮放後的子地形圖寬高比例保持不變,不會發生變形,故稱為等比例切割方法

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

(1)式中,BS表示基礎尺寸(base size),目前流行的DCNN分類算法的UIS一般為299像素,若以該尺寸進行切割,無法攜帶足夠的地物資訊且會帶來極大的計算量,故将BS設定為2×UIS,即598像素;factor表示切割系數,為保證切割得到的子圖具有較大變化,一般取2的倍數;split size表示切割尺寸,在每一輪切割前,以BS為基礎通過切割系數确定。通過多次改變切割尺寸後循環上述步驟,得到等比例資料集D1。

2.1.2 固定子圖數變形切割方法如圖 4(b)所示,參考2.1.1節中的等比例切割方法,每次切割前固定子圖數,對原始地形圖進行切分。由于一幅具有完整幅面的地形圖一般為矩形,切分得到的子圖往往也是矩形,縮放為正方形的UIS時必會産生形變,故稱為變形切割方法

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

(2)式中,side表示子圖數的行列數,一般情況下取行列數相等,為保證切割後的子圖具有較大差異性同時兼顧計算效率,限定side為10以内的質數;subimage為子圖數,即side的平方,在每一輪切割前,由side确定。通過多次改變子圖數後循環上述步驟,得到變形資料集D2。通過上述2種方式建構EKIPD,模拟現實世界不同尺寸大小的碎片化地形圖,生成模型對地形圖比例尺的注意力機制,實作精确識别碎片化地形圖的比例尺。

2.2 顧及專家知識的實時資料增強方法資料增強利用旋轉、裁剪、加噪等多種變換方法,在現有資料基礎上人為地擴大訓練資料集,可提高DCNN的精度與泛化能力,在DCNN的訓練中被廣泛使用。但地形圖與自然圖像存在顯著差異,需要結合地形圖知識優選資料增強方法,對EKIPD進行擴充。根據2.1節凝練的專家知識,尺寸是影響DCNN識别地形圖比例尺的關鍵,改變圖像尺寸會影響比例尺識别精度。差別于傳統的資料增強方法,不能使用尺寸相關的資料增強方法(如随機裁剪、水準拉伸、豎直拉伸等)處理EKIPD。如圖 5所示,顧及2.1節凝練的專家知識,排除改變尺寸的資料增強方法,優選出基于知識的地形圖增強方法(knowledge-based topographic map augmentation,KTMA)

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

(3)

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期
圖 5 基于知識優選的地形圖增強方法集合Fig. 5 Knowledge-based topographic map augmentation collection
圖選項

如圖 3(c)所示,結合mixup與文獻[5]提出的小樣本場景下的實時資料增強方法,在KTMA的基礎上,對mixup算法進行改進,發展出顧及專家知識的實時資料增強方法

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

(4)式中,k表示本輪訓練有k種資料增強方法;

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

表示向下取整;|KTMA|表示地形圖增強方法集合中增強方法的數量;n表示目前訓練輪次;E表示總的訓練輪次數;aug表示本輪訓練中随機選擇的資料增強方法集合;x′和y′表示合成後的圖像資料和标簽;(xi, yi)和(xj, yj)為訓練資料中随機抽取的2個樣本,xi與xj表示原始圖像資料,yi與yj表示原始标簽;Beta表示貝塔分布;α∈(0, ∞);λ∈[0, 1]表示混合比例,本文認為所有圖檔貢獻相同,則取λ=0.5,圖 6展示了不同λ生成的樣本。

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期
圖 6 不同混合比例生成的訓練樣本Fig. 6 Training samples generated by different mixing ratios
圖選項

該資料增強算法通過凝練專家知識優選适用于地形圖比例尺識别的資料增強方法,在訓練過程中,實時生成訓練樣本并兩兩配對,得到最終的混合樣本及标簽,在快速提高樣本數量的同時不帶來額外的時間、空間開銷,且能夠增加模型的準确性和穩健性。

2.3 基于深度卷積神經網絡的地形圖比例尺識别模型模型的選擇需要結合具體問題及樣本資料的特點[6, 17]。DCNN的性能與樣本資料的分辨率、模型的深度,以及模型的寬度息息相關;而DCNN的模型設計往往依靠工程經驗,沒有明确的數學公式可以參考。研究人員往往通過修改某一項參數(如增加模型的深度),在一定範圍内提高模型的性能,但很快會遭遇性能瓶頸,甚至出現精度下降[18]。為解決上述問題,EfficientNet[15]在有限的顯存和計算資源限制下,通過複合縮放方法,同時探索樣本分辨率、模型深度、模型寬度之間的互相影響,實作了模型精度和速度的最優權衡,在圖像識别相關任務上達到SOTA(state-of-the-art)性能

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

(5)式中,d、w、r分别是用于縮放模型寬度、深度及分辨率的系數;⊙表示連續運算;

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

表示具體的運算操作;X表示輸入的張量;

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

分别表示X的高度、寬度和通道數;target_memory是受限的顯存大小;target_flops是受限的計算量。考慮到地形圖比例尺事關保密鑒定的嚴肅性,對模型精度提出了要求;待鑒定地形圖尺寸一般較大,需要拆分為子地形圖進行比例尺識别,需要模型具備較快的推理速度。為兼顧精度和速度,本文采用輕量且高性能的EfficientNet進行特征提取與模型訓練。

2.4 最優識别尺寸下的內建推理DCNN模型的性能與圖像的分辨率有關,一般圖像分辨率越大模型性能也越強[15, 19]。但在現實世界中,即使是碎片化的地形圖尺寸也遠超DCNN算法的統一輸入尺寸,需要研究最優識别尺寸內建政策,避免識别尺寸太小,誤導模型産生錯誤預測;或因識别尺寸太大,受限于顯存容量因縮放顯著丢失地形圖資訊,導緻識别失敗。如圖 3(d)所示,為保持訓練和預測階段圖像尺寸的一緻性,兼顧解決大尺寸地形圖因縮放帶來的資訊丢失問題,按最優識别尺寸ORS對待識别地形圖進行圖像切割,然後将子圖的識别結果進行內建學習,得到最終的預測結果。

2.4.1 最優識别尺寸下的地形圖切割在模型訓練和預測階段,應保持相同的分辨率,才能充分發揮模型的推理效果[20-22]。為克服不同尺寸下識别結果産生較大差異的問題,通過統計EKIPD中不同尺寸地形圖的樣本數量,得到表 2所示的樣本數量top 5分布。為保持訓練與預測過程的一緻性,兼顧預測效率,設定ORS為樣本數量最多的598像素,根據待檢測地形圖尺寸進行動态切割或縮放

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

(6)

表 2 EKIPD中樣本數量top 5分布Tab. 2 Distribution of top 5 samples in EKIPD

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

注:†表示由于不同的原圖像分辨率存在微小差異,固定子圖數變形切割方法得到的子圖像分辨率也存在微小的差異,故使用切割參數代替這部分圖像的分辨率,下文也如此。表選項

式中,size(·)為待檢測地形圖的最短邊;I為待檢測地形圖;Iwidth和Iheight分别為待檢測地形圖的寬和高;resize(·)表示當待檢測地形圖的最短邊小于或等于ORS時,直接将該地形圖縮放到UIS進行預測;split(·)表示當待檢測地形圖的最短邊大于ORS時,依照ORS逐視窗對該地形圖進行切割,然後将子圖縮放到UIS進行預測。

2.4.2 基于機率權重的內建推理內建學習(ensemble learning)[23]通過組合多個簡單模型以獲得一個性能更優的組合模型,而且允許研究者可以針對具體的機器學習問題設計組合方案以得到更為強大的解決方案[24-27]。文獻[28]從數學角度闡釋內建學習比單個分類器更好的3個基本原因:統計、計算和代表性。借鑒內建學習的思想,在得到各分割子圖的推理結果後,內建各子圖得到的推理向量,得到最終的地形圖比例尺,使得內建結果具有更低的方差和更好的泛化能力

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

(7)式中,pi為第i個分割子圖的推理向量;T表示待檢測地形圖總共被切割為T張子圖;argmax表示取得最大機率值時的索引即比例尺。3 試驗與分析3.1 試驗裝置及資料試驗的硬體環境為64 GB記憶體,Intel(R) Xeon(R) Gold 5222 [email protected] GHz處理器,Nvidia Quadro P4000 8 GB顯示卡。本文所有的DCNN全部基于Python語言和深度學習庫Tensorflow實作。根據自然資源部、國家保密局關于印發《測繪地理資訊管理工作國家秘密範圍的規定》的通知(自然資發〔2020〕95号),1∶5000及更大比例尺标準圖幅的地形圖無法滿足25 km2的面積要求,其衍生的碎片化地形圖更加達不到25 km2的面積要求,是以不在本文鑒定範圍内。據此,試驗資料集選擇1∶10 000、1∶25 000、1∶50 000、1∶100 000、1∶250 000及1∶500 000比例尺地形圖各100幅,分辨率11 000×7000至13 000×8000,剔除破損的地形圖後,共計557幅原始地形圖。利用上述原始地形圖建構的EKIPD包含141 798張圖像分辨率為598×598至13 000×8000不同尺寸的碎片化地形圖,按4∶1的比例劃分為訓練集和測試集。

3.2 試驗設計為充分驗證本文方法的有效性,本文采用精确度(precision)、召回率(recall)、F1值(F1 score)、準确率(accuracy)、宏平均精确度(macro-average precision)、宏平均召回率(macro-average recall)、宏平均F1值(macro-average F1 score)、基于樣本數量的權重平均精确度(weighted-average precision)、權重平均召回率(weighted-average recall)和權重平均F1值(weighted-average F1 score)全方位評價模型綜合性能。試驗中采用在ImageNet上經過預訓練的EfficientNet在EKIPD上進行遷移學習。其中不采用本文提出的KDD-HIM進行遷移學習的EfficientNet作為對比基準算法,記作Baseline-EfficientNet。算法的訓練疊代輪次(epoch)統一設定為30,采用随機梯度下降法[29](stochastic gradient descent,SGD)對模型進行優化,初始學習率為0.003,依照式(8)衰減

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

(8)式中,lr表示每一輪所采用的學習率;lr0表示初始學習率;decay表示衰減系數,取0.95;epoch表示目前訓練輪次;factor表示衰減頻率,取2表示隔2輪衰減一次學習率;每個算法完成全部輪次的訓練後,取驗證精度最高的模型作為該算法的最終模型。

3.3 試驗結果與分析通過與外部算法對比,表 3給出了KDD-HIM與Baseline-EfficientNet在EKIPD上的預測結果,可以看出,KDD-HIM在全部的7個名額中均大幅度優于Baseline-EfficientNet,有效地證明了所提算法的有效性。圖 7給出了KDD-HIM與Baseline-EfficientNet在EKIPD上的混淆矩陣,Baseline-EfficientNet能夠對1∶10 000比例尺地形圖準确識别,但其他比例尺出現嚴重的錯分,尤其是将615張1∶500 000比例尺的地形圖錯分為1∶ 50 000比例尺。KDD-HIM在全部6個比例尺均取得最好的分類效果,顯著減少1∶25 000~1∶500 000比例尺的錯分情況。

表 3 Baseline-EfficientNet與KDD-HIM對比Tab. 3 Comparison between Baseline-EfficientNet and KDD-HIM

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

表選項

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期
圖 7 Baseline-EfficientNet與KDD-HIM在EKIPD測試集上的混淆矩陣Fig. 7 The confusion matrix of Baseline-EfficientNet and KDD-HIM with EKIPD
圖選項

表 4展示了KDD-HIM在全部6個比例尺下每個比例尺的識别性能,所有名額均在90%以上,特别是1∶10 000、1∶25 000比例尺全部做到正确識别,其他比例尺上存在少部分識别錯誤。分析發現上述錯誤識别案例中主要包含兩種情況:①地物元素太過單一(如含有大量的水體),由于這種情況屬于極端情況,在訓練集中為極少出現,模型需要優先考慮大部分樣本的地物要素分布情況,是以對這部分樣本産生了錯分情況;②較小比例尺(相對于1∶ 10 000),由于攜帶的地物符号太過粗略,缺乏地物細節資訊,導緻模型識别錯誤。

表 4 KDD-HIM在各比例尺下的性能對比Tab. 4 Performance comparison of KDD-HIM at various scales

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期

表選項

為進一步研究地形圖尺寸對識别精度的影響,對EKIPD中各切割方式得到的地形圖獨立進行訓練,得到單一尺寸下的模型試驗結果(圖 8)。其中,黑線代表固定尺寸、寬高比等比例切割方法得到的模型預測結果。由圖 8可以看出,随着圖像尺寸的增加,模型性能随之增加(黑色、實心标記),這可能是因為樣本中包含了更多的資訊。當地形圖尺寸增加到897×897時,模型性能達到最高,進一步增加地形圖尺寸反而會降低模型性能(黑色、空心标記)。這可能是因為過于增加地形圖尺寸雖包含大量的地物,但由于縮放為UIS丢失大量的細節資訊,導緻識别錯誤。紅線代表固定子圖數變形切割方法,随着子圖數的增多,圖像尺寸變小,性能反而提升。特别是299×299與2行2列兩種尺寸的模型性能顯著低于其他尺寸,分别證明過小或過大的訓練尺寸均會削弱模型的性能。

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期
圖 8 單一尺寸地形圖對模型性能的影響Fig. 8 Influence of single-size topographic map on model performance
圖選項

圖 9給出了單一尺寸資料模型在EKIPD測試集上的具體混淆矩陣,可以看出單尺寸的地形圖無法徹底兼顧全局的6種比例尺,隻能在少數比例尺取得優異性能,即使是性能最優異的897×897模型依然存在将116張1∶250 000地形圖錯分為1∶500 000地形圖的情況。EKIPD通過将單尺寸的訓練資料充分混合形成多尺度資料集,相同類型下隻有36張錯分為1∶500 000地形圖,錯誤比例降低接近70%,顯著提升了本文方法對全局比例尺的識别性能。

中南大學任加新博士:知識引導的碎片化栅格地形圖比例尺智能識别 |《測繪學報》2024年53卷第1期
圖 9 單一尺寸資料模型在EKIPD測試集上的混淆矩陣Fig. 9 The confusion matrix of a single-scale model with EKIPD
圖選項

4 結語地理資訊保密鑒定是目前國家地理資訊安全監管工作實施的迫切需求。本文針對碎片化栅格地形圖保密等級智能化判定的難題,通過凝練DCNN和地形圖知識,提出知識、資料與深度卷積神經網絡耦合的混合智能模型,成功挖掘出地形圖要素特征與相應比例尺之間的映射關系,通過試驗得出本文方法的識别準确率為0.974 91,對比原始DCNN網絡提高近一倍性能,能夠有效識别碎片化地形圖的比例尺。基于本文方法建構的密級鑒定系統已經在國家基礎地理資訊中心進行應用,代替傳統費時費力的人工檢核工作,為涉密地理資訊的安全監管提供了有效的手段。雖然本文方法已能夠有效識别碎片化地形圖比例尺,但仍有少部分待檢測地形圖會被錯分,後續将研究精度進一步提升的方法。作者簡介第一作者簡介:任加新(1993—),男,博士生,研究方向為智能化測繪。E-mail:[email protected]通信作者:劉萬增 E-mail:[email protected]

初審:張豔玲複審:宋啟凡

終審:金 君

資訊

繼續閱讀