高精度地表覆蓋數據優化分割的土地利用分類
朱曉霞1,2,3,甯曉剛1,王 浩1,張翰超1
(1.中國測繪科學研究院,北京100036;
2. 蘭州交通大學測繪與地理信息學院,蘭州730070;
3.天水三和數碼測繪院有限公司,天水 741000)
摘要:針對土地利用類型多樣、特征易混淆和高分辨率遙感影像信息海量、人工提取費時費力等問題,以北京二号衛星影像為數據源,采用高精度地表覆蓋數據優化分割的面向對象分析方法、無地表覆蓋數據輔助分類的面向對象分析方法,運用樸素貝葉斯、CART決策樹、随機森林和K最鄰近分類器,開展武功縣土地利用分類,并對分類結果進行精度評估。結果表明:①與無地表覆蓋數據輔助分類方法相比,高精度地表覆蓋數據優化分割的面向對象分類方法,在精度方面有較大的提升,其分類總體精度提高18.73%,Kappa系數提高0.21;②随機森林對于土地類型多樣的影像對象具有較好的識别能力,獲得較高的總體精度(95.3%)和Kappa系數(0.94)。研究表明一種利用高精度地表覆蓋數據優化影像分割的土地利用分類方法具有更好的可行性和魯棒性。
0 引言
土地是人類賴以生存和發展的最基本的自然資源,是人類生存和發展的物質基礎[1]。21世紀以來,全球土地利用格局發生巨大變化,土地利用變化已成為國際上全球變化研究的前沿與熱點課題[2]。土地資源管理是自然資源管理的基礎和關鍵,土地利用變化是自然資源統一管理的有力支撐,為科學利用和合理保護自然資源,推動實施國家重大戰略,促進經濟社會全面可持續發展提供至關重要的數據支撐。
基于遙感技術的土地利用分類是遙感信息提取中的重要手段之一,獲得學術界廣泛的關注,取得了較多研究成果。目前,常用的遙感影像信息提取方法包括基于像元[3-4]的影像分析方法和基于對象影像分析(object-based images analysis,OBIA)方法。随着土地利用類型變化日趨複雜化,基于像元的傳統遙感影像分類方法已遠不能滿足當代社會需求。而日益提高的高分辨率遙感影像性能和更豐富的特征信息為複雜的土地利用分類奠定基礎。OBIA方法[5-6]采用單個對象作為最小單元,有效地結合光譜信息和形狀紋理等信息,實現更高層次的遙感圖像分類和目标地物提取,相比傳統方法極大提升精度,且更适用于波段數較少的高分辨率遙感影像,有效避免“椒鹽現象”,從而極大地提高信息提取精度。
OBIA技術主要包括兩方面的内容:一方面是選擇适當的影像分割算法與最佳分割尺度;另一方面是建立分類規則實現目标地物的提取。就影像分類而言,與中低分辨率影像[7]相比,高分辨率影像多适用于中小尺度研究,保證高精度的提取結果,滿足更精細化的研究需求。如文獻[8]基于北京市的ZY-3影像提取城市内部土地利用信息,總體精度達到87%;文獻[9]基于TH-1數據運用面向對象方法研究幹旱區土地覆被分類,總體精度比最大似然分類提高近10%。但上述面向對象方法[8-9]仍然存在分割結果不确定性、遙感影像信息冗餘及分割參數選擇具有主觀性等問題。本文将地表覆蓋數據和ESP(estimationof scale parameter)尺度評價工具融入多尺度分割方法,運用FSO(feature space optimization)工具優化特征集,解決“對象邊界”不确定性和特征冗餘等現象,為提高遙感影像分類精度提供依據。
影像分割是OBIA的基礎和關鍵,分形網絡演化算法(fractalnet evolution approach,FNEA)[10]、均值漂移算法[11]、基于加權聚合的分割算法[12]、隐馬爾科夫樹分割算法[13]等多尺度分割算法均源于自底向上的區域合并理論。依據相鄰基元的相似性度決定相鄰基元是否合并及其合并順序,不斷合并小尺度基元,實現多尺度分割。邊界特征表達基元相互分離的程度,是地物空間關系的重要特征[14]。而上述方法[10-14]隻考慮基元自身的光譜、形狀和紋理等内在的特征,忽略了對基元邊界特征的分析和運用,導緻分割的邊界定位精度較低、分割結果過于細碎及整體性不強[15]等現象。目前,在面向對象的多尺度分割方法中,對邊界特征的應用較少,本文将地表覆蓋數據先驗成果的邊界約束融入多尺度分割中,解決分割對象邊界精度低等問題,進一步提高遙感影像信息提取精度。
針對高分辨率遙感影像信息海量、人工提取費時費力、分割對象邊界精度低等缺點,本文以北京二号遙感影像為數據源,将地表覆蓋數據[16]和面向對象的影像分析技術相互結合,運用樸素貝葉斯(naive Bayes,NB)、CART決策樹(classification and regression tree, CART)、K最鄰近(K-nearest neighbor, KNN)和随機森林(random forest, RF)4種方法提取武功縣土地利用信息,探索基于高精度地表覆蓋數據的面向對象分析方法對于提升土地利用分類精度方面的可行性、有效性與泛化性。力求探尋更适宜的土地利用分類方法及更完善的分類技術,以期為高效、高精度土地利用信息提取提供技術支撐。
1 研究區概況與數據源陝西省鹹陽市武功縣(34°12′~34°26′N,108°~108°26′E)位于關中平原腹地,東至興平,西臨扶風縣和楊淩示範區,南與周至縣隔河相望,北與乾縣接壤(圖1)。屬溫暖帶半濕潤性氣候區,夏季高溫多雨,降水的季節性強,年降水量達到633.7 mm,境内的3條河流均屬渭河水系。該縣地勢相對平坦,交通便利,農業生産條件良好,土地開發潛力巨大。該縣下轄8個鄉鎮,土地面積 397.8 km2,擁有“關中米糧倉”之稱,是陝西省重要的糧食生産基地。境内生物種類繁多,自然資源種類豐富。從土地利用結構看,武功縣的土地利用率比較高,生産用地以農耕地為主;非生産用地中,大部分以居民點、工礦企業、機關學校、交通設施為主。因此,武功縣地表覆蓋類型豐富,适宜于土地利用分類方法研究。
本文使用的遙感數據為兩景北京二号多光譜衛星圖像,獲取時間為2017年9月7日和2017年9月12日,包含4個空間分辨率為3.2 m的多光譜波段 (藍:440~510nm,綠:510~590 nm,紅:600~670 nm,近紅外:760~910 nm)和空間分辨率為0.8 m的全色波段(全色:450~650 nm)。通過輻射校正、正射校正、和影像融合和裁剪等影像預處理階段,獲得研究區域待分類的北京2号遙感影像。
研究中輔助分割的數據是武功縣基礎性地理國情監測[16]成果的地表覆蓋數據(獲取日期為2017年5月25日)。該數據由自然資源部組織生産、質檢和驗收,所用影像分辨率均優于2m,由内業解譯和外業核實确保質量,精度要求是影像上分界明顯的地表覆蓋分類界線邊界以及定位點的采集精度應控制在5個像素以内,該數據具有精度高、内容豐富、分類詳細、現勢性強、無縫覆蓋地面等優勢。該數據共有8個一級類,52個二級類,104個三級類。一級類包括種植土地、林草覆蓋、房屋建築(區)、鐵路與道路、構築物、人工堆掘地、荒漠與裸露地、水域。由于武功縣部分地類數量較多地分布在南部,如水域等要素,為了更清楚地展示地表覆蓋分類結果,所以展示其南部結果如圖2(a)所示。
通過對研究區北京二号影像的目視解譯,并參考Google Earth高分辨率影像,按照分層随機采樣的原則選擇樣本。樣本點在顧及每種地物類型的數量前提下盡量在整個圖像均勻分布。按照武功縣各地類數量的大緻比例進行換算,選取耕地、園地、林地、草地、交通運輸用地、水域及水利設施用地、城鎮村及工礦用地的訓練樣本數量分别為170、94、78、64、30、36和154,如圖2(b)所示。引入武功縣第三次全國國土調查内業信息提取成果作為真值,選擇489個對象作為測試樣本點,用于分類精度的評價分析。
以《第三次全國國土調查土地利用現狀分類及工作分類》為基礎,結合北京二号高分辨率影像上的豐富地物信息,參考第三次全國國土調查内業信息提取分類的标準[17],确定武功縣分類體系為耕地、園地、林地、草地、交通運輸用地、水域及水利設施用地、城鎮村及工礦用地7大主類,由于其他土地面積約占總面積的0.01%,所以未将此類列入分類體系(表1)。
2 高精度地表覆蓋數據優化影像分割的土地利用信息提取方法
通過分析研究區内各類用地的顯著特征,本文采用基于高精度地表覆蓋數據優化影像分割的方法探索土地利用信息提取的可行性。基本過程包括高精度地表覆蓋數據優化影像分割、确定分類系統、選擇樣本、特征選取、面向對象的影像分類、分類後處理及精度評價。技術路線如圖3所示。
影像分割是面向對象的影像分析的基礎與關鍵。邊界特征是影像分析中除光譜、紋理、幾何特征外的重要信息。精确的分割是解決土地利用對象邊界準确性的基礎。普通影像分割隻考慮基元自身的光譜、形狀和紋理等内在的特征,忽略了對基元邊界特征的分析和運用,導緻分割的邊界定位精度較低、分割結果過于細碎及整體性不強等現象。而高精度地表覆蓋數據優化影像分割方法将高精度地表覆蓋數據先驗成果的邊界約束融入多尺度分割中,解決分割對象邊界精度低等問題,得到同質性和異質性較高的影像對象,從而使分割後影像對象與實際地物一緻性更高,較好地避免了破碎圖斑與偏大圖斑的産生,成為面向對象的土地利用分類的基礎與關鍵。
本文利用高精度的地表覆蓋數據和分形網絡演化算法[10]對遙感影像進行分割,并且借助ESP工具和歸一化最大最小面積指數(normalizeddifference max and min area index, NDAI)[15]獲取地物的全局最優分割尺度參數。具體方法,首先,将地表覆蓋矢量數據和遙感影像配準套合,僅依據地表覆蓋數據對遙感影像進行分割,獲得基于地表覆蓋矢量數據邊界信息約束下的影像圖斑;然後,基于分形網絡演化算法的原理,依據ESP獲取的分割參數設置尺度參數進行細分割,生成子像斑;最後,分割結果評價運用NDAI來衡量,選擇NDAI最大值所對應的分割尺度作為最優尺度參數),得到同質性和異質性較高的影像對象,從而使分割後影像對象邊界精度提高,與實際地物邊界吻合程度更高。
多尺度分割的全局最優參數指通過該參數一次性分割能夠取得盡可能最佳的效果,多尺度分割後的全局最優必須使得其能較準确分割出最大尺度範圍内的地物,因此使得分割後生成的影像對象層中的最大對象面積和最小對象面積的差異最大化。歸一化最大最小面積指數是由周勇兵提出,指分割後所有對象的最大面積和最小面積的差值除以分割後所有對象的最大面積和最小面積的總和。影像對象間歸一化最大最小面積指數越大,說明對象之間分離性高,計算公式如式(1)所示。
采用分離阈值(separability and thresholds, SEaTH)算法[19]對土地利用分類的影像特征進行選擇,減少特征冗餘。該算法是目前具有代表性的基于對象特征的優化方法,既能獲取類别間的最佳分離特征,還可以計算出對象特征的最适宜分類阈值,并且執行效率高。該算法針對高分辨率信息冗餘等缺點,遴選出有效識别分類目标的特征集,從而提高分類模型效率和精度。
本文運用樸素貝葉斯分類、CART決策樹分類、随機森林、K最鄰近分類4種方法進行高精度地表覆蓋數據優化影像分割的分類、無地表覆蓋數據輔助的分類方法,自動提取面向對象的土地利用信息,4種分類算法[20]的優點和缺點如表2所示。
對于初步提取的土地利用結果存在着細碎圖斑、地物輪廓粗糙等缺點,本文采用剔除小圖斑、平滑邊緣、手動修改進行分類後處理。首先利用阈值條件剔除細碎圖斑,然後運用pixel-based object resizing算法中的增長和收縮模式進行平滑構築物,最後将平滑後的數據導入ArcMap,将由樹木和建築物的遮蓋所造成的錯誤進行手動修改。
采用制圖精度、用戶精度、Kappa系數、總體精度對土地利用分類結果進行評價[21]。制圖精度指分類結果滿足參考分類的程度;用戶精度指像素分類正确的可能性;Kappa系數是用于檢驗遙感影像分類結果的一緻性;總體精度指所有被正确分類的像素所占的比例。精度評價指标如表3所示。
3 實驗結果分析
本文初始分割是基于地表覆蓋數據的邊界進行分割,獲得分割結果如表4所示,同時經過不斷試驗,确定形狀因子為0.5,緊湊度因子為0.5,各波段的權重均為1。細分割的分割尺度參數根據ESP工具得出3個ROC峰值,即最優分割尺度參數,分别為108、142和178(圖4)。然後運用歸一化最大最小面積指數最大值所對應的分割尺度,得到最佳分割尺度為178,其分割結果如表4細分割結果所示。形狀光滑度和形狀緊密度與初始分割參數一緻,分别為 0.5和0.5,各波段的權重均1。采用優化分割後的對象平均異質性較低,對象内部同質性較高,邊界輪廓較為清晰,分割效果較好。
本文采用了高精度地表覆蓋數據優化影像分割、無地表覆蓋數據輔助分割兩種分割方法,運用兩種方法分割得到結果如圖5所示,基于無地表覆蓋數據的分割結果的城鎮村及工礦用地出現“過分割”現象而過于破碎,且耕地如圖5(b)紅圈部分也存在“過分割”狀态,分割效果最差。而高精度地表覆蓋數據優化影像分割結果如圖5(a)(藍色為初始分割邊界,黃色為細分割邊界)所示,紅圈部分沒有出現“過分割”和“欠分割”現象,并且正好城鎮村于周圍地物區分開,由于高精度的地表覆蓋數據優化遙感影像分割,使得影像對象間的邊界更加精确。分割實驗表明:通過對比結果并與真實地物的邊界信息發現,基于地表覆蓋數據優化分割的效果最佳,邊界輪廓最清晰,适用于土地利用信息提取。
利用eCognition軟件的特征分析工具,對62個初始對象特征進行篩選,最終篩選出16個優化特征子集如表5所示,該特征集不僅包括原影像每個波段的光譜特征,還包括通過計算形成的波段比率、形狀、幾何和紋理特征,使得用于分類識别的特征更加豐富,更有效地分離目标地物。
本文選取表5中特征集,進行面向對象的土地利用信息提取,開展了兩組實驗:①高精度地表覆蓋數據優化影像分割的面向對象分類方法;②無地表覆蓋數據輔助分類方法。運用Kappa系數、總體精度、制圖精度和生産精度對兩組實驗結果進行精度評價,得到兩組精度評價如表6所示。
高精度地表覆蓋數據優化影像分割的分類結果與地面實際吻合程度,較無地表覆蓋數據輔助的影像分類高。二者精度評價結果見表6所示,高精度地表覆蓋數據優化影像分割的分類和無地表覆蓋數據輔助分類(圖6)的總體精度均值分别為86.43%和67.7%,Kappa系數均值分别為0.83和0.62。前者比後者的總體精度提高18.73%,Kappa系數提升0.21。其中,高精度地表覆蓋數據優化影像分割的随機森林分類效果最好,分類總體精度達到95.3%,Kappa系數為0.94。與無地表覆蓋數據輔助分類的結果相比,總體分類精度和Kappa系數分别提高了18%和0.21。其次,高精度地表覆蓋數據優化影像分割的CART決策樹和樸素貝葉斯的分類結果較好,總體分類精度分别提高了19.2%和18%, Kappa系數分别提高了0.23和0.2。最後,K最鄰近分類的總體分類精度和Kappa系數分别提高了19.7%和0.21。綜上所述,高精度地表覆蓋數據優化影像分割的分類結果優于無地表覆蓋數據輔助分類結果。
本文利用樸素貝葉斯、K最鄰近、随機森林、CART決策樹算法進行分類,不同分類器的結果精度評價如表6所示,在高精度地表覆蓋數據優化影像分割的分類方法中,随機森林分類器的分類的總體精度和Kappa系數最高;其次是CART決策樹和樸素貝葉斯分類器,CART決策樹和樸素貝葉斯分類總精度分别為88.1%和82.5%,Kappa系數分别為0.85和0.78;分類結果較差的為K最鄰近分類,其分類總體精度為79.8%,Kappa系數為0.74。4種分類器在無地表覆蓋數據輔助分割的分類中總體精度和Kappa系數的排序同高精度地表覆蓋數據優化影像分割的分類排序一樣。
影像分類的分類器算法的選擇需要考慮精度、速度、易用性和數據集等。貝葉斯分類器相對簡單,對小規模數據具有較好的分類效果。CART決策樹分類精度和效率适中,應用比較簡單,可解釋性強,缺點是易發生拟合現象。K最鄰近分類器理論成熟,思想簡單,可以用于非線性分類,缺點為計算量較大,需要消耗大量内存。随機森林訓練快速并且調整參數難度較小,有效防止過拟合現象,是解決衆多分類問題的“赢家”。
4 結束語本文基于北京二号衛星遙感數據對陝西省鹹陽市武功縣土地利用信息進行分類研究,利用高精度地表覆蓋數據優化影像分割的分類方法、無地表覆蓋數據輔助分類兩種方法,展開樸素貝葉斯、CART決策樹、随機森林和K最鄰近4種分類器分類情況相互比較。得出以下結論:
1) 采用高精度地表覆蓋數據優化影像分割的面向對象分類方法,在精度方面有較大的提升,其分類總體精度較無地表覆蓋數據輔助分割提高18.73%,Kappa系數提高了0.21,所以此方法對提取土地利用信息具有較好的可行性。
2) 随機森林分類器無論是從分類精度、分類速度、易用性還是處理拟合等現象,均成為解決衆多分類問題的“赢家”。其中,高精度地表覆蓋數據優化影像分割的随機森林分類精度為95.3%,Kappa系數達到0.94,提取效果最理想。
高精度地表覆蓋數據優化影像分割的土地利用提取方法将高精度地表覆蓋數據運用到多尺度分割中,得到同質性較高的影像對象,較好地避免了破碎圖斑的産生。因此,該方法對提取土地利用信息具有較好的可行性和魯棒性,為土地利用信息的快速提取提供有效和可靠的技術手段。
雖然高精度地表覆蓋數據優化影像分割的面向對象分類取得了較高的分類精度,但對于具有相近光譜特性的地物進行分類時,仍然出現了一些錯分現象。為進一步提高分類精度,未來的研究應着重在優化決策樹結構與引入模糊數學方法來改進分類算法。考慮到幹旱區植被和水體的季節變化比較大,還需利用多季相遙感數據,進一步提高分類精度。此外,現土地利用分類隻到一級類,部分一級類的子類型的光譜差異也會影響分類精度,比如林地下面喬、灌等類型。針對更加細緻的子類進行分類研究将是今後的研究方向。
引用格式:朱曉霞,甯曉剛,王浩,張翰超.高精度地表覆蓋數據優化分割的土地利用分類[J].測繪科學,2021,46(6):140-149.
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!