前沿:河北省測繪學會策劃“創(chuàng)新測繪技術(shù)應用”專題欄目,聚焦測繪科技應用前沿。本欄目將展示測繪與AI、遙感等融合的創(chuàng)新實踐,涵蓋氣象監(jiān)測、生態(tài)保護、地理信息服務(wù)、農(nóng)作物估產(chǎn)及文化遺產(chǎn)保護等領(lǐng)域。通過案例剖析,探討測繪技術(shù)如何助力社會管理與可持續(xù)發(fā)展?;诙嘣催b感數(shù)據(jù)與機器學習算法的冬小麥產(chǎn)量估算研究
針對光學影像容易受到云雨天氣影響,導致農(nóng)作物產(chǎn)量估算精度低的問題,本研究融合冬小麥孕穗期Sentinel-2光譜信息和Sentinel-1后向散射系數(shù),并采用極端梯度提升、隨機森林和支持向量機3種機器學習回歸方法建立唐山市冬小麥產(chǎn)量估算模型,選用最佳模型實現(xiàn)唐山市冬小麥產(chǎn)量反演。結(jié)果表明:基于植被指數(shù)和后向散射系數(shù)的極端梯度提升模型的估產(chǎn)效果最好,決定系數(shù)(R2)為0.654,均方根誤差(RMSE)為0.499 t?hm-2,歸一化均方根誤差(nRMSE)為10.02%;24個遙感特征變量中,NDMI、NDVIre3和NDVIre2的重要性遠高于后向散射系數(shù);基于最佳估產(chǎn)模型反演唐山市冬小麥產(chǎn)量空間分布,冬小麥產(chǎn)量范圍主要集中在7.00~8.00 t?hm-2,所占比例達到40.75%,冬小麥產(chǎn)量分布總體上與地面真實情況相近。本研究提出Sentinel-1/2數(shù)據(jù)和機器學習算法相融合的冬小麥產(chǎn)量估算方法,有效提高了機器學習方法反演冬小麥產(chǎn)量的準確性,并加強了模型的解釋性,該方法具有一定可行性。
利用遙感技術(shù)進行區(qū)域作物產(chǎn)量估算,已經(jīng)成為農(nóng)作物估產(chǎn)的新手段。傳統(tǒng)的抽樣調(diào)查、實地觀測等估產(chǎn)方法不適用于大區(qū)域農(nóng)作物估產(chǎn),且耗時耗力無法滿足實際需求。遙感具有覆蓋范圍廣、重復周期短和較容易獲得的優(yōu)點,在農(nóng)作物產(chǎn)量估算中得到了廣泛應用。冬小麥作為中國主要糧食作物之一,利用糧食遙感估產(chǎn)技術(shù)準確估算冬小麥產(chǎn)量,對糧食生產(chǎn)管理和保障糧食安全具有重要意義。
隨著衛(wèi)星傳感器的發(fā)展,衛(wèi)星影像逐漸向高質(zhì)量高時空分辨率方向發(fā)展,為區(qū)域農(nóng)作物產(chǎn)量精確估算提供了數(shù)據(jù)基礎(chǔ),如歐洲航天局的Sentinel-1合成孔徑雷達(SAR)影像、Sentinel-2多光譜影像等。遙感衛(wèi)星接收的光譜信息和后向散射系數(shù)可以完全反映農(nóng)作物的生長狀態(tài)。遙感估產(chǎn)的方法主要是經(jīng)驗統(tǒng)計模型,利用從影像中提取的相關(guān)遙感指標建立與作物產(chǎn)量的回歸關(guān)系,從而估算作物產(chǎn)量。前人基于遙感技術(shù)多采用線性回歸的方法研究農(nóng)作物產(chǎn)量。農(nóng)田系統(tǒng)結(jié)構(gòu)復雜多變,絕大多數(shù)農(nóng)作物生長過程通常表現(xiàn)為非線性過程,單一遙感指標并不能夠完全反映其生長狀態(tài)。隨著機器學習技術(shù)的發(fā)展,極端梯度提升、隨機森林、支持向量機等非線性模型在作物產(chǎn)量估算領(lǐng)域表現(xiàn)出色,許多學者應用非線性模型開展了農(nóng)作物產(chǎn)量估算研究。
目前,農(nóng)作物估產(chǎn)主要以多光譜低空間分辨率影像(Landsat 和 MODIS 等)為主,針對 Sentinel-1 SAR 數(shù)據(jù)與Sentinel-2 多光譜數(shù)據(jù)應用于冬小麥估產(chǎn)的相關(guān)研究較少,并且主要為單一數(shù)據(jù)類型的線性回歸模型。本文基于Sentinel-1/2 衛(wèi)星影像數(shù)據(jù),結(jié)合唐山市田間冬小麥產(chǎn)量數(shù)據(jù),利用構(gòu)建的植被指數(shù)數(shù)據(jù)(包括紅邊植被指數(shù))和后向散射系數(shù),對比分析極端梯度提升模型、隨機森林模型和支持向量機模型的估產(chǎn)精度,進而實現(xiàn)冬小麥產(chǎn)量大區(qū)域、高精度反演,為糧食遙感估產(chǎn)研究提供參考。
1 研究區(qū)概況
唐山市位于河北省東部、華北平原東北部,介于117°31′E~119°19′E,38°55′N~40°28′N。截至2020年10月,唐山市下轄7個市轄區(qū)、3個縣級市、4個縣;南臨渤海,北依燕山,地勢北高南低,平均海拔90 m,全市土地總面積為143.4萬hm2,耕地面積為56.71萬hm2。氣候?qū)倥瘻貛О霛駶櫞箨懶图撅L型氣候,年平均氣溫12℃左右,年平均降水量500~700mm。冬小麥是唐山市主要糧食作物之一,每年10月初寒露前后進入播種期,次年6月初到達成熟期,生育期230~260d。
2 數(shù)據(jù)獲取與預處理
冬小麥成熟期,收割具有代表性的1 m2的冬小麥,對冬小麥進行脫粒、曬干、質(zhì)量稱重,得到樣點的冬小麥產(chǎn)量數(shù)據(jù)。
冬小麥遙感估產(chǎn)的前提是需要識別冬小麥空間分布。以Sentinel-2數(shù)據(jù)為基礎(chǔ)數(shù)據(jù),構(gòu)建歸一化植被指數(shù)、差值植被指數(shù)、比值植被指數(shù)等植被指數(shù),根據(jù)植被生長的物候特征,建立面向?qū)ο?隨機森林方法的冬小麥種植面積提取模型,得到冬小麥的空間分布結(jié)果,總體分類精度大于85%。
Sentinel-1是一顆載有C波段合成孔徑雷達,Sentinel-2衛(wèi)星多光譜數(shù)據(jù)包含13個光譜波段,從可見光和近紅外到短波紅外,具有獨特的光譜功能,擁有不同的空間分辨率,將衛(wèi)星影像空間分辨率重采樣到20 m×20 m。研究選擇前人在農(nóng)作物產(chǎn)量估算中常用的12種植被指數(shù)的基礎(chǔ)上,充分利用Sentinel-2衛(wèi)星的光譜反射率信息,將綠色葉綠素指數(shù)和歸一化植被指數(shù)的可見光波段替換為紅邊波段,建立紅邊植被指數(shù)。同時,提取Sentinel-1衛(wèi)星的VV和VH兩種極化方式對應的后向散射系數(shù),并計算4種后向散射系數(shù)組合參數(shù):差值(VH-VV)、求和(VH+VV)、乘積(VH*VV)和求商(VH/VV)。
3 數(shù)據(jù)分析方法
產(chǎn)量估算方法選用極端梯度提升模型(XGBoost)、隨機森林回歸、支持向量機回歸。XGBoost模型可以擬合因變量和自變量之間復雜的非線性關(guān)系,同時對于變量類型具有很高的寬容度,通過在訓練過程中計算各個特征變量在樹的構(gòu)建過程中被使用的次數(shù)或被用于分裂的增益值(Gain)來確定特征的重要性值,用于評價特征變量對預測結(jié)果的貢獻度。不同特征變量組合方式:A組合包含植被指數(shù)和后向散射系數(shù),B組合包含植被指數(shù),C組合包含后向散射系數(shù)。
4 研究結(jié)果
1 模型綜合評價
三種機器學習估產(chǎn)模型相比較,XGBoost模型的估算結(jié)果最好,其次是RFR模型,最后是SVR模型(下表所示)。A組合的XGBoost模型估算結(jié)果表現(xiàn)最好,其R2為0.654,RMSE為0.499 t?hm-2,nRMSE為10.02%。在XGBoost模型下,A組合所構(gòu)建的模型估算效果優(yōu)于B組合和C組合,估算誤差RMSE分別降低0.014 t?hm-2和0.093 t?hm-2,模型R2分別提高0.022和0.115。后向散射系數(shù)參數(shù)和植被指數(shù)參數(shù)結(jié)合使用有助于提高XGBoost模型的估測精度。
表3 模型綜合評價
2 特征變量重要性排序
A組合的冬小麥估產(chǎn)模型中,前14個特征變量的累積重要性占所有變量的98.20%,貢獻度最高的特征變量是NDMI,該變量利用短波紅外波段和近紅外波段建立的歸一化差值水汽指數(shù),其重要性值遠高于其他特征變量的重要性值。其次重要的特征變量為NDVIre3和NDVIre2,分別表示B7和B6波段與近紅外波段建立的紅邊歸一化植被指數(shù)3和紅邊歸一化植被指數(shù)2。Sentinel-1影像的后向散射系數(shù)參數(shù)在模型中也表現(xiàn)出較強的重要性,交叉極化VH后向散射系數(shù)比同級化VV后向散射系數(shù)在A組合中更有優(yōu)勢。
圖1 特征變量重要性排序
3 冬小麥產(chǎn)量空間分布
冬小麥產(chǎn)量范圍主要集中在7.00~8.00 t?hm-2,所占比例達40.75%,主要分布在玉田縣和豐潤區(qū),其他地區(qū)零散分布;其次在8.00~9.00 t?hm-2,所占比例達35.43%;冬小麥產(chǎn)量小于6.00 t?hm-2的區(qū)域分布較為集中,主要分布于玉田縣南部和東部、豐潤區(qū)中部,以及灤南縣東部,少量零散分布于其他區(qū)域;冬小麥產(chǎn)量大于9.00 t?hm-2的區(qū)域主要分布在灤州市、灤南縣和樂亭縣。各地區(qū)冬小麥產(chǎn)量出現(xiàn)差異,可能與農(nóng)戶生產(chǎn)管理有關(guān),不同地區(qū)的氣候條件也可能導致不同的結(jié)果。
圖2 唐山市冬小麥產(chǎn)量分布