聯系方式 Contact

南京天氣在線氣象科技有限責任公司

地址:北京市海淀區海淀西大街36號9層

電話:010-58995339

手機:18611808504

傳真:010-58995339

網址:www.szad-expo.com

搜索 Search
你的位置:首頁 > 新聞動態 > 熱點新聞

基于深度學習模型的1公里分辨率的近地面風速和溫度的區域降尺度

 2023-10-22 18:56:08  點擊:

原創 遼月 AI氣象大模型

近期復旦大學伏羲大模型團隊和阿里巴巴達摩院團隊聯合發表論文:Investigatingtransformer-basedmodelsforspatialdownscalingandcorrectingbiasesofnear-surfacetemperatureandwindspeedforecast,實現了近地面風速和溫度1公里分辨率的區域降尺度。詳情如下:

背景

近地面氣象預報,例如2米溫度和10米風速等,在研究和應用中扮演著關鍵角色。目前,全球數值預報模式(NWP)受限于計算資源、計算時間、物理參數化方案等因素,其空間分辨率相對較低,例如,歐洲中期天氣預報(ECMWF)的確定性預報(HRES)的空間分辨率為0.1。然而,很多應用需要更高的空間分辨率,尤其是在地形復雜的地區。因此,需要采用降尺度的方法,以從低分辨率的NWP預報中獲取更高分辨率的數據。傳統的降尺度方法包括動力和統計降尺度。動力降尺度方法依賴于高分辨率的區域數值預報模式,其輸出各個變量結果物理意義上一致,同時能夠適用于任意區域。然而,動力降尺度的缺點是它需要消耗大量的計算資源和時間,而且精度受初始場和邊界條件的準確性以及區域模式本身的誤差所限制1。統計降尺度方法則是通過數據驅動的方式,從大量的歷史數據中學習低分辨率模式變量和觀測數據之間的映射關系。統計降尺度方法的優勢在于其計算效率高,能夠在一定程度上訂正模式誤差。然而,其不足之處在于通;诤唵蔚慕y計方法和平穩性假設,這可能導致該方法的結果會隨著時間的推移變得不夠準確,有時可能產生不合理的結果2。由于機器學習視覺領域中的超分辨率技術和氣象領域中的降尺度過程具有相似之處,因此,越來越多的超分辨率模型被應用于氣象降尺度。然而,與超分辨率領域不斷采用最新的深度學習模型以提高精度不同,氣象降尺度所采用的超分辨率模型大多僅限于基于卷積神經網絡(CNN)的模型2-5。CNN模型的局限性包括僅能處理局部信息以及使用固定大小的卷積核。而基于transformer的超分模型的優勢在于其是可以捕獲圖像中的長距離像素依賴關系,根據局部內容動態調整權重,相當于使用大小可變的卷積核。

此外,以前的研究工作在使用機器學習模型進行空間降尺度時,通常使用的同源的高分辨率和低分辨率的數據,即從高分辨率數據中采樣并合成低分辨率數據。然而,在實際的降尺度應用中,低分辨率數據為NWP的預報數據,而高分辨率數據則是觀測數據的格點數據。因此,模型不僅需要提高空間分辨率,還需要訂正低分辨率預報數據的誤差。

本研究的主要貢獻在于采用基于transformer的模型,包括SwinIRUformer,用于對近地面變量進行空間降尺度,并與基于CNN的模型進行對比。我們采用NWP數據作為輸入,格點觀測數據作為真值。這種數據來源的設置更符合實際應用場景,盡管也更具挑戰性。此外,我們引入了地形特征提取模塊和多分辨率特征融合模塊,以進一步提高了Uformer的精度。

數據

本次研究選取的數據區域為蒙東區域,空間范圍涵蓋39.6N46N,以及111.6E118E。內蒙古省擁有中國最豐富的陸上風能資源6,其中蒙東區域的風資源密度超過了3507。作為真值的格點觀測數據采用中國氣象局(CMA)研發的陸面數據同化系統CLDASV2.0,其空間分辨率為0.01(https://data.cma.cn/data/cdcdetail/dataCode/NAFP_CLDAS2.0_RT.html)。CLDAS采用陸面模式和資料同化等方法融合了多個觀測數據源,包括地面站和衛星等8。

模型輸入數據采用了ECMWFHRES,其空間分辨率為0.1,時間分辨率為1小時,起報時間為12UTC。高分辨率地形數據則通過WRFgeogrid.exe將GTOPO30的數據插值到研究區域以獲取。

方法

Uformer模型通常應用于圖像復原任務,其輸入和輸出的分辨率相同。因此,為了適應不同分辨率的輸出結果,我們對原模型結構的輸出部分進行了改進,引入了pixelshuffle。此外,考慮到地形數據在降尺度中的重要性,我們在原Uformer結構的基礎上,設計了一個地形數據特征提取模塊,用于從高分辨率地形數據中提取不同分辨率的特征(如圖1和圖2中的紅線所示)。同時,我們引入了一個多分辨率特征融合模塊,將不同分辨率的信息融合在一起(如圖1中的藍線所示),以進一步提高模型精度。

1.基于Uformer的降尺度框架圖

2.高分辨率地形數據特征提取模塊

結果

以下兩個表格總結了各種機器學習模型在所有測試集上,針對2米溫度和10米風速的各項指標上的平均值。盡管UNet模型具有最多的參數,但其在2米溫度方面的表現較差,而在10米風速方面略優于RCAN模型。而基于transformer的兩個模型,SwinIR和Uformer,在各個指標上都要優于基于CNN的UNetRCAN模型。其中,Uformer模型在所有指標上均表現最佳,它通過引入對高分辨率地形數據特征提取和多尺度特征融合后,進一步提升了模型的精度。兩個表格均表明,Uformer模型在同時使用地形數據特征提取模塊和多分辨率特征融合模塊時表現最佳。