聯系方式 Contact

南京天氣在線氣象科技有限責任公司

地址:北京市海淀區海淀西大街36號9層

電話:010-58995339

手機:18611808504

傳真:010-58995339

網址:www.szad-expo.com

搜索 Search
你的位置:首頁 > 新聞動態 > 智慧氣象

人工智能在氣候預測領域應用初探(一)

 2024-02-05 15:56:51  點擊:

轉載于 領略氣象 

劉冠州,唐偉

引言

根據國家標準化管理委員會發布的《人工智能標準化白皮書(2018)》,人工智能(Artificial Intelligence,AI)是指利用數字計算機或者由數字計算機控制的機器,模擬、延伸和擴展人類的智能,感知環境、獲取知識并使用知識獲得最佳結果的理論、方法、技術和應用系統,F階段,隨著計算機硬件設施性能的顯著提升、研究數據的大量增長且存儲成本的大幅降低以及算法的明顯改進,人工智能技術飛速發展,呈現出深度學習、跨界融合、人機協同、自主操控等發展趨勢。

在人工智能領域,一般包括機器學習、知識圖譜、自然語言處理、人機交互、計算機視覺、生物識別、增強現實(Augmented Reality,AR/虛擬現實(Virtual Reality,VR)七大關鍵技術。機器學習(Machine Learning,ML)是一門交叉學科,涉及統計學、系統辨識、逼近論、神經網絡、優化論、計算機科學、腦科學等諸多領域。它研究計算機如何模擬或實現人類的學習行為。獲取新知識或技能,重組現有知識結構,不斷提高自身性能,是人工智能技術的核心。常使用并且表現突出的主流機器學習方法包括兩大類:(1)傳統機器學習,如決策樹、隨機森林、支持向量機、樸素貝葉斯、梯度提升樹、極端梯度提升樹等;(2)深度學習,如卷積神經網絡、循環神經網絡、遞歸神經網絡、深度玻爾茲曼機、深度置信網絡等。

隨著氣候變化及其負面影響的日益加劇,干旱、洪澇等氣象災害頻發且破壞加劇對人類的生活造成很大影響,提高氣候預測的能力也變得愈加重要和急迫,對氣候預測的需求越來越大。將人工智能應用于月-季尺度上的氣候預測以及更長時間尺度的氣候預估,是一項巨大的挑戰。人工智氣候預測需要海量的優質數據,數據是機器學習的核心,是AI發展的瓶頸,數據決定模型質量的上限。隨著對氣候系統變化機制的日益深入理解,地球系統的觀測數據、再分析資料以及數值模擬數據在過去40年里飛速增長,氣候變化科學數據存量越來越大,存儲類型越來越豐富。尤其是第五階段國際耦合模式比較計劃(Coupled Model Intercomparison Project-Phase 5,CMIP5)和第六階段國際耦合模式比較計劃(Coupled Model Intercomparison Project-Phase 6,CMIP6),為氣候變化、氣候預測和氣候預估研究提供了數千萬億字節量級的數據資源。同時在高性能計算機、“大數據”和先進算法的支持下,機器學習技術蓬勃發展,為提高氣候預測的技巧提供了新的思路和契機,氣候預測領域的人工智能應用也在逐漸展開。在模式改進等特定領域,人們已經認識到人工智能技術的巨大潛在利益。傳統模式中的不同要素顯示出被人工智能技術取代或增強的潛力。許多氣候研究人員已經采用人工智能方法來加深對特定地球系統組成部分的理解,相關領域涌現了一大批創新性的研究成果,下文將分類詳述。

1.氣候模式參數化改進

Krasnopolsky等人2005年提出了一種基于統計/機器學習和大氣模型中確定性建模的協同組合的方法。該方法使用神經網絡作為統計或機器學習技術,用于模型物理參數化的精確和快速仿真或統計近似。它被用于為美國國家大氣研究中心(National Center for Atmospheric Research,NCAR)社區大氣模型開發一個大氣長波輻射參數化的精確和快速近似,這是模型物理中最耗時的部分。開發的神經網絡仿真比原始參數化快兩個數量級到50-80倍。用原始參數化及其神經網絡模擬進行的并行10年氣候模擬的比較證實,這些模擬產生幾乎相同的結果。Gentine等人2018年提出了一種基于機器學習的對流參數化的新方法,使用一個具有指定海面溫度的水行星作為概念證明。用氣候模型的超參數化版本來訓練深度神經網絡,其中對流由數千個嵌入的二維云解析模型來解析,對流的機器學習表示可以巧妙地預測對氣候模擬最重要的超參數化的對流加熱、潤濕和輻射特征。

氣溶膠-云的相互作用效應是氣候模式中不確定性的主要來源,因此量化不確定性的來源從而指導研究工作是很重要的。然而,全球氣溶膠模型的計算費用阻礙了對其輸出進行全面的統計分析。Lee等人2013年對一個全球三維氣溶膠微物理學模型進行了基于方差的分析,以量化模型估計的云凝結核當前濃度中參數不確定性的大小和主要原因。根據專家的啟發,確定了28個模型參數,基本上涵蓋了所有重要的氣溶膠過程、排放和氣溶膠大小分布的表示。然后,基于為每個模型網格單元構建的仿真器的蒙特卡羅型采樣,進行不確定性分析,在全球范圍內改進云活性氣溶膠的建模。

2.集合預報

Luo等人2007年使用機器學習的貝葉斯方法來融合由多個氣候模型生成的集合季節性氣候預報,以獲得更好的概率性和確定性預報。研究給出了兩個實例:赤道太平洋海表溫度的季節預報和俄亥俄河流域的降水預報。這些預報的交叉驗證顯示,與來自氣候模型和氣候預報的原始預報相比,合并預報的均方根誤差和排序概率得分更小,表明確定性和概率性預報技能都有所提高。因此,這種方法在季節性水文預報中有很大的應用潛力。

氣候模型是復雜的數學模型,由氣象學家、地球物理學家和氣候科學家設計,并作為計算機模擬運行,以預測氣候。來自世界各地不同實驗室的20個全球氣候模型的預測差異很大,這些模型為政府間氣候變化專門委員會(Intergovernmental Panel on Climate Change,IPCC)提供信息。給定來自20IPCC全球氣候模型的溫度預測,以及超過100年的歷史溫度數據,Monteleoni等人2011年用深度學習算法對觀測序列進行建模,其中當前最佳氣候模型作為隱變量。

在歷史全球平均溫度數據上,在線學習算法的平均預測損失幾乎與事后表現最好的氣候模型相匹配。此外,它的性能超過了平均模型預測,這是氣候科學的默認做法,中值預測和最小二乘線性回歸。通過對2098年的氣候模型預測進行實驗。使用任何一個氣候模型的預測來模擬標簽,發現在線學習算法相對于其他氣候模型和技術顯著提高了性能。同時針對非洲、歐洲和北美的特定地理區域進行了IPCC全球氣候模型溫度預測實驗。在年度和月度時間尺度的歷史數據上,以及在未來的模擬中,學習算法通常優于每個地區的最佳氣候模型和線性回歸。值得注意的是,學習算法始終優于當前基準模型的平均預測。

3.氣候變化影響評估

準確估計珍稀瀕危物種的地上生物量(Aboveground Biomass,AGB)對于保護森林生態系統和瀕危物種以及為分析過去和未來氣候變化對森林生物量的影響提供有用信息尤為重要。Wu等人2019年使用三個已開發和兩個廣泛使用的模型,包括廣義回歸神經網絡(Generalized Regression Neural Network,GRNN)、成組數據處理方法(Group Method of Data Handling,GMDH)、自適應神經模糊推理系統(Adaptive Neuro-Fuzzy Inference System,ANFIS)、人工神經網絡(Artificial Neural Network,ANN)和支持向量機(Support Vector Machine,SVM),來估計中國天然林中刺桐AGB的可行性。結果表明,這些模型可以利用有限的氣象數據解釋AGB的變化,建議使用這些先進的模型來估計森林的AGB。

目前,地表吸收的太陽能有一半以上用于蒸發水分。氣候變化預計會加劇水文循環并改變蒸散量,對生態系統、區域和全球氣候的反饋產生影響。蒸散量的變化在全球范圍內缺乏直接的觀測約束,陸地水循環的變化、氣候變化和可變性影響的關鍵診斷標準仍然不確定。Jung等人2010年提供了一個從1982年到2008年全球陸地蒸散的數據驅動的估計,整合使用了全球監測網絡、氣象和遙感觀測以及機器學習算法。此外,使用基于過程的陸面模式集合評估了同一時期的蒸散變化。

大氣環流模型(General Circulation Models,GCMs)是經常用于評估氣候變化影響的氣候模型,它的分辨率較粗,因此從GCMs獲得的模擬結果在相對較小的流域尺度水文過程中可用性不高。GhoshMujumdar2008年提出了一種基于稀疏貝葉斯學習和相關向量機(Relevance Vector Machine,RVM)的統計降尺度方法,以使用GCM模擬的氣候變量模擬季風期(6月、7月、8月、9)流域尺度的徑流。由美國氣象環境預報中心(National Centers For Environmental Prediction,NCEP)和美國國家大氣研究中心(NCAR)聯合制作的再分析數據被用于訓練模型,以建立徑流和氣候變量之間的統計關系。由此獲得的關系用于預測GCM模擬的未來徑流。統計方法包括主成分分析、模糊聚類和RVM。不同的核函數用于比較目的。該模型被應用于印度的馬哈納迪河流域。將使用RVM獲得的結果與最先進的支持向量機(SVM)的結果進行比較,以展示RVMs相對于SVMs的優勢。

Goyal等人2014年研究了人工神經網絡(ANN)、最小二乘支持向量回歸(Least Squares Support Vector Regression,LS-SVR)、模糊邏輯和自適應神經模糊推理系統(ANFIS)技術在提高亞熱帶氣候下日蒸發量估計準確性方面的能力。通過比較發現,模糊邏輯和最小二乘支持向量回歸方法可以成功地應用于從現有氣候資料模擬日蒸發過程,機器學習模型優于傳統的經驗方法。

干旱是水循環的間歇性干擾,深刻影響著陸地碳循環。然而,耦合的水循環和碳循環對干旱的響應和潛在的機制仍然不清楚。Yang等人2016年提供了第一個全球綜合的干旱對生態系統水分利用效率影響的數據WUE(Water Use Efficiency)。使用數據自適應機器學習方法構建兩個觀測WUE數據集,發現WUE對干旱的反應在干旱(WUE隨著干旱而增加)和半干旱/半濕潤生態系統(WUE隨著干旱而減少)之間形成對比,這歸因于生態系統過程對水文氣候條件變化的不同敏感性。干旱生態系統的WUE變率主要受物理過程(即蒸發)控制,而半干旱/半濕潤地區的WUE變率主要受生物過程(即同化)調節。同時多年來水文氣候條件的變化會加劇干旱對WUE的影響。結果表明,未來的干旱事件,加上氣候變率的增加,將進一步威脅半干旱/半濕潤生態系統,并可能導致生物群落重組,首先是低生產力和高水分敏感性的草地。

發展中國家農業生產率的提高被認為在減貧中發揮了關鍵作用。但在世界大部分地區,這種生產率仍然沒有得到很好的衡量,這阻礙了評估和瞄準提高生產率干預措施的努力。BurkeLobell2017年使用高分辨率衛星圖像,結合從肯尼亞數千塊小農土地上收集的田間數據,運用隨機森林等方法估計了非洲小農的田間產量變化。結果表明該方法對衡量具體干預措施的影響、描述收益差距的來源和規模以及開發針對非洲小農戶的金融產品都有潛在能力。

旱地環境中的土地退化和沉積物再活化被認為是一個重大的全球環境問題。鑒于目前穩定的沙丘系統在氣候變化和人類活動壓力增加的情況下有可能重新激活,確定外部擾動在驅動地貌響應中的作用至關重要。Buckland等人2019年開發了一種新的方法,使用人工神經網絡(ANN)應用于內布拉斯加州沙丘歷史再活化-沉積事件的時間序列,以確定半干旱草原上歷史時期的沙沉積與外部氣候條件、土地利用和野火發生之間的關系。結果表明,植被生長和沉積物再沉積事件都可以準確估計。單個因素的敏感性測試表明,當氣候保持在目前的條件下時,局部強迫(過度放牧和野火)具有統計上的顯著影響。然而,主要的影響是氣候引起的干旱。此方法有很大的潛力,可以估計未來景觀對各種潛在脆弱旱地環境的氣候和土地利用情景的敏感性。

4.氣候數據集改進

淡水資源具有很高的社會相關性,在當前氣候變化的背景下,了解其過去的可變性對于水資源管理至關重要。Ghiggi等人2019年進行了1902年至2014年期間全球網格月徑流的重建。徑流觀測用于訓練機器學習算法,該算法基于來自大氣再分析的前期降水和溫度來預測月徑流率。這種重建的準確性通過交叉驗證進行評估,并與大型河流流域的獨立流量觀測值進行比較。與13個最先進的全球水文模型徑流模擬的集合相比,所提供的數據集與徑流觀測值的一致性更好,使其成為大規模水文氣候過程研究、水資源評估以及評估和完善現有水文模型的理想候選。

在過去的20年里,大量的研究采用了基于人工神經網絡的遙感信息降水量估算的產品(Precipitation Estimation from Remotely Sensed Information using Artificial Neural Networks ,PERSIANN)。目前,PERSIANN提供了幾種基于不同空間和時間尺度的不同算法的降水產品。Nguyen等人2018年概述了可用的PERSIANN降水反演算法及其差異,使用氣候預測中心基于統一規范的分析作為基準,在不同的空間和時間尺度上對美國可用的業務產品進行了評估,挖掘PERSIANN產品的優勢和局限性,并提出了未來將通過進一步整合深度學習算法改進該數據集。

全球歷史氣候網絡每日數據庫包含全球各地氣象站的每日最高和最低溫度等變量。如果不考慮由于收集觀測值的時間造成的偏差,基于每日最低和最高溫度的氣候匯總統計數據將是不準確的。Rischard等人2018年提出了一種新的方法來解決這個問題:通過從附近記錄每小時溫度的站點信息來估算測量位置的每小時溫度,然后可以使用這些信息來創建溫度極值的準確匯總。關鍵的困難是溫度曲線的這些插補必須滿足落在觀察到的每日最小值和最大值之間的限制,并且在24小時內至少達到一次這些值,通過開發一個時空高斯過程模型,用于輸入來自附近站點的每小時測量值,然后開發一種新穎且易于實現的馬爾可夫鏈蒙特卡羅算法,用于從滿足上述約束的后驗分布中進行采樣。結果顯示,插補的溫度很好地恢復了隱藏的溫度而且該模型可以利用數據中包含的信息來推斷每天測量的時間。

過去一個世紀,特別是最近二十年,降水特征發生了前所未有的變化,這給社會帶來了嚴重的社會經濟問題,如水文氣象極端事件,特別是洪水和干旱。這些變化的根源在于不斷變化的氣候條件;然而,它的威脅性影響只能通過十年降水預測(Decadal Precipitation Predictions ,DPPs)的規劃來處理。由于降水預測的復雜性,DPP代表了一個非常具有挑戰性的前景。由于有限的技術和粗糙的空間分辨率,由大氣環流模式(GCMs)提供的DPPs不能直接用于影響評估。Salvi等人2017年基于九個GCM量化美國大陸DPPs的季節性和區域性平均技能,通過應用基于線性和核回歸的統計降尺度方法來解決與有限技能和分辨率相關的問題。這兩種統計方法都顯示出相對于原始GCM數據的改進,特別是在長期統計特性和不確定性方面。

(本文推送前略有修改,未完待續)END

——————————————————————————————————

來源 |中國信息化,2023,(10):29-35

作者單位 | 中國氣象局氣象發展與規劃院

編輯 | 馮裕健


久久福利精品福利资源伊人精品