Nature Climate Change: 利用人工智能和計算推進氣候建模和預測
轉載于
對于如何做出指導適應氣候變化所需的準確預測,存在著截然不同的觀點。本文主張利用人工智能,以特定領域的知識為基礎,生成中高分辨率(10-50 km)的氣候模擬集成,作為災害模型的錨點。氣候適應規劃者、地方決策者和各行各業都要求對氣候風險進行詳細評估,這就需要大量的氣候模擬集成。然而,氣候模型難以提供所需的具有量化不確定性的精細預測。氣候預測的準確性和可用性亟待提高。
為逐步改變氣候建模而提出的一種方法是將重點放在具有 1km分辨率的全球模型上。這些模型可以改善模擬,例如大氣對流風暴和由此產生的極端降水的模擬。然而,由于千米尺度的模型在計算上已達到極限,它們只能產生少數模擬結果——主要是在北半球的某些中心區域。
另一種方法是將模型分辨率提高到 10至50km(目前的標準分辨率為100km左右),重點是利用地球觀測數據進行校準,并使用人工智能(AI)工具進行更高分辨率的區域模擬。這樣就能利用離線災害模型生成大型集成,量化不確定性并支持詳細的影響評估。作者認為,這種平衡的方法——結合更高分辨率建模、人工智能以及從觀測和模擬數據中學習——為準確的氣候風險評估提供了最穩健的途徑。 千米尺度模型水平分辨率約為1km的氣候模式很有吸引力,因為其分辨率與許多氣候風險評估所需的尺度非常接近。例如,在模擬區域降水及其極端情況時,它們有望減少誤差。然而,盡管千米尺度模型被稱為地球的 "數字孿生(digital twins)",它們仍然存在與當前模型類似的局限性和偏差。它們無法捕捉到重要的亞千米尺度過程,如在1-10m尺度上運行的、能量上至關重要的低層云的動力學過程。它們遠遠無法解決大氣湍流問題,而大氣湍流占據了從行星尺度到約1毫米的耗散(Kolmogorov)尺度的連續尺度。因此,盡管一個水平分辨率為1km、垂直高度為200m的大氣模型將有1011個空間自由度,但這還是比地球大氣中的湍流小1017倍。此外,在最微小的湍流尺度之下,一些過程的運行導致了氣候預測的重大不確定性?刂圃频魏捅纬傻脑莆⒂^物理過程發生在納米和微米尺度上,調節著地球的能量平衡。云微觀物理過程的不確定性在很大程度上導致了氣候模式對溫室氣體濃度增加的敏感度不同。這種小尺度過程的表述誤差會向上滲透,導致模型的大尺度能量平衡和降水模式等模擬特征出現偏差。因此,由于千米尺度模式不能解決許多關鍵的小尺度過程,它們表現出一些與大尺度偏差相同的問題——例如熱帶降雨模式——這些問題幾十年來一直困擾著分辨率較高的模式。迄今為止,從10km到1km分辨率的精度提升是漸進的,對流風暴的強度在千米分辨率下還沒有達到趨同。事實上,如果不進行校準,高分辨率下的大尺度偏差可能會比低分辨率下更大。總之,千米尺度的模式并不能提供精確度上的階躍性變化,從而使人們有理由接受它們對模擬集成規模的限制,而模擬集成規模既是校準不可避免的未解決過程的經驗模式所必需的,也是量化不確定性所必需的。 利用人工智能和數據改進地球系統模型本文提出了一種利用計算和人工智能進步的平衡方法,而不是優先考慮千米尺度的分辨率。通過適度提高全球分辨率,同時廣泛利用觀測和模擬數據,這種方法更有可能實現風險評估氣候建模的目標,即最大限度地減少模型誤差和量化不確定性。模型分辨率不是萬能的,而是實現這一目標過程中需要優化的幾個參數之一。它是優化的有力杠桿,因為在垂直分辨率固定的情況下,計算成本隨水平分辨率的增加而呈立方倍增:1000次10km分辨率的模擬與1次1km分辨率的模擬的成本相同。過渡到10km左右的全球分辨率將意味著比現行標準有顯著提高,同時仍能生成大型集成。這些集成對于量化不確定性和利用人工智能工具從數據中了解關鍵的小尺度過程(如云動力學和微物理學)至關重要,因為這些過程無法直接解析。
由于氣候預測的重點是統計量,如平均氣溫或極端降水事件的概率,因此從長期積累的氣候統計數據中了解無法解決的過程是很自然的;這與天氣預報中的天氣狀態同化形成鮮明對比(天氣預報與氣候預測之間的關鍵差異見Box 1)。氣候統計數據相對平滑的時空變化也有助于緩解模擬和觀測之間分辨率差異帶來的挑戰。
▲Box 1 | 天氣預報 vs 氣候預測
最近數據同化的改進推動了天氣預報的進步。氣候預測也可能取得類似進展。然而,天氣預報和氣候預測有著本質的區別。天氣預報是第一類預測,旨在預測初始條件下的未來系統狀態。第一類預測的可預測性受到混沌的限制--大氣層的狀態在兩周內就會被“遺忘”。每日天氣觀測數據同化為天氣預報提供了初始條件。它還通過反復將模擬溫度拉回觀測值等方式,補償未解決過程的表達誤差和抵消模型能量平衡中的偏差。相比之下,氣候預測屬于第二類預測,旨在預測在不斷變化的邊界條件(如溫室氣體排放)下未來的氣候統計數據。第二類預測的可預測性是有限的,因為在混沌的背景變異中,氣候統計數據變化的信號只會緩慢出現。要預測這些緩慢變化的氣候統計數據,氣候模式必須在未來幾十年內自由運行,而沒有機會通過同化觀測到的氣候狀態來彌補誤差。因此,預測多年代時間尺度上氣候統計數據如何變化的能力主要受限于不確定性和未解決過程表達中的誤差。排放情景的不確定性也開始在 30 年左右的時間尺度上產生重大影響,并在百年尺度上占主導地位。因此,無論是通過傳統的數值模型還是機器學習模型獲得的改進的天氣預報,都不能直接轉化為改進的氣候預測。但是,推動天氣預報取得進展的一些工具,如數據同化,可以用于氣候模型從數據中學習,盡管數據是由氣候統計數據而不是天氣狀態組成的。
然而,利用人工智能工具學習氣候統計數據也面臨著挑戰。廣泛采用的機器學習范式——監督學習——通常依賴于模型梯度進行訓練,這種范式限制性太大,因為它需要待學習過程層面的直接訓練數據。然而,氣候數據(例如云層統計數據)通常只能提供有關要學習的過程(例如云微觀物理)的間接信息。從多年平均值或季節周期等統計數據中學習,還需要積累數年到數十年的模擬統計數據,因此訓練階段的計算成本很高。
但這些挑戰是可以應對的。在天氣預報中被廣泛用于狀態同化的集成卡Kalman方法,可以通過解決反演問題來學習氣候模式的參數、參數函數甚至機器學習組件。這些方法避免了監督學習的限制和對模型梯度的依賴。它們允許使用噪聲、異構和間接數據來校準模型,例如現在可用的大量地球觀測數據(圖1)。它們可以與機器學習模擬器配對,加快不確定性量化,將所需的氣候模型運行次數從標準馬爾科夫鏈蒙特卡羅方法的 O(106)減少到易于管理的O(103)。
▲圖1 | 通過學習觀測和模擬數據改進氣候模式和預測。為了改進氣候模式,編碼特定領域知識的模式組件應從地球觀測或區域高分辨率模擬獲得的各種氣候統計數據中學習。理想的情況是,模型各組成部分共同學習,并對其共同的不確定性進行量化,通過包裹所有模型組成部分的數據同化和機器學習工具共享層來揭示和減少各組成部分之間的補償誤差。這種模型校準和不確定性量化需要大量的氣候模擬集成,同時也需要大量的模擬集成來采樣可信的氣候結果空間。這些模擬集成可以以中等高分辨率(10-50km)生成,但還不能以千米尺度生成。
氣候系統中存在大量無法解決的尺度問題,需要從現有的觀測數據中歸納出未知的氣候,這本來會帶來巨大的數據需求,但通過將數據學習與特定領域的知識(例如理論和守恒定律)相結合,可以緩解這種需求。將數據和新的人工智能工具與特定領域的知識相結合的領域已經成熟,可以取得進一步的進展。進展不僅對氣候科學很重要,對計算科學和工程學也很重要,因為從有限的數據中學習未解決過程的閉合模型(Closure Models)是一個常見問題。
無論哪種人工智能工具占上風,我們都需要能夠運行氣候模式O(103)次,以校準無法解決的過程,量化模式的不確定性,并產生從已學模式中采樣的、跨可信氣候結果的大型預測集成。在未來十年內,以千米尺度的分辨率生成這些大型集成預測仍然是不可行的。因此,盡管隨著計算機性能的提高,我們應該不斷提高分辨率,但未來十年的氣候建模需要將重點放在 10-50km范圍內的分辨率上。在這一范圍內,熱帶氣旋和中尺度海洋湍流開始得到解決,相對于今天的 O(100km)分辨率標準,可以改善對最具破壞性的天氣災害以及海洋熱量和碳吸收率的模擬。
因此,大集成仍然是可行的,甚至已經開始產生。更高分辨率的模擬,從km到m,在為更高分辨率的模式提供訓練和驗證數據方面可以發揮作用,包括在沒有觀測數據的不同于今天的氣候條件下。然而,這些模擬并不需要遍及全球,而是可以針對特定區域或氣候條件,因為它們特別具有參考價值——這種方法非常適合分布式(云)計算(圖 1)。
分布式研究計劃中的模型層次結構
氣候建模必須支持各種適應決策,其中許多是局地尺度的決策。這就要求將氣候預測集成下降到與影響相關的尺度,并在過程模型或生成式人工智能的基礎上,建立離線災害模型的層次結構,以便有效地探索各種情景,并將不確定性傳播到具體的氣候影響中。災害模型包括內陸和沿海洪水、風暴-熱浪對基礎設施和弱勢群體的復合影響以及野火風險的米級模型。重要的是,如果將重點放在千米尺度的全球建模上的話,那么氣候模式的開發必須能夠通過快速迭代加以利用和改進,在一個全球包容和分布式的研究計劃中進行,而不是將資源集中在少數幾個單一的中心。以中等高分辨率(10-50km)生成大型模擬集成為重點的方法可以更好地評估氣候風險,并使其得到更廣泛的采用。在進行計算成本高昂的校準和不確定性量化之后,這些模型可由不同群體運行,從而利用全球人才庫中最易受氣候變化影響和最了解其社區所面臨風險的人才。
論文信息
標題:Harnessing AI and computing to advance climate modelling and prediction
期刊:Nature Climate Change
類型:Comment
作者:Tapio Schneider*【California Institute of Technology】, Swadhin Behera【 Japan Agency for Marine-Earth Science and Technology】, ...... , & Toshio Yamagata【 Japan Agency for Marine-Earth Science and Technology】
時間:2023-09-05
DOI :https://doi.org/10.1038/s41558-023-01769-3
— END —
來源:生態學家
- 上一篇:進展: 利用深度學習重建臺風尺度數據集 2023/9/15
- 下一篇:盤古氣象預報模型與多種全球業務數值模式初始場適配能力 2023/9/10