來自世界氣象組織(WMO)的資料顯示,在過去 50 年裡,平均每天都會發生一場與天氣、氣候或水患有關的災害,每天造成 115 人死亡、2.02 億美元的經濟損失。
因此,構建更準確的天氣預報系統,將有助於挽救數百萬人的生命,減少數萬億美元的經濟損失,意義重大。
然而,傳統的天氣預報依賴數值天氣預報演算法(NWP),計算複雜度高、模型構建耗時,難以快速生成預報結果。基於機器學習的天氣預報(MLWP)在效率和單次預報準確性上雖有所突破,但在量化預報不確定性和處理複雜時空相關性方面表現不足,表現不及 NWP 整合預報系統。
如今,由 Google DeepMind 研究團隊開發的人工智慧(AI)模型 GenCast,將天氣預報的精度與效率帶入了一個嶄新的階段——
GenCast 能夠在 8 分鐘內生成一組隨機的 15 天全球預報,時間步長為 12 小時,解析度達 0.25°,覆蓋超過 80 種地表和大氣變數,在 97.2% 的評估指標(共計 1320 個指標)上都優於當前全球最好的中期預報——歐洲中期天氣預報中心(ECMWF)的集合預報(ENS),而且具有更好的邊際和聯合預報分佈。
另外,GenCast 在預報極端天氣(如高溫、強風)、熱帶氣旋路線和風能產量時,也更加有效。
相關研究論文以“Probabilistic weather forecasting with machine learning”為題,已發表在權威科學期刊 Nature 上。
GenCast:更快、更準預報未來天氣
GenCast 是一個全新的機率天氣預報模型,透過條件擴散模型(conditional diffusion model)生成一系列可能的天氣場景。其核心能力在於建模未來天氣狀態的條件機率分佈,即基於當前和之前的天氣狀態生成未來的預報。這一方式允許 GenCast 以更快的速度和更高的精度提供全球範圍 15 天機率性天氣預報。
具體而言,GenCast 的架構包括編碼器、處理器和解碼器三大模組。編碼器將初始天氣狀態對映到一個經過 6 次精細劃分的球形網格上,處理器則透過圖 transformer 在網格節點間捕捉複雜的時空相關性,而解碼器則將結果重新映射回全球緯經度網格,生成最終的天氣預報。
圖|GenCast 生成天氣預報的示意圖。
此外,研究團隊利用 ERA5 再分析資料對 GenCast 進行了訓練,這一資料集包含 40 年間全球範圍內的最佳天氣估計分析結果,確保了模型的泛化能力和對歷史天氣模式的深度理解。
為評估 GenCast 的實際效能,研究團隊對其進行了基準測試,並將其與當前最先進的系統和模型進行對比。為確保公平對比,所有模型均基於 ERA5 資料進行初始化,並統一解析度至 0.25°。
在與其他系統對比的實驗中,GenCast 生成的天氣樣本更接近實際觀察值,預報分佈覆蓋了可能的多種情景,為使用者提供了對潛在風險的更全面理解。例如,GenCast 在臺風海貝思登陸日本前不久的預報非常清晰,在 1-15 天的預估時間內,其球諧功率譜與 ERA5 地面真實值非常接近。
之後,研究團隊評估了 GenCast 和 ENS 在極端天氣預報方面的整體預報技能、校準和效能,即邊際預報效能。邊際預報作為對某一時間和地點的天氣狀況進行的具體預報,是日常天氣服務的核心。
GenCast 在這一領域展現了強大的效能優勢。其生成的預報分佈能夠更精確地反映可能的天氣情景,不僅在溫度、風速和氣壓等變數的預報上與真實資料高度吻合,還能透過改進的機率校準有效量化預報的不確定性。
具體研究顯示,GenCast 在多個氣象變數的邊際分佈預報中表現優於 ENS,在一個涵蓋 1320 個評估目標的測試中,GenCast 在 97.2% 的情況下取得更高的技能得分(CRPS),特別是在短期預報(1 至 5 天)中效果顯著。
同時,GenCast 在預報高溫、強風等極端天氣時同樣表現卓越。研究採用 Brier 技能得分和相對經濟價值(REV)曲線衡量模型效能。結果顯示,在預報高溫(99.99% 分位點)和極端低溫(0.01% 分位點)事件時,GenCast 的表現顯著優於 ENS。
此外,GenCast 的邊際分佈預報展現了良好的校準能力,這意味著它能夠準確地識別預報中可能存在的錯誤或偏差,為使用者提供更可靠的天氣決策支援。
圖|GenCast 的邊際預報分佈嫻熟且校準良好。
除了邊際預報,GenCast 在聯合預報方面也展現了令人矚目的表現。聯合預報關注天氣變數間的空間和時間相關性,對於捕捉全域性天氣系統的動態特性至關重要。
例如,在熱帶氣旋軌跡預報方面,對熱帶氣旋的路徑預報不僅依賴單一變數,還需考慮多層次的大氣相互作用。而 GenCast 能夠生成具有時空一致性的天氣樣本,精準地捕捉這些複雜的相關性,從而生成精確預報。
研究特別分析了 GenCast 在臺風“海貝思”案例中的表現。颱風軌跡預報顯示,GenCast 的不確定性評估範圍覆蓋了更多可能的情景,其在軌跡位置預報上的誤差顯著低於 ENS。更重要的是,隨著預報時間的縮短,GenCast 的不確定性範圍逐步收斂,為決策者提供了更精確的著陸時間和地點資訊。
除此之外,在區域風能預報中,GenCast 將 10 米風速資料轉化為風能輸出,其預報精度較 ENS 提高了 20%,尤其在短時間尺度上,為可再生能源排程提供了新的可能性。
圖|GenCast 在區域風力和熱帶氣旋預報方面優於 ENS。
儘管 GenCast 在精度與效率上實現了雙重突破,但仍有進一步最佳化空間。例如,提高解析度以匹配未來升級的 ENS 系統,或者透過蒸餾技術降低計算成本。此外,結合操作性資料進行微調或融入更多傳統 NWP 的初始條件處理方法,亦可顯著提升其實用性。
AI 如何重塑氣候預報未來?
AI 作為“一個改善極端天氣預報的更快、更便宜的替代方案”,一向在天氣預報領域被寄予厚望,除了谷歌,包括華為、清華大學等在內的科技公司和高校在這一方向均取得了重大進展。
2023 年 7 月,由華為雲開發的盤古氣象(Pangu-Weather)模型登上了 Nature,其使用 39 年的全球再分析天氣資料作為訓練資料,預報準確率與全球最好的數值天氣預報系統 IFS 相當,且在相同的空間解析度下比 IFS 快 10000 倍以上。
同期發表在 Nature 上的另一篇論文則介紹了 NowcastNet,其出自機器學習領域泰斗、加州大學伯克利分校教授 Michael Jordan 和清華大學教授王建民領導的研究團隊,該模型可以結合物理規律和深度學習,進行實時預報降水。NowcastNet 在臨近預報方面表現出色,基於雷達觀測資料,可以做到提前 3 小時對 2048 km × 2048 km 的區域進行高分辨降水預報。
2023 年 11 月,Google DeepMind 推出了一款基於機器學習的天氣預報模型——GraphCast,在全球 0.25° 的解析度下,該模型可以在一分鐘內預報未來 10 天的數百個天氣變數,顯著優於傳統氣象預報方法,同時在預報極端事件方面表現良好。相關研究論文已發表在權威科學期刊 Science 上。
2024 年 3 月,Google Research 洪水預報團隊開發了一種 AI 模型,其利用 5680 個測量儀資料訓練,可在 7 天內預報未測量流域的日徑流。該模型在同日預報和 5 年一遇極端天氣事件的預報中,表現優於當時領先的全球洪水預警系統 GloFAS。相關研究論文已發表在權威科學期刊 Nature 上。
2024 年 7 月,Google Research 團隊及其合作者推出了一款天氣預報和氣候模擬模型 NeuralGCM,在 1-15 天短期天氣預報中的準確率媲美 ECMWF 模型,並在氣旋預報和軌跡模擬上表現優於現有模型。加入海平面溫度後,該模型的 40 年氣候預報結果與全球變暖趨勢高度一致。且 NeuralGCM 可以在 30 秒計算時間內生成 22.8 天大氣模擬。相關研究論文已發表在權威科學期刊 Nature 上。
相信在不久的將來,AI 驅動的天氣預報將以更快的速度與更高的準確率在災害預警、能源規劃和氣候適應等方面發揮更大的作用,為人類應對日益複雜的氣候挑戰提供更強大的工具。
論文連結:https://www.nature.com/articles/s41586-024-08252-9
作者:阮文韻
如需轉載或投稿,請直接在公眾號內留言