AI氣候預測“三劍客”:因為一篇Nature論文打開了創新的大門

在達摩院AI氣候預測大賽里,王天雷和胡中巖、耿良超組成的AI Lab隊排名4名,是唯一一組進入決賽的南京隊伍。
他們三位都是南京信息工程大學計算機與軟件學院的學生,王天雷是隊伍的隊長,今年研二,胡中巖和耿良超研一,雖然不是同一個年級,但他們擁有同一個導師————耿煥同,耿教授帶領的實驗室承擔過國家重點發計劃子課題和多項國家、省、市氣象局的研發任務,比如短臨雷達外推、延伸期降水溫度風速預測、模式修正等工作。王天雷和胡中巖、耿良超就是實驗室里的氣象預測“三劍客”。
雖然說他們的專業深度學習,但和一般高校的計算機相關專業不同,這一專業在南京信息工程大學更注重學術和產業的結合,就是將AI算法應用在氣象等領域。
春節前夕,達摩院發布了AI氣候預測大賽,耿煥同是第一個看到比賽信息的,實驗室一直比較重視各類比賽。于是他就把比賽推薦到實驗室內部。恰巧【三劍客】在幾個月前,閱讀了羅京佳教授的深度學習預測厄爾尼諾的論文《Deep learning for multi-year ENSO forecasts》(發布在Nature),王天雷當時就覺得這個他這個創新點很有趣,因為以前還沒有人用卷積神經網絡和遷移學習的方法成功預測厄爾尼諾。這一大膽創新為團隊打開了一扇新的大門,但意外的是,“三劍客”很快在實驗室里開辟了一條新的道路,嘗試用另外一個AI模型來做預測。“因為厄爾尼諾預測也算是一個時空序列問題,所以我們思考用擅長的時空預測模型來做預測。”
巧合的是,這次比賽剛好可以檢驗下他們的新方法。
于是,王天雷和兩位師弟再次相約組隊報名參賽。
王天雷表示,雖然他們是計算機學院的學生,但是平時接觸的項目都是各氣象局的,再加上南信大本的氣象氛圍比較濃厚,所以說對氣象領域也算是略有了解。這是他們的天然優勢。
春節后,比賽一開榜,隊伍正式就立即開始了比賽相關的工作,包括數據處理、模型訓練等等。僅僅一個星期后隊伍就提交了成績。
不過,團隊比賽過程并非一帆風順。晉級賽階段,比賽明確要求“提交最優模型對應完整端到端代碼運行得到最優成績”,這一規則保證了比賽的絕對公平公正,但代碼必須通過docker提交鏡像,而“三劍客”們對該技術僅僅是略有耳聞,這是他們的知識盲區,所以他們需要學習阿里鏡像倉庫的使用,才能把比賽進行下去。
另外,實驗室的研究和具體場景并不一樣。實驗室的論文更重視模型的準確度,而對模型的穩定性和訓練時間著墨不多,而比賽中數據預處理、訓練和推理必須嚴格限制在6小時內完成。所以“三劍客”必須改變往常實驗室動輒訓練一周、半個月的訓練方案,去選擇一個性價比最高的新方案,包括數據預處理、篩選特征、舍棄準確但臃腫的模型等。
整個過程還有一個小插曲。隊伍處理數據集的時候,有一段代碼沒交接好,數據集是亂的。導致提交的結果一直是在二三十分徘徊,直到比賽最后一天,檢查代碼的時候才發現這個bug,修復之后分數直接就變成40分了。最終他們以B榜成績第四的位置闖入決賽。
王天雷認為機器學習的比賽是有很多小技巧的,例如盡可能地汲取頂會里的優質模型,并且融合模型。
“三劍客”非常看好AI在氣象預測領域的應用,雖然氣候領域的厄爾尼諾數據并不多,但氣象相關的資料非常充足,比如氣象雷達,6分鐘就可以出一張圖,遠遠可以滿足現在模型的需求。其次,是標簽問題,氣象領域的很多問題都是無監督學習,可以免去人工標簽這一過程。這些對于其他領域來說可能都是瓶頸。王天雷還認為AI和傳統模式應該握手,兩者都具有各自的優勢,但是目前大家幾乎都是各干個的。
- 免責聲明:本文內容與數據僅供參考,不構成投資建議。據此操作,風險自擔。
- 版權聲明:凡文章來源為“大眾證券報”的稿件,均為大眾證券報獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為“大眾證券報”。
- 廣告/合作熱線:025-86256149
- 舉報/服務熱線:025-86256144
