洞悉銀河，AI 為天文學家研究銀河系賦予洞察力

由英偉達nvidia中國發佈 2020-02-06T23:02:20+00:00

該研究小組使用NVIDIA V100 Tensor Core GPU 進行推理，能夠在 30 秒內對 10,000 個星系進行分類。

和現代年輕人們的自拍照數量比起來，天文學家們製作的銀河系圖像庫的倍增速度要遠比其快的多。

在天文學研究過程中，天文學家們已經收集了數百萬張圖像。但隨著近期關於暗能量研究和後續的關於空間及時間的研究項目的逐步開展，這一數量將呈螺旋式上升趨勢，預計這些研究項目將再收集數十億的數據。

此前，一個名為 Galaxy Zoo 的眾包（crowdsource）項目吸引了大量的志願者參與項目，幫助天文學家們對斯隆數字天空研究項目（Sloan Digital Sky Survey）中的 100 多萬張星系圖像進行分類。但是公眾對於天體物理學的幫助所能達到的程度，也僅此而已了。

伊利諾伊大學香檳分校（the University of Illinois at Urbana-Champaign）的物理學博士 Asad Khan 說：「Galaxy Zoo 是一次成功的嘗試，但在接下來的研究當中，其收集數據的速度之快，是這種眾包方法所無法滿足的。這就是為什麼人們需要提出新的方法，通過 AI 技術來推進數據驅動型發現的進程，其中就包括包括圖像分類。」

藉助於遷移學習技術，Khan 和他的同事們利用當前流行的圖像分類模型 Xception 開發出了一種神經網絡，可以將星系圖像分類為橢圓形或螺旋形星系，而且具有專家級的精度。對星系形狀進行分類，可以幫助科學家們確定星系的年齡，而且還可以幫助科學家們理解更為複雜的問題，如關於暗能量和宇宙膨脹的速度。

自動化星系分類可以減少天體物理學家在標記上所花費的時間，從而將其精力投入到更為複雜的研究當中。

此研究項目是首次將深度遷移學習應用於銀河系分類當中，也是 SC19 年度超算大會上所展示的六項科學可視化和數據分析項目之一。

AI 為天文學研究提速

研究人員使用斯隆數字天空研究項目（Sloan Digital Sky Survey）中的 35,000 張星系圖像訓練該深度學習網絡。藉助於阿貢國家實驗室（Argonne National Laboratory）的 Cooley 超級計算機，研究小組將神經網絡訓練時長從 5 小時加速到 8 分鐘，該超級計算機配備了數十個 NVIDIA 數據中心 GPU。

在使用斯隆數字天空研究項目（Sloan Digital Sky Survey）中的其他圖像進行測試時，該 AI 在對圖像進行橢圓形及螺旋星系分類，其精度達到 99.8%，相比於沒有使用遷移學習的神經網絡，其精度有了很大提升。

該研究小組使用 NVIDIA V100 Tensor Core GPU 進行推理，能夠在 30 秒內對 10,000 個星系進行分類。

Khan 表示：「我們已經開始正式使用該網絡。後續還將在暗能量研究中使用該網絡的升級版本，藉助其對項目中的 3 億個星系進行分類。藉助於 GPU 加速推理，我們可以隨時對所有圖像進行分類。」

Khan 和他的團隊還開發了一項可視化技術來展示神經網絡在訓練過程中是如何學習的。

他表示：「即使深度學習模型可以達到令人驚嘆的精度水平，但是當 AI 出現了錯誤的時候，我們通常也無法知道其出錯的原因。像這樣的可視化技術可以對神經網絡性能進行啟發式檢查，這為科學界提供更多的解釋依據。」

研究人員下一步計劃研究星系的形態是如何隨紅移而變化——這是一種由宇宙膨脹引起的現象。

本文主圖片來自 Sloan Digital Sky Survey，由 Wikimedia Commons 在 Creative Commons（CC BY 4.0）下授權。