Google 開源機器學習演算法 在家也能搜尋系外行星

類別: IT
TensorFlow

去年12月,美國宇航局宣佈,開普勒(Kepler)太空望遠鏡的資料中隱藏著兩顆新的系外行星。然而,這兩顆新行星並沒有被人類發現。相反,外行星狩獵神經網路(hunting neural network一種鬆散地模仿人類大腦的機器學習演算法)在開普勒資料中通過一種微妙的模式來發現行星,而這幾乎不可能被人看到。

星期四,行星 AI 的首席谷歌工程師Christopher Shallue在一篇部落格文章中宣佈,該公司正在開源該演算法的程式碼。換句話說,任何人都可以下載程式碼並在開普勒資料中幫助尋找系外行星。

開普勒太空望遠鏡於2009年發射,以搜尋系外行星。開普勒研究的恆星太遠,無法直接觀測到軌道上的外行星,所以天文學家必須根據觀測到的恆星亮度的變化來推斷外行星的存在。當一顆系外行星經過一顆恆星的前方時,恆星的亮度會出現暫時的下降,通過這種方式發現系外行星的存在。

經過四年觀測15萬顆恆星後,開普勒已經為天文學家篩選了大量的資料,遠比人類能夠有效搜尋的資料多。為了將搜尋範圍限制在最有希望的位置,天文學家專注於開普勒收到的30,000個最強恆星訊號,並設法在該過程中發現2,500顆系外行星。

然而,這意味著大約有12萬個較弱的訊號未經分析,其中任何一個都可能擁有一顆系外行星。為了搜尋這個寶貴的天文資料,Google的研究人員對15,000個已被NASA研究人員標記的外行星資料例項進行了神經網路訓練。這有效地教會了演算法在資料中尋找哪些簽名證明系外行星的存在。

在對演算法進行訓練之後,谷歌的研究人員用它分析了700顆來自已知有其他系外行星的弱訊號。在這個過程中,沙爾和他的同事們又發現了兩個新的系外行星。

谷歌在Github釋出了系外行星搜尋演算法的程式碼,其中還包括它的使用說明。儘管程式碼(和開普勒資料)可供任何人使用,但它不完全是“即試即用”。懂得谷歌的機器學習軟體 TensorFlow 和 Python 編碼的經驗人更有優勢。

根據Shallue的說法,釋放程式碼是讓公眾瞭解神經網路如何發現行星,同時鼓勵發現進一步分析開普勒資料的方式。除此之外,Shallue表示他希望神經網路能夠為將來更復雜的系外行星搜尋工具鋪平道路。

Google 開源機器學習演算法 在家也能搜尋系外行星原文請看這裡