潛水福利!AI處理水下攝影,顏色、清晰度全在線

大數據文摘 發佈 2020-01-17T05:44:11+00:00

結果表明,該方法優勢體現在兩方面,一方面是顏色還原均勻,另一方面是可以在不破壞原始輸入圖像的底層結構的情況下很好地還原綠色色調的圖像。

大數據文摘出品

來源:venturebeat

編譯:大萌、夏雅薇


你有過水下拍攝照片的經歷嗎?你是否注意到水下拍攝的圖片總是有些模糊甚至失真?這是由於光的衰減和反向散射效應導致水下能見度較低。


為了解決這個問題,哈爾濱工程大學的科研人員設計了一種機器學習算法用於生成逼真的水下圖像,以及一種基於生成的圖像進行訓練從而實現自然色恢復和除霧的算法。團隊表示該算法在圖片處理質量和數量上都與頂尖技術水平相當,該算法每秒在單個顯卡上處理的幀數可達125幀。


圖:圖像增強前後的水下目標探測結果。(A)真實的水下照片和(B)基於模型輸出的真實照片。紅色框內為扇貝,藍色框內為海參,綠色框內為海膽。


團隊表示大多數水下圖像增強算法(例如調節白平衡算法)都不是基於物理成像模型構建的,因此算法的泛化能力較差。而該技術採用的方法是首先利用生成對抗網絡(GAN)來生成一組特定調查地點的圖像,再將這組圖像輸入給第二個算法,U-Net。其中GAN是一種由生成器構成的AI模型,用於使鑑別器在分類過程中將合成樣本歸類為真實樣本。


團隊運用3733個帶標籤的圖像以及對應的深度地圖訓練GAN,圖像主要包括扇貝、海參、海膽及其他水產養殖生物。他們還獲得了包括NY Depth在內的公開數據集,該數據集總共包含數千張水下照片。


訓練完成後,研究人員將雙模型方法的結果與基線模型方法的結果進行對比。結果表明,該方法優勢體現在兩方面,一方面是顏色還原均勻,另一方面是可以在不破壞原始輸入圖像的底層結構的情況下很好地還原綠色色調的圖像。通常情況下,該方法還能夠在保持「適當的」亮度和對比度的同時還原顏色,這是其他圖像增強方法所做不到的。


不過研究團隊基於受損圖片重建圖像的方法並非首創。劍橋諮詢公司的 AI 系統DeepRay用10萬個靜止圖片來訓練GAN網絡,用來消除由不透明玻璃板導致的圖片失真。開源的DeOldify計劃採用了包括GAN的一系列AI模型來對舊照片和膠捲進行著色和還原。


此外,微軟亞洲研究中心的科學家在去年九月詳細介紹了一個用於給視頻自動著色的端到端系統。去年英偉達的研究人員構建了一個框架,該框架僅基於一個帶注釋的著色視頻幀就能推斷顏色。並且谷歌的AI團隊在去年六月推出了一種無需人工監督即可對灰度視頻進行著色的算法。


相關報導:

https://venturebeat.com/2019/12/30/researchers-detail-ai-that-de-hazes-and-colorizes-underwater-photos/

關鍵字: