一種基於卷積神經網絡的立體匹配算法設計

電子技術應用 發佈 2020-12-14T02:54:11+00:00

立體視覺作為計算機視覺最為熱門的研究領域,廣泛應用於車輛的自動駕駛、機器人導航、三維重建、物體檢測和識別等方面。立體匹配作為立體視覺系統中的核心技術,其匹配的精確度決定著整個系統的性能。

立體視覺作為計算機視覺最為熱門的研究領域,廣泛應用於車輛的自動駕駛、機器人導航、三維重建、物體檢測和識別等方面。立體匹配作為立體視覺系統中的核心技術,其匹配的精確度決定著整個系統的性能。由於拍攝的立體圖像大多存在噪聲干擾、重複紋理、低紋理和遮擋區域等問題,並且受到光照條件的影響,如何高效快速地獲取精準的視差圖仍存在著諸多挑戰。

立體匹配算法的典型流程包含匹配代價計算、代價聚合、視差計算和視差優化四個步驟[1],其又分為全局算法和局部算法。局部算法通常使用固定大小的窗口或可變的窗口來計算初始代價,例如Census算法等,實現都比較簡便,但是在視差突變區域存在諸多弊端,對低紋理和遮擋區域匹配效果差。全局匹配算法通過建立全局能量函數,利用最小化全局能量函數來獲取最優的視差值[2]。常用的全局匹配算法包含動態規劃、圖割法、置信傳播法、遺傳算法等。全局匹配算法隨著計算複雜度的提升,匹配效果較局部算法有所提升,但數據依賴性大導致運行速度慢,需要花費很長的時間進行計算。

為了解決傳統立體匹配算法在低紋理、遮擋區域的匹配效果差的問題,本文研究了一種端到端的基於的立體匹配算法,並利用了(ASPP)[3]網絡獲取圖像的上下文信息和多尺度的三維卷積網絡來擴大圖像的感受野。最終獲得的視差圖的精度遠高於傳統匹配算法,對圖像的邊緣、遮擋區域的匹配效果都非常優異。

http://www.chinaaet.com/resource/share/2000003083

關鍵字: