人臉識別後,下一個視覺「殺手級應用」來了——依圖行人重識別(ReID)刷新世界紀錄

ai掘金志 發佈 2020-03-31T06:32:46+00:00

從AI的人臉識別能力超越人類以來,學術界和產業界的目光逐漸轉向另一個更具科研意義和應用價值的課題———行人重識別,也稱「行人再識別」,簡單來說,是在多攝像設備網絡下對行人進行檢索,利用步態動作、身體特徵等更為全面的信息來識別人物,無論單獨使用還是與人臉識別相結合,都能發揮更大的應

世界級ReID算法,加上自研AI晶片,業界期待的下一個計算機視覺領域「殺手級應用」已然到來。

人臉識別之後的下一個風口是什麼?

對於這個問題,業界似乎早已有了共識。從AI的人臉識別能力超越人類以來,學術界和產業界的目光逐漸轉向另一個更具科研意義和應用價值的課題———行人重識別(Person Re-identification,ReID),也稱「行人再識別」,簡單來說,是在多攝像設備網絡下對行人進行檢索,利用步態動作、身體特徵等更為全面的信息來識別人物,無論單獨使用還是與人臉識別相結合,都能發揮更大的應用價值。

近日,依圖科技在ReID領域取得新突破,刷新全球三大權威數據集當前最優成績,超越阿里、騰訊優圖、大華、中興、澎思在內的眾多廠商,算法性能達到業界迄今最高標準,進一步拓展了算法和應用的邊界。

值得一提的是,考慮到算法對比的公平性,YITU的算法結果是在不利用時空信息,不進行重排再優化(Re-ranking)等限制下取得的。

1 是的,這次又是依圖

在行人重識別技術領域,首位命中率(Rank-1 Accuracy)和平均精度均值(Mean Average Precision,mAP)是業內公認的衡量算法水平的核心指標。此次在三大ReID權威數據集Market1501、DukeMTMC-ReID、CUHK03上,依圖將衡量算法性能的兩大關鍵指標「首位命中率」(Rank-1 Accuracy)及「平均精度均值」(Mean Average Precision,mAP)的六項數據全部大幅提升,刷新世界記錄。

需要指出,首位命中率高,只意味著算法能夠在眾多圖像中準確找出最容易識別或者匹配的那張,並不能反應模型的真實能力,尤其是應對複雜場景的表現。

因此,評價ReID算法性能時需要結合「平均精度均值」(mAP值),它反映的是系統的綜合檢索性能。mAP值越高,說明系統的實用性越好,既能查得全也能查得准,能夠較好地應對多遮擋、光線暗、畫面模糊等情況。

還記得2018年底依圖進軍智能語音,隨即在中文語音識別領域創下識別精度的新紀錄;2019年5月平地驚雷般推出「發布即商用」的全球首顆雲端視覺AI晶片;此次依圖刷新ReID全球三大權威數據集當前最優成績,似乎無論進入哪個技術領域,依圖都能快速迎接挑戰,將行業整體水平推至新高點,並加速技術的產業化落地。

這背後的關鍵是什麼?

2 不走尋常路——深度優化ReID算法框架,

AutoML取代人工算法調優

ReID需要從不同攝像機拍攝的圖像或視頻中找出同一個人物,而這些攝像機所覆蓋的範圍彼此並不重疊,導致缺乏連貫的信息,而且不同畫面中人物的姿態、行為甚至外觀(比如: 正身、側身、背身)會發生較大變化,不同時間、場景的光照、背景和遮擋物各不相同(背景中常還有體型、衣著相似的其他人物干擾),攝像機的解析度也有高有低,人物在畫面中出現的位置有遠有進,這些都對ReID技術提出了極大的挑戰。

憑藉一貫「敢啃硬骨頭」的自身工程與研發實力,依圖此次深度優化了ReID算法框架,顯著提升了算法效率,通過結合AutoML等前沿技術,創新性地實現了模型參數的自動搜索與疊代,突破了依賴算法研究員手工設計與調優的傳統算法開發流程,在降低人力成本的同時,使得算法的精度、泛化能力更強。

在業界三大ReID權威數據集Market1501、DukeMTMC-ReID、CUHK03上,依圖自研算法將衡量算法性能的兩大關鍵指標「首位命中率」(Rank-1 Accuracy)及「平均精度均值」(Mean Average Precision,mAP)當前記錄全部刷新,充分顯示了其世界級的算法實力。

3 同時突破算力+算法

加速ReID實戰落地

ReID任務相較於人臉識別任務更具有挑戰性,因為它在算法本身提出更高要求的同時,也需要更高效的晶片提供強大的算力支持。二者缺少任意一個,都會阻礙ReID的商業化落地,影響ReID的實際應用價值。而目前看來,依圖是當下同時具備算法和算力能力的公司。

依圖在 2017 年自研雲端 AI 晶片 QuestCore™(求索),並於 2019 年 5 月發布即商用,作為全球首顆雲端視覺 AI 晶片,QuestCore™提供強大算力,單路攝像頭功耗不到 1W。在真實的應用實戰中,依圖針對算法做了進一步優化,並依託自研AI晶片QuestCore™(求索),僅憑穿著、體態特徵就已經能將ReID精度做到2017~2018年人臉識別的水平。

依圖研發人員表示,這次刷榜只是一次嘗試,依圖在工業界實戰落地的ReID項目,其規模與問題的複雜程度已經遠超三大數據集,可以說,學術界現有ReID基準已經無法體現工業界算法的最高水平。

依圖自研AI晶片QuestCore™加上世界級算法的創新融合,不僅突破了算力和算法的應用瓶頸,同時也為ReID的實戰應用帶來無限想像空間。

在智能城市領域,ReID技術能通過軌跡還原功能,快速篩查可疑人員並進一步鎖定出行區域,進而做到精準預防和打擊。例如,在疫情期間,人員戴口罩或者臉部遮擋的情況下,如何控制傳染源四處流動就成為防控疫情的重要內容。ReID技術依靠行人的整體姿態來做檢索,通過分析行人的穿著和體態,可將排查的時間由數天縮短到數秒,有效助力疫情防控。

應用到智慧園區和交通領域,ReID技術可對於陌生人等可疑人員進行全方位刻畫,有效保障園區安全;在人流密集的超市、園區等大型公共場所,ReID技術能夠幫助實現不慎走失的兒童、老人的迅速查找;在地鐵站、機場等交通樞紐區域,ReID技術可以配合人臉、局部的動作和姿態進行快速識別,大幅提升人員過檢速度。

不難想像,未來該技術還將不斷解鎖在智能城市、智能社區、無人駕駛、智能零售等更多場景和規模下的實戰落地。

世界級ReID算法,加上自研AI晶片,業界期待的下一個計算機視覺領域「殺手級應用」已然到來。

系列公開課預告

(1)

時間:3月30日 晚20:00-21:00

主題:AI技術在智能交通中的三大創新應用復盤

主講者:文安智能副總經理 鄭強

添加微信:ZDmatt ,備註「 AI安防 」,即可進群觀看直播

關鍵字: