近日,世界最權威的人臉檢測公開評測集WIDER FACE公布最新評測結果,滴滴AI Labs團隊聯合北京郵電大學PRIS團隊提出的人臉檢測DFS算法,在WIDER FACE的Easy、Medium和Hard三個評測子集的六項評估結果中, 超過了國內外眾多科技公司和高校院所,取得了五項第一、一項第二的好成績,充分彰顯了滴滴在人臉檢測領域的創新能力。
WIDER FACE是目前業界公開的數據規模最大、檢測難度最高的人臉檢測數據集之一,由香港中文大學于2016年建立,共包含32,203張圖像和393,703個人臉標注。其中40%的數據為訓練集(Training),10%的數據為驗證集(Validation),50%的數據為測試集(Testing)。每個集合中的數據根據人臉檢測的難易程度分為“Easy”、“Medium”、“Hard”。
由于匯集了人臉尺寸大小變化、拍照角度引起的人臉姿態變化、不同程度的人臉遮擋、表情變化、光照強弱差異以及化妝等多種影響因素,該數據集在全球人臉檢測領域極具挑戰性,每次評測均會吸引多家國內外科技巨頭及高校院所(包含卡耐基梅隆大學、加州大學圣地亞哥分校、北航、浙大、京東、騰訊優圖、百度、華為云、IBM沃森研究院等)在這個數據集上驗證了自己的算法效果。
最新評測結果顯示, AI Labs團隊提出的DFS算法在WIDER FACE人臉檢測平臺中,在官方驗證集和測試集的六項評估結果中取得五項第一、一項第二。其中在“Easy”、“Medium”和“Hard”三個測試子集中,DFS算法性能分別達到96.3% AP,95.4% AP,90.7% AP。


*圖文來源:http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html
DFS算法以卷積神經網絡中的特征融合為切入點,為了防止高層特征圖上的語義信息覆蓋低層特征圖上的細節信息,提出了特征融合金字塔(Feature Fusion Pyramid)結構,其以空間和通道注意力機制的方式融合高低層特征,在不失細節信息的同時將語義信息作為上下文線索(contextual cues)增強低層特征;另外,DFS算法提出了一種輔助訓練單階段檢測器的語義分割分支(Semantic Segmentation branch),促使檢測網絡以一種自監督的方式實現注意力機制以及學到更好的特征。具體地說,DFS算法獨特的語義分割分支分層地利用更強的語義分割監督信息監督訓練網絡,使得用于預測人臉的各級特征圖專注于各自最適宜檢測到的不同尺寸的人臉。

目前人臉檢測和識別技術已經在滴滴平臺廣泛使用,用于司機人不符檢測、行程中車內錄像時的乘客隱私保護等場景,并已形成成熟的技術解決方案,幫助外部合作伙伴進一步提高效率。
實際上,滴滴已經多次在圖像視頻領域相關競賽或評測中獲得世界級第一。在去年7月的CVPR 2018 WAD自動駕駛挑戰賽中,攬獲了二、三、四名的好成績;而在去年9月ECCV2018 COCO&Mapillary挑戰賽中,滴滴技術團隊首次參賽即獲得Mapillary街景檢測單項世界第一。
此次人臉檢測技術再破世界紀錄,也充分體現了滴滴在計算機視覺領域強大技術實力,滴滴將持續進行更多探索,不斷優化出行交通感知理解、智能交互等技術,用先進的AI技術提升用戶體驗、助力行業轉型升級,進而構建智能出行新生態。
引用:
[1]WIDER FACE:http://shuoyang1213.me/WIDERFACE/
[2]DFS算法:Learning Better Features for Face Detection with Feature Fusion andSegmentation Supervision https://arxiv.org/abs/1811.08557#