近期,國際計算機視覺大會(ICCV)官方網站陸續公布了ICCV2021計算機視覺挑戰賽成績,來自螞蟻保險科技的選手摘得“遮擋視頻實例分割”挑戰賽的第一名。名列前茅的還有美國卡耐基梅隆大學和德國亞琛工業大學等先進研究機構。
ICCV由IEEE(電氣與電子工程師協會)主辦,與計算機視覺模式識別會議(CVPR)和歐洲計算機視覺會議(ECCV)并稱為計算機視覺方向的三大頂級會議。
ICCV2021遮擋視頻實例分割挑戰賽,既Occluded Video InstanceSegmentation(簡稱OVIS)競賽。OVIS主要特點是視頻里存在大量多種多樣物體之間的遮擋,要求算法能檢測、分割、跟蹤視頻里所有的物體。

實例分割是計算機視覺中的基礎問題之一。目前,靜態圖像中的實例分割業界已經進行了很多的研究,但是對(遮擋)視頻的實例分割的研究相對較少。而真實世界中的攝像頭所接收的,無論是自動駕駛背景下車輛實時感知的周圍場景,網絡媒體中的長短視頻,還是智能理賠流程中的憑證識別,大多數都是視頻流信息而非純圖像信息。因而研究視頻理解的模型有著十分重要的意義。基于視頻級別的實例分割技術相比圖像級別,其優點在于可以充分利用物體跨幀的連續性和時態上下文線索,但同時也對計算資源提出更高要求。
視頻實例分割是2019年由業內學者提出的新任務,自提出起便得到了Facebook、字節跳動、騰訊等國內外公司的關注,目前該領域還處于發展初級階段。
該技術在視頻流中的理賠憑證理解、電商險理賠商品識別,視頻面訪,寵物身份識別等保險場景中起到作用。螞蟻保險推出的智能理賠服務可以利用該技術處理上述復雜場景。
目前,視頻實例分割技術已經應用于螞蟻保險的智能理賠場景中,大大提升理賠效率和準確率。例如,利用該技術可以更便捷的識別視頻流中的理賠憑證,從一摞紙中把最上面的憑證主體切割提取出來(圖1)。
此外,以寵物險為例,除了利用鼻紋識別技術識別寵物之外,如下面視頻中的四張圖(圖2)所示,算法模型可以將相互遮擋的三只貓體準確分割,從而進行就更精準的動物身份識別。
同時,該技術未來在企業貸款的憑證上傳,自動駕駛的場景理解,短視頻或直播中的人物背景分離等應用場景也會有廣泛的應用價值。

圖1:理賠憑證切割

圖2:遮擋寵物分割