自然語言處理(NLP)領(lǐng)域頂級(jí)會(huì)議ACL 2020近日公布論文評(píng)審結(jié)果,阿里巴巴22篇論文入選,并有多篇論文成為高分優(yōu)質(zhì)論文,無論數(shù)量還是質(zhì)量均遙遙領(lǐng)先,顯示阿里在前沿AI研究領(lǐng)域的強(qiáng)大實(shí)力。
ACL是全球自然語言處理領(lǐng)域最具影響力的學(xué)術(shù)機(jī)構(gòu),其組織的年度會(huì)議被公認(rèn)為NLP領(lǐng)域創(chuàng)新的風(fēng)向標(biāo),包括Google、微軟等在內(nèi)的科技企業(yè)每年都會(huì)在ACL大會(huì)上公布多項(xiàng)研究成果,入選論文已經(jīng)成為業(yè)界衡量企業(yè)自然語言處理技術(shù)實(shí)力的重要指標(biāo)。
阿里22篇論文來自達(dá)摩院語言技術(shù)實(shí)驗(yàn)室,螞蟻金服技術(shù)部門,阿里云小蜜算法等團(tuán)隊(duì),其中僅達(dá)摩院語言技術(shù)實(shí)驗(yàn)室就有18篇入選。論文覆蓋跨領(lǐng)域分詞、細(xì)顆粒度情感分析、多領(lǐng)域?qū)υ捪到y(tǒng)、文本生成、知識(shí)蒸餾等諸多NLP領(lǐng)域的熱點(diǎn)和前沿研究方向,提出了包括基于對(duì)抗學(xué)習(xí)的降噪技術(shù)、多領(lǐng)域?qū)υ捫袨榕c文本同步生成、關(guān)系型圖注意力網(wǎng)絡(luò)、利用結(jié)構(gòu)化信息進(jìn)行知識(shí)蒸餾的方法等創(chuàng)新技術(shù)和理念,在觀點(diǎn)識(shí)別、多語言NLP和機(jī)器翻譯等場景中具有很大的應(yīng)用價(jià)值。

阿里不僅入選論文數(shù)量國內(nèi)遙遙領(lǐng)先,論文質(zhì)量也得到評(píng)委一致認(rèn)可。在入選論文之中,有論文提出了創(chuàng)新的框架,結(jié)合新詞發(fā)現(xiàn)和共有詞學(xué)習(xí)技術(shù),利用機(jī)器去自動(dòng)化地標(biāo)注新領(lǐng)域的詞,從而實(shí)現(xiàn)跨領(lǐng)域的分詞學(xué)習(xí);另有論文提出多種創(chuàng)新性的方法,大幅提升單個(gè)算法模型對(duì)30多種語言進(jìn)行智能序列標(biāo)注的效果。這些優(yōu)秀論文得到評(píng)委一致高分認(rèn)同。
在自然語言處理領(lǐng)域,阿里積淀深厚。早在2018年初,阿里AI在機(jī)器閱讀理解頂級(jí)賽事SQuAD中打破世界紀(jì)錄,首次超越人類成績。今年3月,在全球自然語言處理領(lǐng)域頂級(jí)評(píng)測GLUE Benchmark中,阿里巴巴達(dá)摩院以平均分90.3分的成績再次創(chuàng)下自然語言理解技術(shù)新的世界紀(jì)錄。

以達(dá)摩院語言技術(shù)實(shí)驗(yàn)室為代表的阿里自然語言處理技術(shù)已在電商、云計(jì)算、金融科技、協(xié)同辦公、智能客服等商業(yè)生活場景得到廣泛使用。達(dá)摩院語言技術(shù)實(shí)驗(yàn)室負(fù)責(zé)人司羅表示,近年來自然語言智能處理技術(shù)在多模態(tài)融合、融合大規(guī)模預(yù)訓(xùn)練模型的語言理解等方向取得了突飛猛進(jìn)的發(fā)展,未來阿里會(huì)繼續(xù)加強(qiáng)在這個(gè)領(lǐng)域的研發(fā)。