10月26日,第九屆中國智能產業(yè)高峰論壇(CIIS 2019)在西安開幕。本屆峰會以“驅動未來,智能無界”為主題,海內外知名人工智能學者、企業(yè)代表等參與峰會,圍繞人工智能技術創(chuàng)新和在各場景中的應用展開研討。百度首席技術官、ACL/CAAI 會士王海峰出席峰會,并發(fā)表題為《AI大生產平臺推動產業(yè)智能化》的演講,全面介紹百度如何通過探索頂尖AI技術、打造AI大生產平臺,助力產業(yè)智能化發(fā)展。

王海峰介紹,人類經歷的前三次工業(yè)革命中,驅動工業(yè)革命的核心技術都表現出很強的通用性,呈現出標準化、自動化、模塊化的工業(yè)大生產特征。當前,我們正身處以AI為核心驅動力量的新一輪科技革命和產業(yè)革命浪潮之中,AI正將人類社會帶入智能時代。
作為國內投入最早、技術最強、布局最完整的AI領軍企業(yè),百度持續(xù)研發(fā)領先的AI核心技術,并積極建設AI大生產平臺,推動應用落地,促進產業(yè)智能化的發(fā)展。百度人工智能技術多年積累和產業(yè)實踐的集大成——百度大腦,實現了AI能力與應用場景融合創(chuàng)新,已升級為“軟硬一體AI大生產平臺”。
在數據和算力的基礎上,百度大腦“軟硬一體AI大生產平臺”以飛槳深度學習平臺為基礎技術底座,打通了人工智能產業(yè)化應用落地相關的全部流程,包括深度學習平臺、通用AI能力、定制化訓練平臺、部署與集成,以及應用的技術解決方案,同時有完整的AI安全體系保障,實現了AI技術的標準化、自動化、模塊化,推動產業(yè)智能化。

人工智能的發(fā)展離不開算力的支撐。百度大腦的AI計算架構,通過芯片、連接、系統(tǒng)和調度的協(xié)同設計和技術創(chuàng)新,提供百萬TOPS的強大算力,并緊密結合百度飛槳訓練與推理框架,提供面向算法優(yōu)化的極致效率。
芯片是算力層面被關注的焦點。百度自研云端通用AI處理器——百度“昆侖”,針對語音、自然語言處理、圖像等專門進行了優(yōu)化,同等性能下將成本降低了10倍。此外,百度打造了遠場語音交互芯片百度“鴻鵠”,“鴻鵠”芯片按照車規(guī)級標準打造,采用HiFi4自定義指令集,雙核DSP核心,具備超大內存,包含TCM Cache SRAM,而且能耗極低,平均功耗僅100mW,可實現遠場陣列信號的實時處理和高精度低誤報語音喚醒,并集成離線語音識別功能,適配車載語音交互、智能家居等各種場景。
底層的芯片和上層的應用之間,還需要操作系統(tǒng)承接。在智能時代,深度學習框架向下對接硬件、芯片,向上承接各種業(yè)務模型、行業(yè)應用,起到承上啟下的作用,是“智能時代的操作系統(tǒng)”。百度在多年深度學習和人工智能技術的積累和產業(yè)實踐的基礎上,打造了自主可控的飛槳產業(yè)級深度學習開源開放平臺。飛槳平臺核心技術領先,具備開發(fā)便捷的產業(yè)級深度學習框架、超大規(guī)模深度學習模型訓練技術、多端多平臺部署的高性能推理引擎、開源開放覆蓋多領域的產業(yè)級模型庫四大領先技術;飛槳平臺集深度學習訓練和預測框架、模型庫、開發(fā)套件、工具組件和服務平臺等為一體,是功能完備、全面開源開放的產業(yè)級深度學習平臺。王海峰介紹,基于飛槳的EasyDL等服務平臺,企業(yè)和開發(fā)者即使不懂深度學習,也可以訓練出滿足應用需求的模型,加速AI的應用落地。

以飛槳為基礎技術底座,百度大腦的AI核心技術持續(xù)取得創(chuàng)新突破,保持世界領先水平。
語音技術領域,百度大腦的流式多級截斷注意力模型(SMLTA)使識別準確率提升15%-20%。王海峰現場展示了基于SMLTA中英文混合識別能力,這一能力目前已在的百度輸入法上大規(guī)模應用;風格遷移的語音合成技術把聲音中的音色、風格、情感等不同元素解耦分離,獨立組合,靈活控制合成的聲音,只需錄制20句話,就可以制作一個人的專屬聲音。基于此技術,百度上線了全球首個地圖語音定制功能,為用戶帶來了前所未有的個性化體驗。
在視覺技術方面,基于圖像技術、人臉人體技術和視頻分析技術,百度已經形成適用于不同應用場景的技術矩陣,如OCR文字識別、車輛識別、物體識別、風格轉化,以及人臉檢測、人臉對比、駕駛行為檢測、人流量統(tǒng)計等,在機械制造、金融、醫(yī)療、教育等領域得到廣泛的應用。而通過3D和AR的手段,已經實現人臉、手勢、環(huán)境、肢體多維度的技術突破,可用于一體化人機交互等創(chuàng)新應用。
綜合應用語音和視覺技術,機器可以自動合成虛擬形象。百度大腦的虛擬形象合成技術,首先對語音信號和視頻信號進行識別與理解,再通過唇動生成,以及語音、面部和肢體的合成,合成一個虛擬形象。
在語言與知識技術方面,百度建立了完整的、包含知識圖譜、語言理解、語言生成等在內的語言和知識技術布局,全面支持搜索、問答、對話等百度產品,同時開放賦能,支持各行業(yè)的創(chuàng)新應用。百度構建了世界上最大的多元異構知識圖譜,在能夠滿足90%用戶需求的實體圖譜的基礎上,針對不同的應用場景和知識形態(tài)建立起關注點圖譜、行業(yè)知識圖譜、POI圖譜、事件圖譜等多種知識圖譜。
自然語言處理技術也在持續(xù)創(chuàng)新突破。百度結合知識和語義理解打造的可持續(xù)學習的知識增強語義理解框架ERNIE,通過建模海量數據中的實體概念等先驗知識,學習真實世界的語義關系。這種融合知識的語義建模大幅增強了模型的語義表示能力,在共計16個中英文自然語言處理任務上效果超越了谷歌BERT和XLNet;在機器同聲傳譯方面,百度首創(chuàng)感知上下文的機器同傳模型,可以實現端到端實時同聲傳譯,翻譯準確率和時延與人類水平相當。百度構建的面向任務的理解與交互技術,現在已經積累了6.8萬個定制技能、累計交互570億次,在車載交互、地圖導航、智能音箱、政務咨詢等諸多場景中得到廣泛應用。
隨著AI技術的產業(yè)化應用不斷深入,AI安全也受到越來越多的重視。百度大腦打造了完整的AI安全體系,從基礎的開源技術矩陣、開放行業(yè)解決方案的平臺,到與學術界、企業(yè)、政府、機構等多層面的開放協(xié)作,為AI技術的產業(yè)應用保駕護航。
以百度大腦為核心,以飛槳為基礎底座,依托百度智能云,百度大腦AI大生產平臺為各行各業(yè)的智能化轉型升級提供了強有力支撐。例如,百度聯(lián)合浦發(fā)銀行推出了金融領域首個“數字”員工小浦,憑借專業(yè)的金融知識、對用戶需求的深刻理解,為客戶帶來全新的服務;百度的AI質檢技術應用于工廠的質檢車間,幫助人員成本節(jié)省90%,占地面積減少80%,將漏檢率從0.5%-1%降低到0.1%以內;為重慶氣象局打造的智能預報預測系統(tǒng),可以覆蓋短臨、短期和氣候預測,大幅提升氣候預報的準確率、縮短氣象預警信息的發(fā)布時間。
目前,百度大腦AI大生產平臺已開放216項核心AI能力,日調用量突破1萬億次,開發(fā)者超過150萬,企業(yè)用戶發(fā)布模型超過16.9萬個。

在峰會活動中,王海峰還參加了以“人工智能如何打破大規(guī)模產業(yè)化的瓶頸”為主題的尖峰對話。他以翻譯為例,介紹了人工智能的發(fā)展歷程,人工智能在當下科技變革和產業(yè)革命過程中的重要作用,以及百度在推動產業(yè)智能化面取得的成就。

談及人工智能的未來,王海峰表示,人工智能已經具備工業(yè)大生產特征,將會開始廣泛的大規(guī)模應用,整個產業(yè)乃至整個社會都將從中受益。