5月20日,由深度學習技術與應用國家工程研究中心主辦、飛槳承辦的WAVE SUMMIT 2022深度學習開發者峰會在線上舉辦。百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜發布飛槳文心最新全景圖,提出支撐大模型產業落地的3個關鍵路徑,并在業內首發行業大模型。

(百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜)
大模型助力普惠AI 三大關鍵落地路徑發布
近年來,深度學習作為人工智能時代的通用型基礎技術,推動了工業革命進入爆發式增長期。百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰在演講中表示,人工智能越來越普惠,賦能千行百業,惠及千家萬戶。
AI大模型進一步增強了AI技術的通用性,也讓廣大開發者可以更低成本、低門檻,面向場景研發更好用的AI模型,助力普惠AI。百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜表示,今年是大模型產業落地的關鍵年。她指出,大模型技術與真實場景需求的有效匹配是落地要解決的關鍵問題,并給出支撐大模型產業落地的3個關鍵路徑:建設更適配場景需求的大模型體系,提供全流程支持應用落地的工具和方法,營造激發創新的開放生態。

基于產業實踐大模型落地的關鍵解法,飛槳文心全景圖全面升級。在模型層,一次性發布10個大模型,形成了涵蓋基礎大模型、任務大模型、行業大模型的三級體系,全面滿足產業應用需求;配套工具與平臺層,發布大模型開發套件、API和內置了文心大模型能力的EasyDL和BML開發平臺,全方位降低應用門檻;共創共享飛槳生態,同時建設大模型創意和探索社區旸谷,讓更多人零距離接觸到最先進的AI大模型技術,激發創新與創意。
文心大模型迎來十大新成員 業界首發行業大模型
本次峰會上,吳甜帶來了文心大模型發布以來的最大一次升級,其中最值得關注的是,業界首發的文心·行業大模型。

文心·行業大模型基于通用數據訓練的文心大模型,加上行業應用場景中大量存在著行業特有的大數據和知識,結合行業相關的創新算法設計,將進一步提升大模型對行業應用的適配性。吳甜介紹,在能源電力和金融領域,文心聯合國家電網研發了知識增強的能源行業NLP大模型國網-百度·文心,聯合浦發銀行研發了知識增強的金融行業NLP大模型浦發-百度·文心,目前已在電力、金融相關任務上取得顯著的效果提升。
國家電網有限公司數字化工作部人工智能工作負責人蔣煒博士表示,作為中央企業數字化轉型的排頭兵,國家電網公司聯合百度公司共同打造行業級人工智能基礎設施,探索研發電力人工智能聯合大模型,不僅提升了傳統電力專用模型的精度,而且大幅降低了研發門檻,實現了算力、數據、技術等資源的統籌優化。下一步,國家電網公司將繼續深化雙方技術合作,推動人工智能大模型在電力領域的技術攻關及應用探索,面向更典型的電力業務場景,構建更具電力特色的人工智能大模型。
上海浦東發展銀行總行信息科技部副總經理萬化表示,浦發銀行與百度在AI的多個方面實現優勢互補,聯合研發了面向金融行業的大模型「浦發-百度·文心」,并且已在金融行業各類智能場景進行驗證。未來,浦發銀行將與百度繼續深入合作,在現有金融行業大模型的基礎上不斷迭代,持續地降低金融AI應用落地的門檻。
除行業大模型外,此次還發布文心基礎大模型和任務大模型共八個,包括:融合任務相關知識的千億大模型ERNIE 3.0 Zeus,多任務視覺表征學習VIMER-UFO 2.0、商品圖文搜索表征學習VIMER-UMS、文檔圖像表征學習VIMER-StrucTexT 2.0,語音-語言跨模態大模型ERNIE-SAT、地理-語言跨模態大模型ERNIE-GeoL,以及面向生物計算領域的化合物表征學習HELIX-GEM和蛋白質結構分析HELIX-Fold。
以基礎NLP大模型為例,ERNIE家族增添新成員,融合任務相關知識的千億大模型ERNIE 3.0 Zeus全新發布,在學習海量數據和知識的基礎上,進一步學習百余種不同形式的任務知識,增強了模型的效果;通過融合層次化提示的預訓練,更好地建模不同任務的共性與特性;再通過將不同的任務組織成統一的自然語言形式,統一建模增強模型的泛化能力。相對其他模型,ERNIE 3.0 Zeus在各類NLP任務上表現出了更強的零樣本和小樣本學習能力。
飛槳全面支撐文心大模型生產及應用
文心大模型作為“產業級知識增強”大模型,在飛槳訓練推理一體化技術的有力支撐下,實現了高效生產并真正為產業所用。飛槳作為我國首個自主研發、功能豐富、開源開放的產業級深度學習平臺,在訓練層面自主研發了端到端自適應分布式架構,既包含了并行訓練策略的創新,也包含針對異構硬件的自適應并行訓練支持,打造了框架與算力、算法相結合三位一體的大模型訓練解決方案,實現了端到端的極致性能優化;在推理層面,飛槳推出了針對大模型的壓縮、推理、服務化全流程部署方案,擁有業內領先性能,并已支撐自然語言理解、對話、跨模態生成等各類大模型的在線應用。
為了讓開發者更加方便、快速地使用文心大模型,飛槳發布了一系列大模型開發套件、大模型API和集成文心大模型的飛槳企業版EasyDL和BML開發平臺,面向不同類型的開發者,全面釋放大模型的使用效能,進一步降低應用門檻。目前,EasyDL和BML平臺已有累計超過1萬名開發者基于文心大模型開發,創建了超過3萬個任務,并應用到輸電通路巡檢、零部件瑕疵檢測、農業病蟲害識別、新聞資訊創作等大量場景中。

此外,文心大模型將共創飛槳生態,并通過全新推出的基于文心大模型的創意社區——文心·旸谷社區,讓更多用戶零距離感受到文心大模型的魅力和應用創新潛力,迸發出更多富有想象力的新事物。
目前飛槳已構建了業內布局最全、最適宜產業應用的模型庫體系,大模型作為人工智能 “基礎設施”的一部分,進一步拓寬了人工智能技術落地的場景覆蓋廣度,更加深了產業應用的深度。文心大模型將持續降低應用門檻,推動產業智能化升級,讓人工智能技術惠及每一個人。