
3月16日,百度于北京總部召開新聞發布會,主題圍繞新一代大語言模型、生成式AI產品文心一言。百度創始人、董事長兼首席執行官李彥宏現場展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。官方表示,文心一言大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調
用數據,以及5500億事實的知識圖譜等,這讓百度在中文語言的處理上,能夠處于獨一無二的位置。作為革新生產力工具,文心一言某種程度上具有了對人類意圖的理解能力,回答的準確性、邏輯性、流暢性都逐漸接近人類水平。
引發搜索引擎革命,百度的“背水一戰”
從人工智能風潮發展起來,百度便全身心投入到人工智能業務的發展中來,在百度文心一言發布前夕來看,百度更是將“用科技讓復雜的世界簡單”作為自己的使命,也確實取得了一系列的成果。
從去年開始,元宇宙、數字人、AIGC等關鍵詞基本可以囊括百度近期所有動作,無論是語言大模型、自動駕駛,還是Web3.0技術產品(百度希壤、百度曦靈數字人平臺等),也可以看到,更多的是百度在不斷追逐熱點,尋找業務增量的過程。
然而,在速途元宇宙研究院看來,“文心一言”對于百度而言,在開拓的同時,讓人們看到了更多的“守”的意味。
不得不承認的是,ChatGPT的出現,這種生成式AI大模型,不僅顛覆了人們對于AI語言表達能力的認知,同時也顛覆了人們信息檢索的效率。
相比傳統的AI聊天工具或AI語音助手,ChatGPT雖然仍存在一些因AI錯誤理解而導致的瑕疵,不僅擁有遠超現階段語言類AI流暢的表達能力,能夠模擬真人來聊天交流,且擁有邏輯清晰的總結能力,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼等任務。
從顯示信息到直接生成結果,有業內人士評價“ChatGPT 可能是這個時代做出的第一次接近 AGI (Artificial general intelligence,通用人工智能) 的產品。”
而搜索引擎,正是生成式AI首當其沖的對象。目前國內外搜索引擎經過多年發展,雖然技術屢經迭代,不斷改進搜索算法如何去更好的排序、更好的給用戶展現想要的結果,但表現形式仍然處在傳統的鏈接形式。而ChatGPT的出現,給用戶提供了更為“簡單粗暴”的搜索結果,從效率的角度出發,用戶顯然會更容易接受更直接的搜索結果。
掌握了生成式AI的高地,或將完全改變搜索市場的格局。企業對生成式AI的需求不斷增長,市場空間進一步抬高,AI市場爆發性的需求增長,將釋放出前所未有的、指數級的商業價值。即使是人們曾經認為會“顛覆千行百業”的AI,事實上目前還沒有完全地顛覆一些行業,而是將AI技術的基因融入各行各業,重構行業的效率。
面對OpenAI的“鯰魚效應”,所以在眾多想要投身到生成式AI研發的企業中,以搜索引擎為重要流量入口的企業,自然成為最全力投入、也是最迫不及待推出生成式AI模型的企業。
作為OpenAI的投資方,微軟直接將GPT的能力整合進了Bing搜索引擎中,近日,微軟還宣布將ChatGPT背后的技術整合到其Power Platform平臺上,允許用戶在幾乎不需要編碼的情況下,就能開發自己的應用程序。
當前,全球多家大型科技公司,均爭相將“生成式人工智能”整合到他們的產品中。
今年2月初,谷歌在演示類ChatGPT的AI聊天機器人產品—— Bard時,錯誤地把另一個望遠鏡取得的成就安給了前者,這一錯誤致使谷歌母公司Alphabet當日股價盤后大跌7.4%,市值蒸發了1056億美元(折合7172億元人民幣)。
而百度似乎吸取了谷歌的教訓,在Demo演示環節,采用了提前錄制好的視頻,更多注重于能力的演示。不僅如此,百度還在開放方面則采取了內測在先的方式,公布了文心一言的邀請測試方案:3月16日起,首批用戶可通過邀請測試碼,在文心一言官網體驗產品,吸收足夠多內測伙伴的反饋,并完善產品之后,再將其推向市場。
文心一言將是百度的重要拐點
回顧百度的發展,1999年,看到中文搜索引擎服務的巨大發展潛力的李彥宏從美國硅谷辭職回國,懷揣著“科技改變人們的生活”的理想在次年創立了百度,幫助中國互聯網打造了先進的搜索引擎,也改變了國人查找信息的方式。行業報告顯示,2022年上半年,百度仍以75.54%的市場占有率,牢牢坐穩中國搜索引擎的頭把交椅。
憑借著優勢的市場地位,搜索引擎不僅成為了百度重要的流量入口,也是其互聯網業務發展的根基。根據百度近期發布的2022第四季度及全年財報顯示,百度移動生態流量強勁,依然是貢獻經營利潤和現金流的重要來源,第四季度百度移動端搜索查詢次數和信息流分發量繼續實現同比兩位數的增長。
就如同前文所提到,生成式AI的到來,將重塑搜索引擎市場的格局。如果文心一言為百度取得成功,將會進一步提升百度在中國搜索引擎市場的占有率,會給互聯網業務帶來更多的流量,為移動生態的發展注入更多動能。
同時,作為承載人工智能的重要技術設施,百度智能云的相關業務也將因此受益。基于生成式AI帶來的增長,也會引爆服務器算力需求,作為最早在云上布局AI能力廠商之一,也將進一步促進百度智能云的市場份額。
而從企業的屬性上,生成式AI的成功開發,將強化百度的“人工智能”屬性,并優化百度的收入結構,降低作為傳統的互聯網企業廣告流量為主的營收占比,提高科技相關、尤其是人工智能領域相關的營收占比。
可見,對于站在人工智能“浪潮之巔”的百度而言,文心一言“成則前途無量,敗則元氣大傷”。甚至在這場為文心一言獨立召開的發布會上,李彥宏除了發布重磅產品的自豪之外,語氣中還多了幾分對于新產品的期待與謹慎,其重要性不言而喻。
中外生成式AI的對抗
就在文心一言發布的前一日(3月15日),OpenAI發布了多模態預訓練大模型GPT-4。作為目前生成式AI模型的標桿,搶在文心一言之前發布,行業內紛紛開始討論“壓力是否來到了百度這邊”。
在發布會上,李彥宏表示,“文心一言不是中美科技對抗的工具,而是一代代百度技術人員追逐科技改變世界的夢想的產物,是創新驅動發展的最佳證明”。雖然科技巨頭之所以能夠走在創新的前列,更多是企業在技術理解與演進上的“各顯神通”,但在文心一言與GPT-4的產品演示細節來看,我們仍然能夠看到兩家AI巨頭在打造產品的理念上不同。
在新的GPT-4上,產品不僅擁有了更高的回答準確率,同時能夠生成歌詞、創意文本并實現風格變化,但最大的升級顯然是增加了強大的“識圖”能力,允許用戶指定任何視覺或語言任務,例如分析一張圖片的“笑點”與“梗”。
速途元宇宙研究院已經在發布當日收到了“文心一言”的內測資格。在測試的過程中,文心一言能夠識別語言的內容,并能夠給出具有一定創作力的回答。
即使面對中文語序中出現的倒裝,缺乏量詞,也擁有一定的識別能力。
速途元宇宙研究院也嘗試了李彥宏在現場DEMO中演示的問題,而文心一言的回答與演示的回答并不盡相同,可見文心一言的內容是利用AI大模型真真正正“生成”出來的。
在文學創作、商業文案、數理推算、中文理解和多模態生成之外,百度文心一言的優勢在于不僅能夠生成文字,還融合了百度在AI領域的其他能力,例如文心一格的圖片創作能力、以及根據文案自動生成視頻的能力,能夠生成圖文并茂的內容。
不過,李彥宏也坦承,文心一言對英文的理解和處理能力現在還沒有中文這么好。部分原因是因為在訓練數據樣本還不夠大。
可見,GPT的團隊,更像是“從0開始開發AI”,但不可否認的是,從文字、到識圖,下一步可能就是視頻,團隊在不斷提高GPT模型的感知維度,而且進步神速。而相比于OpenAI想要做一個真正可以交互的“機器人”,百度則似乎更傾向于將其工具化,通過服務于產業發揮更大的價值。
據了解,現階段OpenAI的主要收入,仍然多數來自于微軟等企業的投資,2019年-2023年,微軟先后宣布投資OpenAI累計約130億美元。據國盛證券報告《ChatGPT需要多少算力》估算,GPT-3訓練一次的成本約為140萬美元,對于一些更大的LLM(大型語言模型),訓練成本介于200萬美元至1200萬美元之間。以ChatGPT在1月的獨立訪客平均數1300萬計算,其對應芯片需求為3萬多片英偉達A100 GPU,初始投入成本約為8億美元,每日電費在5萬美元左右。與巨大成本成為鮮明對比的是,業內人士估計,OpenAI今年營收僅約為2億美元。
不可否認的是,對于OpenAI這種幾乎沒有營收壓力的公司來說,自然可以選擇更為純粹的研發路線。然而對于百度而言,不僅要推動人工智能技術的創新的同時,還要兼顧AI技術對于企業帶來的“造血能力”,而如何將文心一言的能力實現商業化變現,對于百度而言同樣也將是一個重要的挑戰。
就目前而言,文心一言仍然是最有可能在國內開展商業落地的模型。
一方面,從技術來看,如今百度是全球為數不多、在這四層進行全棧布局的人工智能公司,從高端芯片昆侖芯,到飛槳深度學習框架,再到文心預訓練大模型,到搜索、智能云、自動駕駛、小度等應用,各個層面都有領先業界的自研技術。文心一言基于百度2016年開源出首個國產深度學習框架PaddlePaddle(飛槳),也是國內至今唯一能與國際兩大主流框架TensorFlow和PyTorch同水平的深度學習框架,擁有充分的技術自主性。
另一方面,從數據安全角度出發,作為中國企業的百度,在吸引國內企業合作中,也能夠避免一些合規性的問題。
從文心一言內測版的體驗來看,在語言模型的訓練上,雖然在生成的準確性方面,仍然有進步的空間,但在語言表達能力上已經媲美了目前頂尖的生成式AI大模型,也看到了將AI作畫與文字相結合的新形態。
在速途元宇宙研究院認為,“文心一言”雖然不是一款全面超越的生成式AI產品,但它在部分能力的表達上,能夠看出百度所沉淀的技術能力與創新實力。
就如同發布會上所言,自2月份百度官宣“文心一言”以來,已有超過650家企業宣布接入文心一言生態。其中,速途網宣布成為百度文心一言(英文名:ERNIE Bot)首批生態合作伙伴。后續,速途網將全面體驗并接入文心一言的能力。此舉標志著速途網優先獲得領先AI技術的加持,也標志著對話式語言模型技術在國內新媒體場景的首次著陸。
未來,速途元宇宙研究院將在第一時間上線文心一言的評測,屆時我們將更加詳細地剖析國內首個生成式AI的全貌。










