
如果說哪條大模型核心理論影響最為深遠,那么“Scaling Law”必然位列其中。
所謂“Scaling Law”,是指在深度學習中,增大數據量和模型參數能讓模型性能指標提升,這種提升并非線性,而是遵循一種冪律關系。而OpenAI的GPT系列模型,無疑是這一理論最著名的成果展現。
但讓很多人意想不到的事,這個讓OpenAI “大力出奇跡”創造出GPT而一鳴驚人的理論,最早的研究起源其實是一家中國企業。

上個月,OpenAI論文的合著者、前OpenAI研究副總裁、Anthropic創始人Dario Amodei在一檔播客中提及,2014年他與吳恩達在百度研究AI時,就已經發現了模型發展規律Scaling Law這一現象,直到OpenAI在 2020年的Scaling Law研究中引用了百度研究人員2019年發表的論文,這個理論才真正被行業所熟知。

此外,Meta研究員、康奈爾大學博士候選人Jack Morris在社交媒體X上引用了一篇標題為《Deep Learning Scaling is Predictable, Empirically》論文,該論文展示了在機器翻譯、語言建模、圖像處理和語音識別等四個領域中,隨著訓練集規模的增長,DL 泛化誤差和模型大小呈現出冪律增長(scaling)模式,與如今的“Scaling Law”理論如出一轍。
可見,正是百度的早期研究,為AI大模型的發展奠定了理論基礎。
AI賽道上,中國企業并不落后
2023年,ChatGPT的問世使大模型成為人工智能行業的焦點。雖然OpenAI在行業中引領風潮,但后來者憑借規模與技術實力的積累,迅速呈現出百花齊放的狀態,海外企業如谷歌、Meta、Anthropic等企業,紛紛推出能力不亞于GPT-4的模型序列。
中國科技企業更是以驚人的速度奮起直追。百度、阿里等國內巨頭的大模型開始大規模落地,走進千行百業。僅百度文心大模型,日均調用量便已超15億,自去年12月首次披露以來增長30倍。同時基于頭部企業提供的基礎模型能力,國內大模型應用生態已經初具規模。

盡管美國在AI模型創新方面一直被視為領先者,但最新討論顯示,中國在探索一些AI領域概念方面,比美國更為超前。
早在“大模型”技術爆發前,百度便已進行技術儲備。2019年3月,百度發布文心大模型1.0版本,并緊隨GPT迭代速度進行迭代,在2023年3月迅速推出文心大模型3.5,成為國內首家推出大模型產品的大廠,同年10月進一步發布文心大模型4.0版本,實現大模型核心能力的全面提升。據悉,百度還將在2025年初推出文心大模型全新版本。
隨著AI全面深入多模態領域,百度創始人李彥宏在百度世界2024上首發圖像檢索增強iRAG技術,用以減輕圖像生成中的幻覺問題,讓多模態技術可以更好落地產業。
在智能體方面,百度亦是業內最早布局的大廠之一,2023年9月上線“靈境矩陣” (文心智能體平臺前身)。相比之下,谷歌、Meta等海外企業在2024年才正式發力智能體,而據OpenAI CEO山姆·奧特曼推文透露,其智能體產品需等到2025年才會正式發布。
掌握一定先發優勢,也讓國內的大模型生態能夠先美國一步走進產業。截至2024年11月,百度文心智能體平臺吸引了超過80萬開發者和15萬家企業入駐,覆蓋教育、娛樂、零售、制造等多個行業領域。
中國也是全球AI的黃埔軍校
在全球頂尖AI企業與科學家群體中,華人已成為一股不可忽視的力量。
以OpenAI為例,其早期團隊中有9名華人,占團隊總人數的10%。其中,5人本科畢業于中國高校,另外3人則在美國高校完成本科教育。更廣為人知的“AI教母”李飛飛,亦是華人出身,作為“空間智能”理論的奠基者,她的研究在全球范圍內樹立了標桿。
值得一提的是,如今在國際頂級AI機構中擔任核心職位的諸多領軍人物,很多都曾在中國企業積累了寶貴的研發經驗。例如,2014年吳恩達加入百度擔任首席科學家,主導了“百度大腦”計劃的開發。在他的邀請下, Dario Amodei斯坦福博士后畢業后,加入到了百度硅谷AI實驗室,隨后又招募了Jim Fan來百度實習。如今,Dario Amodei成為Anthropic的創始人兼首席執行官,而Jim Fan則是英偉達AI領域的核心人物。

這些從中國企業走向國際舞臺的頂尖人才,不僅展現了個人的卓越能力,也將中國企業在AI領域的深刻理解與實踐成果傳遞到全球。在這些AI頂尖人才身上,既凝聚了中國高校與企業的培養底蘊,也彰顯了中國作為全球AI“黃埔軍校”的重要地位。
自主可控的“母語”大模型
從產業格局看,為14億中國用戶量身定制、打造符合中國語言習慣的“母語AI”,既是中國AI企業的優勢所在,也是不可或缺的戰略目標。
早在2024年3月,百度李彥宏就公開表示,“文心大模型4.0在中文處理上明顯超過GPT-4”,這得益于豐富的中文語料訓練,以及深諳中文表達的本土工程師的精細調試。不僅如此,阿里通義、字節豆包、訊飛星火等國產大模型同樣實現了在中文語境中的超越,為中國用戶和產業提供了高質量的人工智能服務。

更為重要的是,中國產業對“接地氣”的國產大模型有著巨大的需求。這些大模型能夠更加“近水樓臺”地接觸到產業的多樣化需求,并以更高效的方式提供定制化解決方案。在實際應用場景中,中國企業正積極將AI技術擴展至制造業、醫療、教育等領域。這種緊密結合實際需求的模式,使國產大模型在落地效果上具備顯著優勢。
與此同時,全球AI競爭格局的演變,進一步凸顯了自主可控的重要性。近日,特朗普提議設立人工智能部長,并將AI技術提升到國防戰略層面,直接引發了新一輪的“AI軍備競賽”。這讓業界清醒地認識到,只有構建自主可控的大模型生態,將關鍵技術牢牢掌握在自己手中,才能避免在國際競爭中被“卡脖子”。
從“Scaling Law”背后的深厚積累,到國產大模型引領中文語境的突破,中國企業已經從“追隨者”逐步邁向“領跑者”的角色,在技術研發、理論創新和產業落地的多維度競爭中,中國AI企業展現出了極強的適應性與開拓力,在全球AI領域的影響力也與日俱增。
相信在諸多國內領軍企業的推動下,中國AI生態也必將越來越完善,為全球人工智能產業貢獻更多“中國智慧”。