
人工智能大模型是指使用海量數(shù)據(jù)和強(qiáng)大計(jì)算力訓(xùn)練出來(lái)的具有強(qiáng)大泛化能力和生成能力的人工智能模型。大模型的出現(xiàn),一舉打破了數(shù)據(jù)資源有限、算力投資難度大、模型泛化能力差、高水平人才稀缺的發(fā)展瓶頸,重新點(diǎn)燃了行業(yè)對(duì)于人工智能技術(shù)應(yīng)用的興趣。
今年以來(lái),大模型如雨后春筍般涌現(xiàn), “百模大戰(zhàn)”的行業(yè)競(jìng)爭(zhēng)格局正在形成,每家大模型企業(yè)一方面不斷探索著大模型能力的邊界,同時(shí)也在尋找大模型與實(shí)體產(chǎn)業(yè)結(jié)合的觸點(diǎn)。
例如,自然語(yǔ)言處理和語(yǔ)義理解的能力大模型在醫(yī)療健康領(lǐng)域可以用于疾病診斷和個(gè)性化治療;數(shù)據(jù)分析和預(yù)測(cè)的能力能夠用于數(shù)字零售;智能決策和優(yōu)化的能力能夠在智能交通等領(lǐng)域大放異彩。
今天,國(guó)際數(shù)據(jù)公司(IDC)正式發(fā)布《AI大模型技術(shù)能力評(píng)估報(bào)告2023》(后簡(jiǎn)稱《報(bào)告》)中,圍繞大模型市場(chǎng)發(fā)展前景、行業(yè)應(yīng)用、技術(shù)趨勢(shì)、產(chǎn)品能力、成本情況和優(yōu)缺點(diǎn),全面剖析AI大模型的發(fā)展情況。
大模型之家注意到,此前,行業(yè)內(nèi)仍缺少統(tǒng)一的大模型評(píng)估標(biāo)準(zhǔn),大多數(shù)企業(yè)依舊在拼參數(shù)量級(jí),通過(guò)更大的參數(shù)量來(lái)提升模型的準(zhǔn)確度。然而,隨著大模型的數(shù)據(jù)量級(jí)達(dá)到萬(wàn)億規(guī)模,數(shù)據(jù)的多少和模型的性能收益之間容易出現(xiàn)邊際效應(yīng)遞減的現(xiàn)象,為大模型的應(yīng)用部署帶來(lái)了挑戰(zhàn)。
為此, IDC在報(bào)告中提出了一套技術(shù)評(píng)估標(biāo)準(zhǔn),重點(diǎn)評(píng)估AI大模型代表廠商的技術(shù)和商業(yè)能力,從這份評(píng)估結(jié)果中,我們不僅可以看到各家企業(yè)的大模型產(chǎn)品技術(shù)的深度,還可以看到大模型與行業(yè)深度融合的廣度。
無(wú)愧大模型國(guó)家隊(duì)隊(duì)長(zhǎng),百度文心綜合評(píng)分第一
據(jù)了解,IDC在《報(bào)告》中,重點(diǎn)調(diào)研了百度、阿里巴巴、科大訊飛、第四范式、瀾舟科技、云從科技、智譜AI、中國(guó)電信智科以及中科聞歌9家中國(guó)市場(chǎng)主流大模型技術(shù)廠商,此外還包括360、minimax、華為、商湯、騰訊等。
通過(guò)將大模型評(píng)估標(biāo)準(zhǔn)分為產(chǎn)品技術(shù)、服務(wù)生態(tài)以及行業(yè)應(yīng)用三層指標(biāo),對(duì)每一層的能力進(jìn)行測(cè)評(píng),主要考察指標(biāo)為算法模型、通用能力、創(chuàng)新能力、平臺(tái)能力、安全可解釋、大模型的應(yīng)用行業(yè)以及配套服務(wù)和大模型生態(tài)等指標(biāo)。每項(xiàng)指標(biāo)最高5分,得分越高代表實(shí)力越強(qiáng)。

從評(píng)估數(shù)據(jù)可以看到,這9家企業(yè)所推出的大模型,能力上各有千秋。其中,百度旗下的文心大模型在綜合成績(jī)上位列《報(bào)告》評(píng)估的國(guó)內(nèi)大模型之首。
值得注意的是,百度文心大模型在算法模型、通用能力、創(chuàng)新能力、平臺(tái)能力、生態(tài)合作能力以及行業(yè)覆蓋7大指標(biāo)中表現(xiàn)突出,均取得了最高的評(píng)級(jí)。其中,算法模型、行業(yè)覆蓋兩項(xiàng)指標(biāo),更是本次參加評(píng)估的大模型中,唯一取得滿分的大模型。七項(xiàng)滿分、三個(gè)絕對(duì)第一,體現(xiàn)了百度文心大模型的基礎(chǔ)技術(shù)深度和產(chǎn)業(yè)應(yīng)用覆蓋廣度。
在衡量生成式AI最底層的技術(shù)基礎(chǔ)的產(chǎn)品分?jǐn)?shù)上,憑借著國(guó)內(nèi)唯一滿分的“算法模型”優(yōu)勢(shì),百度文心大模型展示了其在模型能力上的技術(shù)領(lǐng)先。這種優(yōu)勢(shì)的根源可以追溯到百度在人工智能領(lǐng)域長(zhǎng)期以來(lái)的技術(shù)積累,尤其在模型能力、工具平臺(tái)、生態(tài)布局以及行業(yè)覆蓋方面表現(xiàn)出明顯的優(yōu)勢(shì)。

首先,百度在人工智能領(lǐng)域擁有完整的四層架構(gòu)布局,包括芯片層、框架層、模型層和應(yīng)用層。這種端到端的布局和優(yōu)化使得百度能夠在框架層和模型層之間實(shí)現(xiàn)協(xié)同優(yōu)化,從而提升文心大模型的模型效果、訓(xùn)練速度和推理速度。并基于百度自研的深度學(xué)習(xí)平臺(tái)飛槳(PaddlePaddle),為大模型的高效訓(xùn)練和推理提供了強(qiáng)力支持。通過(guò)整合不同層次的技術(shù)和資源,百度能夠更好地滿足大模型產(chǎn)品的需求,提供更出色的用戶體驗(yàn)。
同時(shí),知識(shí)增強(qiáng)作為文心大模型的核心特色之一,通過(guò)融合海量知識(shí)和數(shù)據(jù)進(jìn)行學(xué)習(xí),使得模型具有更高的效率、更好的效果和更強(qiáng)的可解釋性。百度持續(xù)進(jìn)行技術(shù)創(chuàng)新,并將其廣泛應(yīng)用于各個(gè)領(lǐng)域,如自然語(yǔ)言處理(NLP)、計(jì)算機(jī)視覺(jué)(CV)和跨模態(tài)等。通過(guò)布局這些大模型技術(shù),大模型覆蓋了文本、視覺(jué)、跨模態(tài)等多個(gè)領(lǐng)域,并在180多個(gè)權(quán)威公開(kāi)評(píng)測(cè)集上刷新了SOTA(State-of-the-Art)結(jié)果。這種技術(shù)和生態(tài)的投入使得百度能夠在大模型產(chǎn)品中處于領(lǐng)先地位,滿足用戶對(duì)于復(fù)雜任務(wù)和多樣化需求的需求。
得益于全棧布局的優(yōu)勢(shì),百度能夠保持大模型能力的快速迭代。今年3月,百度正式發(fā)布文心一言作為國(guó)內(nèi)率先推出對(duì)標(biāo) ChatGPT 的大模型,集知識(shí)增強(qiáng)、檢索增強(qiáng)、對(duì)話增強(qiáng)技術(shù)創(chuàng)新于一體。而僅在3個(gè)月后,迭代上線的文心大模型3.5,經(jīng)過(guò)飛槳與文心大模型的協(xié)同優(yōu)化,更是在能力上取得了進(jìn)一步突破,模型效果提升50%,訓(xùn)練速度提升2倍,推理速度提升30倍。
在AGIEval、C-Eval等中英文權(quán)威測(cè)試集和MMLU英文權(quán)威測(cè)試集中,取得了超過(guò)ChatGPT和LLaMa、ChatGLM等其他大模型的分?jǐn)?shù)表現(xiàn),在中文評(píng)測(cè)項(xiàng)中超越了GPT-4,綜合能力走在世界前列。

不僅如此,文心大模型3.5還能通過(guò)插件方式擴(kuò)增了大模型的能力邊界:例如默認(rèn)內(nèi)置插件“百度搜索”,使得文心一言具備生成實(shí)時(shí)準(zhǔn)確信息的能力;“ChatFile”插件可基于長(zhǎng)文檔進(jìn)行問(wèn)答和摘要。成功將百度作為國(guó)內(nèi)最大的搜索引擎的技術(shù)積淀與大模型技術(shù)相結(jié)合,使模型效果及場(chǎng)景適配能力進(jìn)一步顯著提升。
文心大模型與產(chǎn)業(yè)實(shí)踐深度融合,行業(yè)覆蓋脫穎而出
大模型出現(xiàn)之前,AI最被詬病、落地最難的是,實(shí)際產(chǎn)業(yè)環(huán)境場(chǎng)景碎片化。但在基礎(chǔ)大模型下,不需要太多精調(diào)數(shù)據(jù),不需要訓(xùn)練太多輪數(shù),就可以獲得非常好的結(jié)果,大大降低了企業(yè)使用人工智能的門(mén)檻,為企業(yè)布局人工智能技術(shù)實(shí)現(xiàn)降本增效帶來(lái)了空前的機(jī)遇。
在《報(bào)告》中,IDC指出,大模型的通用性顯著降低了 AI 的應(yīng)用門(mén)檻,為人工智能的工程化落地提供了更多可能性。從產(chǎn)業(yè)應(yīng)用來(lái)看,大模型為企業(yè)提供生產(chǎn)優(yōu)化與創(chuàng)新的新路徑,并已經(jīng)在搜索、地圖、數(shù)字人、智能對(duì)話、推薦以及業(yè)務(wù)流程優(yōu)化等場(chǎng)景表現(xiàn)出巨大的潛力。
不過(guò),想要保持大模型技術(shù)的領(lǐng)先,不僅需要算力、有數(shù)據(jù)、有經(jīng)驗(yàn)豐富的AI工程師的長(zhǎng)期積累,仍然要持續(xù)在技術(shù)生態(tài)高強(qiáng)度投入。以百度為例,過(guò)去10年,百度在AI方向投入已超過(guò)1000億元。百度作為一家技術(shù)公司,每年研發(fā)投入的營(yíng)收占比都超過(guò)20%。
每個(gè)企業(yè)都需要用大模型,但并非每家企業(yè)都需要從零開(kāi)始做大模型。因此,作為技術(shù)企業(yè),推動(dòng)大模型與行業(yè)深度融合,支撐起產(chǎn)業(yè)轉(zhuǎn)化,實(shí)現(xiàn)以虛促實(shí),成為行業(yè)亟待解決的問(wèn)題。
大模型之家認(rèn)為,在實(shí)際應(yīng)用中,大模型需要綜合考慮多個(gè)因素來(lái)確定最適合的模型規(guī)模。針對(duì)不同行業(yè)的場(chǎng)景特點(diǎn),進(jìn)行有針對(duì)性的知識(shí)增強(qiáng)在解決現(xiàn)階段問(wèn)題中將發(fā)揮重要作用。通過(guò)與不同行業(yè)的場(chǎng)景特點(diǎn)通過(guò)將大模型與知識(shí)庫(kù)相鏈接,進(jìn)行知識(shí)增強(qiáng),可以使大模型具備更強(qiáng)的專業(yè)知識(shí)和推理能力,從而提高大模型在特定領(lǐng)域的表現(xiàn)和適應(yīng)性。
目前,大模型已經(jīng)具備較高的識(shí)別準(zhǔn)確率和較強(qiáng)的場(chǎng)景遷移性,在多模態(tài)的任務(wù)下也有明顯的突破,并已在金融、電商、能源等行業(yè)試水成功,并逐步向千行百業(yè)滲透。
百度文心大模型源于產(chǎn)業(yè)實(shí)踐,服務(wù)于產(chǎn)業(yè)實(shí)踐。在近年的大模型技術(shù)探索與產(chǎn)業(yè)實(shí)踐中,百度文心形成了支撐大模型產(chǎn)業(yè)落地的關(guān)鍵路徑,構(gòu)建文心大模型層、工具平臺(tái)層,以及以基于文心大模型構(gòu)建的系列產(chǎn)品與社區(qū),能夠?yàn)橛脩籼峁└鄻踊⒏咝У拇竽P彤a(chǎn)品,并已提前進(jìn)入商業(yè)化落地探索階段。

在IDC《報(bào)告》中,也針對(duì)大模型行業(yè)覆蓋層面,以及面向具體行業(yè)給出了詳細(xì)的打分。其中,百度文心大模型在中行業(yè)覆蓋指標(biāo)中,成為了唯一取得滿分5分的模型。另外,在行業(yè)相關(guān)的能源領(lǐng)域,百度文心大模型在能源中脫穎而出,取得了行業(yè)滿分的成績(jī)。

百度7項(xiàng)滿分、綜合評(píng)分第一
IDC在報(bào)告中指出:百度文心大模型源于產(chǎn)業(yè)實(shí)踐,服務(wù)于產(chǎn)業(yè)實(shí)踐。在近年的大模型技術(shù)探索與產(chǎn)業(yè)實(shí)踐中,百度文心形成了支撐大模型產(chǎn)業(yè)落地的關(guān)鍵路徑,構(gòu)建文心大模型層、工具平臺(tái)層,以及以基于文心大模型構(gòu)建的系列產(chǎn)品與社區(qū)。
在模型層,文心大模型包含30多個(gè)大模型,涵蓋基礎(chǔ)大模型、任務(wù)大模型、行業(yè)大模型的三級(jí)體系,全面滿足產(chǎn)業(yè)應(yīng)用需求。在工具與平臺(tái)層,全面升級(jí)大模型開(kāi)發(fā)套件、文心 API、提供全流程開(kāi)箱即用大模型能力的 EasyDL 和 BML 開(kāi)發(fā)平臺(tái),全方位降低應(yīng)用門(mén)檻。這些模型能力為百度的產(chǎn)品、服務(wù)帶來(lái)巨大變化,推動(dòng)云計(jì)算加速進(jìn)入AI時(shí)代,加速實(shí)現(xiàn)百度智能云提出的“云智一體”戰(zhàn)略。
目前,百度“文心一言”大模型+飛槳深度學(xué)習(xí)框架,已聯(lián)合國(guó)網(wǎng)、浦發(fā)、泰康、吉利、哈爾濱市、深圳燃?xì)狻CL、上海辭書(shū)出版社等行業(yè)客戶合作打造了11個(gè)行業(yè)大模型,涵蓋電力、燃?xì)狻⒔鹑凇⒑教臁髅健⒊鞘小⒂耙暋⒅圃臁⑸缈频刃袠I(yè)大模型,加速推動(dòng)行業(yè)的智能化轉(zhuǎn)型升級(jí)。
例如,與吉利汽車合作構(gòu)建了智能客服知識(shí)庫(kù)、汽車領(lǐng)域知識(shí)庫(kù)等,節(jié)省了75%的研發(fā)人力成本。此外,文心一言自3月份內(nèi)測(cè)以來(lái),百度已經(jīng)陸續(xù)接到了超過(guò)15萬(wàn)家客戶的接入請(qǐng)求。
2023年5月,全球首個(gè)一站式企業(yè)級(jí)大模型生產(chǎn)平臺(tái)“文心千帆大模型平臺(tái)”發(fā)布,不但提供包括文心一言在內(nèi)的文心大模型及第三方大模型服務(wù),還提供大模型開(kāi)發(fā)和應(yīng)用的整套工具鏈。目前文心千帆可以支持公有云服務(wù)、私有化部署多樣的交付模式。企業(yè)可根據(jù)自身業(yè)務(wù)需求,選擇適合自身的模型服務(wù)方式。
以能源電力為例,在全球最大的公用事業(yè)企業(yè)–國(guó)家電網(wǎng)有限公司,面向復(fù)雜電網(wǎng)的專業(yè)場(chǎng)景,基于百度文心大模型,百度與智研院聯(lián)合訓(xùn)練電力行業(yè)大模型,在電網(wǎng)設(shè)備、客服等實(shí)際業(yè)務(wù)場(chǎng)景進(jìn)行試點(diǎn)驗(yàn)證,可以顯著增強(qiáng)電網(wǎng)運(yùn)營(yíng)的精細(xì)化、自動(dòng)化、智能化水平。百度也和深圳燃?xì)饴?lián)合發(fā)布了燃?xì)庑袠I(yè)大模型,破解燃?xì)馄髽I(yè)運(yùn)營(yíng)場(chǎng)景繁雜、安全風(fēng)險(xiǎn)識(shí)別困難等難題。
隨著大模型落地千行百業(yè),將成為推動(dòng)我國(guó)高質(zhì)量發(fā)展的核心動(dòng)力。大模型不僅為行業(yè)創(chuàng)新和發(fā)展注入了新的動(dòng)力,也推動(dòng)著技術(shù)的突破和商業(yè)模式的創(chuàng)新。在這一過(guò)程中,在以百度等為代表的中國(guó)科技公司們的積極推動(dòng)下,其前景亦令人充滿期待。在大模型產(chǎn)業(yè)的持續(xù)創(chuàng)新之下,將為行業(yè)貢獻(xiàn)更多價(jià)值,引領(lǐng)我國(guó)在數(shù)智化的征程中取得更大的成功。