速途網(wǎng)訊 數(shù)據(jù)是生成式AI的基石。生成式AI的基礎(chǔ)模型誕生于大規(guī)模、高質(zhì)量的數(shù)據(jù)集,現(xiàn)今的模型已經(jīng)達到了前所未有的規(guī)模,這為企業(yè)提供了強大的基礎(chǔ)。然而,數(shù)據(jù)與基礎(chǔ)模型的結(jié)合才能產(chǎn)生真正的價值。通過將企業(yè)內(nèi)部數(shù)據(jù)與基礎(chǔ)模型結(jié)合,企業(yè)可以創(chuàng)造出獨特的應(yīng)用,滿足用戶需求,提高用戶體驗。同時,企業(yè)需要高效管理這些新數(shù)據(jù),確保它們能夠為應(yīng)用的持續(xù)發(fā)展提供支持。

近日,亞馬遜云科技 “無數(shù)據(jù),不模型——生成式AI時代的數(shù)據(jù)基座”技術(shù)媒體溝通會在京成功舉辦。溝通會上,亞馬遜云科技重點介紹了在數(shù)據(jù)基座構(gòu)建方面的核心能力和解決方案,以及企業(yè)在生成式AI時代構(gòu)建數(shù)據(jù)基座的重要性和必備條件。
亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建表示:“企業(yè)需要的是懂業(yè)務(wù)、懂用戶的生成式AI應(yīng)用,而打造這樣的應(yīng)用需要從數(shù)據(jù)做起。亞馬遜云科技構(gòu)建數(shù)據(jù)基座的三大核心能力涵蓋從基礎(chǔ)模型訓(xùn)練到生成式AI應(yīng)用構(gòu)建的重要場景,能夠幫助企業(yè)輕松應(yīng)對海量多模態(tài)數(shù)據(jù),提升基礎(chǔ)模型能力。作為全球云計算的開創(chuàng)者和引領(lǐng)者,亞馬遜云科技正在幫助各個行業(yè)、各種規(guī)模的企業(yè)打造強健的數(shù)據(jù)基座,在確保用戶業(yè)務(wù)和數(shù)據(jù)安全的前提下,將數(shù)據(jù)的獨特價值賦予基礎(chǔ)模型和生成式AI應(yīng)用,加速企業(yè)業(yè)務(wù)增長。”
亞馬遜云科技構(gòu)建的數(shù)據(jù)基座具備三大核心能力:第一,為模型微調(diào)和預(yù)訓(xùn)練提供高質(zhì)量數(shù)據(jù)處理能力。這包括了數(shù)據(jù)存儲、清洗和治理,而亞馬遜云科技的各項服務(wù),如Amazon S3和Amazon Glue等,為企業(yè)提供了高效、快速的數(shù)據(jù)處理方案。
陳曉建指出,生成式AI基礎(chǔ)模型誕生于大規(guī)模、高質(zhì)量數(shù)據(jù)集。如果一本書按500KB算,現(xiàn)在的500T參數(shù)的模型已經(jīng)有332億本,相當于現(xiàn)存每個人類擁有4本書。數(shù)據(jù)結(jié)合基礎(chǔ)模型會產(chǎn)生獨特價值,企業(yè)需要高效管理飛速發(fā)展的生成式 AI 應(yīng)用產(chǎn)生的新數(shù)據(jù)。
例如亞馬遜打造的Rufus,作為一款以生成式AI為核心的專業(yè)購物助手,能夠解答客戶的購物疑問、提供產(chǎn)品比較,并根據(jù)對話情境進行推薦。它將為亞馬遜商城超過2億的Prime 會員提供服務(wù),在提升客戶體驗的同時也會產(chǎn)生大量新的數(shù)據(jù)。
第二,是將數(shù)據(jù)與模型快速結(jié)合,讓企業(yè)專有數(shù)據(jù)釋放更大價值。目前,通過數(shù)據(jù)定制基礎(chǔ)模型的方式主要分為三大類:檢索增強生成(RAG)、微調(diào)和持續(xù)預(yù)訓(xùn)練。RAG的數(shù)據(jù)來源是企業(yè)內(nèi)部文檔庫、數(shù)據(jù)庫、數(shù)據(jù)倉庫、知識圖譜;微調(diào)數(shù)據(jù)來源為私域知識;持續(xù)預(yù)訓(xùn)練數(shù)據(jù)來源為公開的數(shù)據(jù)集或企業(yè)各部門的數(shù)據(jù)。
亞馬遜云科技將向量搜索的支持功能加入到主流的數(shù)據(jù)服務(wù)中,通過將數(shù)據(jù)和向量存儲在一起來提升數(shù)據(jù)查詢性能。這能夠讓企業(yè)輕松利用RAG技術(shù)將專有數(shù)據(jù)提供給基礎(chǔ)模型,從而釋放更大價值。此外,亞馬遜云科技還為圖數(shù)據(jù)庫Amazon Neptune推出了分析數(shù)據(jù)庫引擎,以結(jié)合圖數(shù)據(jù)庫與大模型的優(yōu)勢,從而能夠快速從圖形數(shù)據(jù)中獲取洞察,并進行更快的向量搜索。

第三,有效處理生成式AI應(yīng)用的新數(shù)據(jù),降低模型頻繁調(diào)用成本并提升性能。亞馬遜云科技推出了Amazon Memory DB內(nèi)存數(shù)據(jù)庫和Amazon OpenSearch Serverless服務(wù),其中。Amazon Memory DB內(nèi)存數(shù)據(jù)庫通過緩存之前問答生成的新數(shù)據(jù),實現(xiàn)對類似問題的快速響應(yīng)和準確回答,同時有效降低基礎(chǔ)模型的調(diào)用頻率。Amazon Memory DB能夠存儲數(shù)百萬個向量,只需要幾毫秒的響應(yīng)時間,能夠以99%的召回率實現(xiàn)每秒百萬次的查詢性能。

會上,北京靈奧科技CEO厲啟鵬與店匠科技(Shoplazza)首席科學(xué)家謝中流博士也進行了演講,分享了企業(yè)運用亞馬遜云科技的相關(guān)技術(shù)實現(xiàn)業(yè)務(wù)賦能的更多實踐。
在交流中,謝中流指出 Shoplazza的核心業(yè)務(wù)就是幫助商戶建立獨立的電商平臺,已服務(wù)了超過36萬跨境電商客戶,覆蓋了全球150多個國家,其中40%的消費者來自于歐美地區(qū)。
通過亞馬遜云科技的強大基礎(chǔ)設(shè)施和技術(shù)支持,Shoplazza得以實現(xiàn)海量營銷素材的存儲和管理,為模型訓(xùn)練提供數(shù)據(jù)支持,以及通過分布式任務(wù)和流式計算技術(shù)實現(xiàn)實時數(shù)據(jù)處理和清洗。亞馬遜云科技的各項服務(wù),如Amazon S3、Amazon EMR、Amazon OpenSearch等,為Shoplazza提供了完善的技術(shù)基礎(chǔ)和數(shù)據(jù)支持,使其能夠更好地滿足用戶的需求。
此外,Shoplazza也在探索與亞馬遜云科技在AI領(lǐng)域的更深度整合。通過引入生成式AI技術(shù),Shoplazza開發(fā)了一系列創(chuàng)新產(chǎn)品,包括BetaCreator營銷素材創(chuàng)作工具、智能建站服務(wù)、智能客服解決方案以及智能推薦與搜索等。這些產(chǎn)品的引入,大大提高了電商營銷素材的創(chuàng)作效率,簡化了網(wǎng)站建設(shè)流程,并實現(xiàn)了智能化的客戶服務(wù)和個性化的推薦與搜索功能。
厲啟鵬在演講中表示:“如果企業(yè)能夠解決好數(shù)據(jù)問題,就能夠解決大部分AI應(yīng)用落地的核心挑戰(zhàn)。”他指出,企業(yè)在構(gòu)建AI應(yīng)用時面臨諸多挑戰(zhàn),包括業(yè)務(wù)數(shù)據(jù)的理解、數(shù)據(jù)的質(zhì)量和安全合規(guī)等方面。
他還強調(diào)了數(shù)據(jù)在實時業(yè)務(wù)決策中的重要性,并提到了與亞馬遜云科技的深度合作,使Vanus得以基于亞馬遜云科技的強大基礎(chǔ)設(shè)施和技術(shù)支持提供更優(yōu)質(zhì)的服務(wù)。例如幫助ERP企業(yè)通過Vanus AI構(gòu)建AI Copilot,提升客戶服務(wù)效率;或是幫助服飾電商企業(yè)利用VanChat提升銷售和客戶滿意度。
厲啟鵬還介紹了Vanus如何利用亞馬遜云科技的各項服務(wù),如Amazon S3、Amazon DocumentDB等,實現(xiàn)海量數(shù)據(jù)存儲、實時業(yè)務(wù)感知和數(shù)據(jù)處理等功能。他表示,借助亞馬遜云科技的彈性計算和高可用性服務(wù),Vanus能夠?qū)崿F(xiàn)企業(yè)客戶的高效運營和成本節(jié)約。
通過為企業(yè)提供先進的數(shù)據(jù)處理能力,亞馬遜云科技推動企業(yè)在生成式AI應(yīng)用領(lǐng)域的發(fā)展,為全球用戶提供了更加優(yōu)質(zhì)的音樂體驗。厲啟鵬表示,未來他們將繼續(xù)與亞馬遜云科技合作,在模型領(lǐng)域和數(shù)據(jù)庫領(lǐng)域深化合作,探索更多創(chuàng)新解決方案,為用戶提供更好的AI產(chǎn)品和服務(wù)。