北京時間今日凌晨,谷歌I/O全球開發(fā)者大會在加州山景城舉行,與往年I/O大會安卓系統(tǒng)唱主角不同,今年的I/O大會是一場以AI為核心的大會,谷歌展現(xiàn)了一系列人工智能領(lǐng)域的最新技術(shù)成果。

谷歌母公司Alphabet CEO桑達(dá)爾·皮查伊(Sundar Pichai)表示:“我們正在重新塑造包括搜索在內(nèi)的所有核心產(chǎn)品。”
在大會上,谷歌在今年的I/O大會上發(fā)布了多款基于其大型語言模型(LLM)的新產(chǎn)品。同時,谷歌正在將生成式AI整合到搜索引擎和其他產(chǎn)品中,例如可以生成草稿信息的Gmail,以及可以對圖像進(jìn)行重大修改的Google Photos。
大語言模型PaLM2亮相,實現(xiàn)端側(cè)大模型
大模型作為目前人工智能行業(yè)的焦點,谷歌 在 I/O 開發(fā)者大會上宣布了全新的大語言模型 PaLM 2,據(jù)悉,PaLM 2是谷歌去年4月發(fā)布的PaLM語言模型的升級版本,它將為谷歌的更新版Gmail和 Bard 聊天工具提供支持,以挑戰(zhàn)OpenAI的GPT-4。
據(jù) 谷歌 介紹,PaLM 2 在訓(xùn)練過程中使用了大量的數(shù)學(xué)和科學(xué)數(shù)據(jù)集,在邏輯和推理方面進(jìn)行了廣泛的訓(xùn)練,相比于去年的 PaLM 模型,PaLM 2 在多語言處理、推理和編碼能力上有了顯著的提升,并且接受了多語言文本訓(xùn)練,支持超過100種語言。
谷歌沒有透露 PaLM 2 的具體參數(shù)規(guī)模,只是提到 PaLM 2 是基于最新的 JAX 和 TPU v4 計算設(shè)施構(gòu)建的。谷歌對 PaLM 2 進(jìn)行了算法優(yōu)化,使得它在體積上比 PaLM 要小,但整體性能更強,計算效率更高 。
在介紹環(huán)節(jié),谷歌也不忘對標(biāo)一下“競爭對手” ,谷歌官方測試顯示,PaLM 2 的部分結(jié)果(例如數(shù)學(xué))比 GPT-4 還要優(yōu)秀。

據(jù)悉,為了讓模型的能力更靈活地服務(wù)于產(chǎn)品,PaLM 2分為四種規(guī)格,從小到大依次為Gecko、Otter、Bison和Unicorn,其中體積最小的Gecko可在移動設(shè)備上使用,每秒大約可處理20個Token,開發(fā)者們不用花費大量的時間和資源來創(chuàng)建和調(diào)整PaLM 2,而是能夠直接拿來就用進(jìn)行部署。
基于PaLM 2 微調(diào),谷歌還展示了一種名為 Med-PaLM 的多模態(tài)大語言模型,專門用于醫(yī)療領(lǐng)域。它可以根據(jù) X 光片診斷病人的傷情,據(jù)稱是首個在美國醫(yī)療執(zhí)照考試中達(dá)到專家水平的大語言模型。
另一種是 Sec-PaLM 2,它是針對網(wǎng)絡(luò)安全的大語言模型,它可以分析和解釋潛在的惡意腳本,并評估其危險性。
谷歌表示,目前已有超過25個產(chǎn)品和App正在使用PaLM 2的能力。
Duet AI發(fā)布,全面對標(biāo)微軟Copilot
Duet AI 是 Google Workspace 的最新工具,是谷歌在Workspace應(yīng)用中提供的一系列AI工具的品牌名稱,利用谷歌AI 技術(shù)提供智能輔助:

首先,Gmail移動應(yīng)用現(xiàn)在將根據(jù)一個提示,在一個新的“Help me write(幫我寫)”功能中為你草擬完整的電子郵件回復(fù)。此外,Gmail移動應(yīng)用很快將增加上下文輔助功能,“讓你能夠創(chuàng)建自動填充姓名和其他相關(guān)信息的專業(yè)回復(fù)。”
Duet AI也出現(xiàn)在Google Slides中,與Midjourney或DALL-E 2類似,Duet AI現(xiàn)在可以將簡單的文本提示(輸入到Duet AI“Sidekick”側(cè)邊欄中)轉(zhuǎn)換為AI生成的圖像,以增強Slides演示文稿。它可以幫助您省去在互聯(lián)網(wǎng)上尋找合適的幻燈片圖像的麻煩,同時為它們增添一些原創(chuàng)性。基于此功能,Duet AI還可以在Google Meet中可以根據(jù)文本提示為視頻通話生成自定義背景圖像。
在Google Sheets中,Duet AI可以理解單元格數(shù)據(jù)的上下文,并相應(yīng)地進(jìn)行標(biāo)記。電子表格應(yīng)用程序還添加了一個新的“help me organize”(幫我整理)”功能,用于創(chuàng)建自定義計劃。

Duet AI還在Google Docs的智能畫布中增加了一個“assisted writing experience(輔助寫作體驗)”。輸入一個描述你想寫的內(nèi)容的提示,就會生成一個Docs草稿。
此外Duet AI還增加了一套基于機器學(xué)習(xí)的Google Cloud開發(fā)者工具,它可以提供實時代碼協(xié)助,并推薦生成的代碼塊,同時指出錯誤可,支持 Go、Java、Javascript、Python 和 SQL 等多種開發(fā)語言。
用AI重新定義搜索能力

會上,谷歌搜索也推出了全新的SEG(Search Generative Experience),在使用時會在一些查詢的搜索結(jié)果的最頂部看到AI生成的答案,這些答案可以為你的搜索提供更多的上下文。你可以通過后續(xù)問題來縮小快照中的信息。這些AI快照是由Google在I/O上宣布的大型語言模型(LLM)的更新版本PaLM 2驅(qū)動的。這個新模型已經(jīng)為25個谷歌服務(wù)提供支持,包括公司的Bard聊天機器人,并且在推理、編碼和翻譯方面有所改進(jìn)。
更加多模態(tài)、多元化的Bard

谷歌宣布,旗下AI的聊天機器人Bard現(xiàn)在將對所有人開放,從周三起,向約180個國家開放申請使用Bard,并增加對韓語和日語的支持。同時該公司還增加了一系列新功能,讓用戶可以更容易地將生成的文本導(dǎo)出到Google文檔和Gmail,加入了新的暗色模式和視覺搜索功能。谷歌還表示計劃在未來為Bard添加更多功能,這包括使用Adobe的AI圖像生成器Firefly的AI圖像生成,以及與第三方服務(wù)如OpenTable和Instacart的集成。
面向AI的超算設(shè)施及學(xué)習(xí)工具
除了面向用戶的功能升級外,谷歌還為開發(fā)者推出云端機器學(xué)習(xí)平臺Vertex AI,增加了三款新的大模型:
Codey:text-to-code,可以幫助開發(fā)者編寫代碼;
Imagen:text-to-image,可以生成高品質(zhì)的圖片;
Chirp:speech-to-text,可以方便地進(jìn)行語音轉(zhuǎn)文字。

此外,在Vertex AI上還可以使用文本和圖像的嵌入式API。它可以將文本和圖像數(shù)據(jù)轉(zhuǎn)換為多維數(shù)值向量、映射語義關(guān)系,從而讓開發(fā)者創(chuàng)建出更加有趣的應(yīng)用。
除了模型方面,谷歌云在訓(xùn)練上還推出了下一代A3 GPU超算。通過將A3虛擬機和Nvidia H100結(jié)合,谷歌云能夠提供更大的計算吞吐量和帶寬,能夠讓企業(yè)更快開發(fā)機器學(xué)習(xí)模型。
“親兒子”獨享AI賦能的安卓14
相比AI占據(jù)了發(fā)布會的絕大多數(shù)時間,昔日的主角Android 14則成為了這次大會的配角,且同樣為安卓 14 系統(tǒng)引入兩項生成式 AI 特性,包括 Magic Compose 和生成式壁紙,其中后者為Pixel 設(shè)備獨占。
其中,Magic Compose可以在安卓系統(tǒng)的默認(rèn)短信(Messages)應(yīng)用中,通過AI 可以根據(jù)消息內(nèi)容生成回復(fù)文本。

而生成式 AI 壁紙,則是通過引入文本轉(zhuǎn)圖片擴散模型,允許用戶輸入 prompts,描述想要獲取的圖片信息,系統(tǒng)將會自動生成相應(yīng)的壁紙。谷歌還表示,它有一種新的“電影壁紙”(cinematic wallpaper),使用設(shè)備上的機器學(xué)習(xí)網(wǎng)絡(luò)將你最喜歡的照片轉(zhuǎn)換為 3D 圖像,當(dāng)你解鎖或傾斜設(shè)備時,這些圖像會呈現(xiàn)立體效果,給人栩栩如生的感覺。
除了軟件方面的升級之外,本次I/O大會上,谷歌還發(fā)布了售價1799美元的首款折疊屏手機Pixel Fold、直板手機Pixel 7a以及平板產(chǎn)品Pixel Tablet,而這些谷歌“親兒子”產(chǎn)品將和該系列其他產(chǎn)品一樣,率先獲得最新版的安卓大版本的升級,以及Pixel的獨享功能。
回顧谷歌 I/O 2023大會,可以說是一場擁抱AI、擁抱的大模型的大會。面對席卷全球的熱潮,谷歌作為全球的互聯(lián)網(wǎng)科技巨頭,也難以逆勢而行。尤其是在OpenAI、微軟、百度、商湯、科大訊飛等企業(yè)紛紛推出大模型以強化自身業(yè)務(wù)能力,實現(xiàn)效能提升,谷歌也必然有所行動,用AI賦能現(xiàn)有的產(chǎn)品,供自己的江湖地位。
在I/O大會上谷歌推出的新功能上,速途網(wǎng)能夠看出谷歌已經(jīng)向著大模型領(lǐng)域邁出了更加堅實的一步,而為谷歌形成真正的優(yōu)勢,不僅要看谷歌在這場大模型的角力中能否脫穎而出,還要看能否與產(chǎn)品與服務(wù)更加深度的整合,以合力打造一把“后中爭先”的利刃。