前不久,OpenAI發(fā)布又一款“王炸”產(chǎn)品Sora,展示了從文生視頻、圖生視頻,再到多機(jī)位視頻生成的強(qiáng)大能力,再次引爆全球。

事實(shí)上,文生視頻賽道并非OpenAI最先開始探索。去年末,Runway及Pika引爆AI視頻生成賽道,并將熱度延續(xù)至今。今年以來,除爆火的Sora之外,海外頭部廠商谷歌、國內(nèi)AI應(yīng)用賽道佼佼者AIGC軟件A股上市公司萬興科技(300624.SZ)等也都紛紛發(fā)布最新成果。
其中,谷歌與OpenAI同日推出了最新一代多模態(tài)大模型 Gemini 1.5 Pro,把穩(wěn)定處理上下文的上限擴(kuò)大至100萬tokens,創(chuàng)下了最長上下文窗口的紀(jì)錄。

萬興科技則于1月30日,在長沙馬欄山主辦多媒體大模型創(chuàng)新應(yīng)用高峰論壇暨發(fā)布簽約儀式,面向全球市場重磅發(fā)布湖南首個通過算法備案、中國首個音視頻多媒體創(chuàng)作垂類大模型——萬興“天幕”。
據(jù)介紹,萬興“天幕”依托基礎(chǔ)大模型及高性能全球網(wǎng)絡(luò)平臺、計(jì)算集群算力平臺和海量數(shù)據(jù)平臺,由視頻大模型、音頻大模型、圖片大模型和語言大模型組成,具有“專精特快”優(yōu)勢,可專業(yè)提升視頻創(chuàng)作效率、精細(xì)化提升垂類質(zhì)量、特色化補(bǔ)齊創(chuàng)作閉環(huán)、快速賦能應(yīng)用智能化升級。
當(dāng)前,萬興“天幕”多媒體大模型已迭代近百項(xiàng)音視頻原子能力,包括文生主題視頻、文生3D視頻、AI歌手、視頻AI配樂、數(shù)字人播報(bào)等。經(jīng)測算,萬興“天幕”原子能力多指標(biāo)數(shù)據(jù)表現(xiàn)遠(yuǎn)超行業(yè)平均水平。其中,“文生主題視頻”支持高質(zhì)量視頻一鍵生成、“文生3D視頻”支持極高自由度的3D場景生成、“AI歌手”提供超逼真的AI歌手翻唱定制服務(wù)、“視頻AI配樂”支持根據(jù)視頻內(nèi)容AI生成匹配的音樂、“數(shù)字人播報(bào)”僅需普通手機(jī)即可操作,人像真實(shí)度、口型準(zhǔn)確度等均優(yōu)勢明顯,且支持全球主流語種。
目前,萬興“天幕”眾多能力已在萬興科技旗下創(chuàng)意軟件產(chǎn)品,尤其是海外產(chǎn)品中規(guī)模化商用。其中,萬興科技旗下視頻創(chuàng)意產(chǎn)品Wondershare Filmora 13已全新集成大模型能力,全新版本的AI Copilot智能剪輯助手、AI文字快剪、AIGC音樂生成等功能備受海外用戶好評;一站式出海視頻營銷神器萬興播爆已實(shí)現(xiàn)大模型中數(shù)字人能力的應(yīng)用,使AIGC更好地服務(wù)于出海視頻創(chuàng)作者,并提供領(lǐng)先的AI視頻翻譯能力。數(shù)據(jù)顯示,在萬興“天幕”的加持下,Wondershare Filmora、萬興播爆等使用AI功能的用戶數(shù)等多倍速增長,賦能效果顯著。

視頻生成技術(shù)的不斷創(chuàng)新和進(jìn)步,為用戶提供了更多創(chuàng)作的可能性,同時也為企業(yè)提供了更多的商業(yè)機(jī)會。隨著視頻內(nèi)容的需求不斷增加,視頻生成賽道也將持續(xù)火熱。
當(dāng)然,挑戰(zhàn)一直存在,其中視頻生成的質(zhì)量和真實(shí)感是關(guān)鍵問題。盡管人工智能技術(shù)能夠生成逼真的視頻,但仍然存在一些細(xì)節(jié)和效果上的不足。其次,視頻生成技術(shù)的算法和模型需要不斷優(yōu)化和改進(jìn),以提高生成效率和質(zhì)量。此外,隨著視頻生成技術(shù)的普及,版權(quán)和隱私保護(hù)等問題也需要得到更好的解決。
隨著人工智能技術(shù)的不斷進(jìn)步和應(yīng)用,視頻生成技術(shù)將在未來繼續(xù)發(fā)展,為用戶帶來更加豐富多樣的視覺體驗(yàn)。我們可以期待在未來會有更多的廠商推出全新的視頻生成產(chǎn)品,為用戶帶來更加豐富多樣的視覺體驗(yàn)。