在2025年I/O開(kāi)發(fā)者大會(huì)上,谷歌震撼發(fā)布新一代AI視頻生成模型Veo 3,標(biāo)志著其在生成式AI領(lǐng)域的又一次重大突破。該模型不僅繼承了前代產(chǎn)品的核心優(yōu)勢(shì),更實(shí)現(xiàn)了音視頻一體化生成的突破性進(jìn)展,成為首個(gè)能夠同步生成高質(zhì)量視頻與適配音效的商業(yè)化AI工具。
Veo 3支持用戶通過(guò)文本或圖像提示快速生成專業(yè)級(jí)視頻內(nèi)容,并可根據(jù)場(chǎng)景需求自動(dòng)匹配環(huán)境音效。無(wú)論是人物對(duì)話、自然聲響還是復(fù)雜的城市交通音效,系統(tǒng)均能實(shí)現(xiàn)精準(zhǔn)同步,顯著提升視頻的真實(shí)感和沉浸感。谷歌DeepMind產(chǎn)品副總裁Eli Collins對(duì)Veo 3的表現(xiàn)給予高度評(píng)價(jià),他指出:"Veo 3在物理效果模擬、人物唇形同步等關(guān)鍵技術(shù)指標(biāo)上已達(dá)到行業(yè)領(lǐng)先水平。通過(guò)持續(xù)優(yōu)化算法,我們成功解決了音畫不同步的行業(yè)痛點(diǎn)。"
目前,Veo 3主要面向美國(guó)地區(qū)的Gemini Ultra訂閱用戶開(kāi)放,訂閱費(fèi)用為每月249.99美元。此外,企業(yè)用戶可通過(guò)谷歌Vertex AI平臺(tái)獲取定制化服務(wù),滿足商業(yè)級(jí)視頻創(chuàng)作需求。在本次發(fā)布會(huì)上,谷歌還同步推出了升級(jí)版的Imagen 4圖像生成模型及電影制作輔助工具Flow。值得注意的是,谷歌針對(duì)Veo 2進(jìn)行了功能迭代,新增了基于文本提示的物體增刪功能,進(jìn)一步擴(kuò)展了視頻編輯的可能性。
盡管近年來(lái)谷歌在生成式AI領(lǐng)域動(dòng)作頻頻,但其2024年因Imagen 3模型生成歷史錯(cuò)誤圖像而引發(fā)的風(fēng)波仍歷歷在目。對(duì)此,谷歌聯(lián)合創(chuàng)始人Sergey Brin坦言:"技術(shù)進(jìn)步必須建立在嚴(yán)謹(jǐn)?shù)臏y(cè)試體系之上。"此次Veo 3的發(fā)布不僅是谷歌技術(shù)實(shí)力的集中展現(xiàn),更預(yù)示著AI視頻創(chuàng)作將邁入音畫協(xié)同的新時(shí)代。隨著技術(shù)的不斷迭代,我們有理由相信,未來(lái)的內(nèi)容創(chuàng)作將更加高效、智能且富有創(chuàng)意。