大模型進(jìn)化速度超預(yù)期 AI視頻生成迎來“GPT時(shí)刻”
中證網(wǎng)訊(記者 康曦)2月18日,國海證券發(fā)布研報(bào)稱,Sora的推出,體現(xiàn)出大模型進(jìn)化速度的超預(yù)期,這或?qū)⑹峭ㄍ鵄GI(通用人工智能)時(shí)代的里程碑。國內(nèi)大模型將受益于海外技術(shù)交流和開源,國產(chǎn)大模型多模態(tài)和通用能力將追趕GPT4-turbo和Sora等。
近日,OpenAI推出全新的文生視頻大模型Sora,AI視頻生成迎來“GPT時(shí)刻”。在Open AI公布的48個(gè)樣片中,Sora展現(xiàn)出令人驚嘆的視頻生成效果,視頻時(shí)長提升至1分鐘,生成的角色表情逼真,還實(shí)現(xiàn)了多角度鏡頭切換與流暢分鏡,可展現(xiàn)真實(shí)光影、運(yùn)動(dòng)和鏡頭移動(dòng)效果。
Sora是一個(gè)擴(kuò)散Transformer模型,通過采用Diffusion Transformer等技術(shù)處理不同持續(xù)時(shí)間、分辨率和比例的視頻/圖像,實(shí)現(xiàn)“世界模擬器”,達(dá)到理解真實(shí)世界的運(yùn)動(dòng)和物理能力。
業(yè)內(nèi)人士表示,世界模擬器是AI生成視頻的一種方式,它的成功會(huì)帶動(dòng)視頻生成賽道的發(fā)展,加速視頻生成的創(chuàng)新和成熟。
面對AI視頻生成領(lǐng)域的廣闊前景,國內(nèi)各廠商正加大投入,推動(dòng)AI視頻生成進(jìn)入全新時(shí)代。字節(jié)跳動(dòng)于去年11月發(fā)布PixelDance模型,不僅在視頻時(shí)長上實(shí)現(xiàn)了突破,還可通過描述(純文本)+首幀指導(dǎo)(圖片)+尾幀指導(dǎo)(圖片),生成包含復(fù)雜場景和動(dòng)作的視頻,用上一個(gè)視頻片段尾幀為下一個(gè)視頻頭幀提供指導(dǎo)思路。
萬興科技于今年年初推出國內(nèi)首個(gè)以音視頻為核心的多媒體大模型萬興“天幕”。定位上,萬興“天幕”是音視頻多媒體創(chuàng)作垂類大模型,由視頻、音頻、圖片、語言大模型組成;能力上,萬興“天幕”涵蓋當(dāng)前市面上語言、音頻、圖像的大模型能力,文生視頻能力是萬興“天幕”的子能力之一;用戶方面,萬興“天幕”面向更細(xì)分垂直的市場,包括泛知識(shí)、泛營銷、泛娛樂等領(lǐng)域,相關(guān)能力已在海外規(guī)模化商用。
AI視頻生成賽道前景廣闊。數(shù)據(jù)顯示,截至2023年末,僅國內(nèi)短視頻用戶規(guī)模就已突破10億人。
在業(yè)內(nèi)人士看來,Sora是AGI(通用人工智能)實(shí)現(xiàn)的重要里程碑,Sora的出現(xiàn)將全球目光聚焦于視頻生成領(lǐng)域,驗(yàn)證了視頻為王的趨勢,也進(jìn)一步驗(yàn)證了無視頻不傳播的時(shí)代,“視頻+大模型”的應(yīng)用市場空間不斷擴(kuò)展。
日前,國泰君安證券發(fā)布研報(bào)稱,Sora模型推動(dòng)AI多模態(tài)領(lǐng)域飛躍式發(fā)展,AI創(chuàng)作等相關(guān)領(lǐng)域?qū)⒂瓉砩疃茸兏?,AI賦能范圍進(jìn)一步擴(kuò)大,推薦萬興科技、金山辦公、科大訊飛、虹軟科技等標(biāo)的。