电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER 合作
量子位 17小時前

新 Vidu Q3 參考生,這是沖著「劇」來的!萬物皆可參考:特效音效場景都備好了

在小說閱讀器讀本章

去閱讀

咱就是說啊,這年頭做一個小短劇,真的不要太簡單。

因為,現(xiàn)在手搓一集國漫小短劇,真的是幾張圖就能搞定!

話不多說,直接來看效果:

不論是打斗的特效還是背景音效、人物的旁白,都是一鍋出的那種!

這就是生數(shù)科技 Vidu Q3正式發(fā)布的參考生視頻,主打的就是一個為劇而生,萬物可參,聲畫同出。

(早在 Vidu Q3 在今年 1 月發(fā)布的時候,它就登頂了國際權(quán)威 AI 基準測試機構(gòu) Artificial Analysis 榜單。并且在全球首個參考生榜單,SuperClue 榜單中,Vidu Q3 斷層登頂,一舉拿下多圖 / 單圖參考任務(wù)雙榜第一?。?/p>

剛才的國漫小片段,所需要的素材,僅僅就是一個人物主體、一張背景圖,再搭配一段 Prompt 即可:

甚至你只需要一張參考圖,Prompt 描述到位,也可以解鎖類似柳神的國漫效果:

不只是準備工作需要得少,這次 Vidu Q3 的參考生視頻,感覺就像把一個完整劇組擺到了你面前:

6 大特效:粒子、流體、動力學、運鏡、轉(zhuǎn)場、光影,通過自然語言就能控制

5 大音效:環(huán)境、動態(tài)、氛圍、擬音、情緒,聽覺也有了敘事連續(xù)性

4 大場景:短劇、漫劇、影視劇、廣告核心場景提升了能力,可作為商用的內(nèi)容單元

嗯,不難看出,Vidu Q3 是沖著而來的。

萬物皆可參考,人人都有一個影視庫

那么 Vidu Q3 到底能把劇做到什么程度,我們接下來就從特效、音效和場景三大角度來一波實測。

六大特效,把想象力給 " 畫 " 出來

首先是特效方面,我們實測的是一段未來科幻賽博風的視頻,先來準備三張圖:

然后我們再給 Vidu Q3 輸入一段 Prompt:

豎屏 9 比 6,高清科幻質(zhì)感,電影級動態(tài)運鏡;機甲戰(zhàn)士激活核心,藍紫霓虹粒子束噴涌而出,流體能量光帶環(huán)繞周身,金屬機甲動力學形變自然絲滑;抬手釋放等離子護盾,光影體積光穿透煙霧,鏡頭極速推進 +360 ° 環(huán)繞轉(zhuǎn)場,建筑破碎、碎片飛濺遵循真實物理碰撞;全程無對白,僅保留高能科幻特效轟鳴,10 秒無崩壞,成片級未來科技視覺沖擊力拉滿。

在稍等片刻之后,特效拉滿的視頻片段就誕生了:

可以看到,視頻中的特效內(nèi)容、運鏡等等,都和 Prompt 中的要求做到了一致。

區(qū)別于其他模型單一特效疊加的生硬感,Vidu Q3 參考生視頻的特效高度服務(wù)于劇情節(jié)奏,光影明暗呼應(yīng)情緒起伏,運鏡轉(zhuǎn)場貼合敘事邏輯。

而且是幾張參考圖和一段 Prompt 就能解鎖影視級特效的那種。

更宏觀、更細節(jié)、更天馬行空的特效,現(xiàn)在拿著 Vidu Q3 也是手拿把掐:

鎖定參考圖 @圖 2 星云主體 + @圖 1 星環(huán)場景,全程無人物,純宏觀宇宙視覺,6 秒無縫連貫,無崩壞;粒子 / 流體 / 光影 / 運鏡四大特效拉滿,低頻宇宙轟鳴音效,史詩級沉浸感 0-2s 上帝視角俯沖推進,深空暗藍基底,鎏金星塵粒子呈漩渦狀流體涌動,體積光穿透星云,光暈彌散 2-4s 鏡頭 360 ° 環(huán)繞拉升,巨型星環(huán)緩緩自轉(zhuǎn),碎星剛體動力學漂浮碰撞,藍紫能量光帶環(huán)繞星環(huán)流轉(zhuǎn) 4-6s 中心超新星微光爆發(fā),金白粒子射線輻射全域,光影明暗極致對比,定格浩瀚宇宙史詩畫面,音效低頻震顫收尾。

像下面這個火焰特效,是直接可以在電影中使用的程度:

動漫中的華麗特效亦是如此:

五大音效,聽聲音就很有感覺

接下來,我們繼續(xù)實測一下音效方面的能力。

同樣是先丟兩張圖進來,但這次設(shè)計的 Prompt 將更加聚焦于聲音:

圖 1 一條茂密的雨林小徑,兩側(cè)高聳松樹形成天然走廊。中景霧氣緩緩飄移,降低能見度。背景樹木逐漸隱入灰白雨幕。雨滴持續(xù)穿過樹冠,落在潮濕的樹葉和地面水洼上。景深大,鏡頭沿小徑緩慢前移,沉浸寧靜氛圍,寫實風格,平滑運動,自然雨動態(tài)。圖 2 在圖一的中間走著。不要音樂,只要環(huán)境音

在沒有任何背景音樂的情況下,雨中漫步的感覺就通過音效傳遞出來了:

以及像影視片段里經(jīng)??吹脚髟谖枧_演唱,Vidu Q3 也能把唱歌這事給 hold ?。?/p>

0-2s 慢推近景,女生指尖撥動吉他琴弦,發(fā)絲隨動作輕揚,舞臺暖光柔焦閃爍,吉他弦震動擬音清晰自然 2-4s 固定中景,女生開口彈唱 " 星光為我加冕,歌聲奔赴山海 ",口型精準匹配歌詞,音色清甜元氣,環(huán)境音適配舞臺混響,光影隨旋律明暗律動音效配置:吉他彈奏原聲、舞臺空間混響、輕柔氛圍音,聽覺層次飽滿,人聲與伴奏融合自然

四大場景,總有一個是你需要的

除了上面提到的動漫、電影,再來看下一個快節(jié)奏短劇的實測:

有一說一,這個質(zhì)感,乍一看真還以為是真人出演的短劇了。

最后,我們再來看下 Vidu Q3 參考生視頻做廣告視頻的能力,Prompt 如下:

豎屏 9 比 16,輕奢廣告大片質(zhì)感,特寫 + 中景無縫切換;柔光冷調(diào)光影,模特指尖輕捏唇釉,瓶身鎏金光澤細膩,特寫鏡頭展示唇釉絲絨質(zhì)地,上唇絲滑無卡紋;無多余臺詞,僅高端畫外音:" 一抹鎏金,定義高級質(zhì)感 ";音效極簡高級(瓶身碰撞輕響、膏體絲滑摩擦音),背景無雜音,人物妝容精致統(tǒng)一,鏡頭高級不浮夸,適配美妝廣告批量生成、多版本迭代。

同樣依舊是穩(wěn)穩(wěn)實現(xiàn)了 Prompt 中的各種細節(jié)要求,有了 Vidu Q3 參考生,現(xiàn)在做個廣告也是圖片 + 自然語言就能搞定的事了。

參考生優(yōu)等生,不斷自己超越自己

在整體實測過后,最大的感受或許就是——

曾經(jīng) AI 視頻圈子里比拼的一致性等問題,到了 Vidu Q3 參考生視頻這里已經(jīng)是個基本項,它追求的是一種全新的內(nèi)容生產(chǎn)范式。

萬物可參,是 Vidu Q3 最核心的突破。角色形象、場景布景、服化道細節(jié)、核心視覺元素全部支持可復用建模,創(chuàng)作者無需再依賴一次性隨機生成,而是像搭建專業(yè)影視素材庫一般,自由組合、反復調(diào)用、靈活迭代,每一次生成都能穩(wěn)定輸出專業(yè)級、影視級的標準化內(nèi)容,解決了 AI 視頻創(chuàng)作中風格割裂、形象崩壞、細節(jié)失控的行業(yè)痛點,讓低成本、高質(zhì)量的批量內(nèi)容生產(chǎn)成為現(xiàn)實。

回顧 Vidu 清晰的模型演進路線,我們能完整窺見 AI 影視創(chuàng)作從 0 到 1、從能用至好用的全進化軌跡。

Q1 版本重新定義敘事邏輯,夯實了 AI 視頻基礎(chǔ)生成能力;Q2 版本解鎖 AI 演技,賦予虛擬角色靈動的微表情與肢體表現(xiàn)力,打破虛擬人物僵硬感;而全新的 Q3 版本,正式宣告 AI 視頻工具邁入工業(yè)化內(nèi)容生產(chǎn)階段,以" 為劇而生 "為核心定位,徹底轉(zhuǎn)型為可落地、可商用的專業(yè)影視創(chuàng)作生產(chǎn)力工具。

更值得一提的,是 Vidu Q3 打造的參考生全家桶全鏈路生態(tài)。模型層面,完整覆蓋文生視頻、圖生視頻、參考生視頻三大核心能力,形成無死角創(chuàng)作矩陣;服務(wù)層面,以 Q3 模型為核心底座,Vidu SaaS(Vidu Agent、Vidu Claw)、Vidu MaaS(Vidu AI 開放平臺、Vidu.API)全面接入核心能力,構(gòu)建起創(chuàng)作、生產(chǎn)、交付一體化的閉環(huán)服務(wù)體系。

同時,Vidu Q3 兼顧了專業(yè)性與普惠性:0 門檻快速上手,價格僅為行業(yè)平均水平的 1/3,生成速度快、鏡頭切鏡自然流暢,即便在使用高峰期也能保持穩(wěn)定輸出,還支持定制化提示詞調(diào)優(yōu)、全流程工作流適配。無論是個人獨立創(chuàng)作者、短視頻工作室,還是影視制作公司、品牌廣告團隊,都能低成本接入,快速將創(chuàng)意轉(zhuǎn)化為可直接交付的成片內(nèi)容。

從技術(shù)突破到生態(tài)落地,從創(chuàng)意生成到商用交付,Vidu Q3 用一次次自我迭代,重新定義了 AI 視頻的行業(yè)標準。一句 "Action"、幾張參考圖、一段文字指令,人人都能化身專業(yè)導演,一鍵開拍影視級大片,這便是 Vidu 獻給整個內(nèi)容行業(yè)的全新答案。

最后,送上一波福利:

輸入專屬邀請碼:JQZXN3,登陸 Vidu.cn。注冊即送 500 積分。

一鍵三連「點贊」「轉(zhuǎn)發(fā)」「小心心」

歡迎在評論區(qū)留下你的想法!

點亮星標

科技前沿進展每日見

相關(guān)標簽

覺得文章不錯,微信掃描分享好友

掃碼分享

企業(yè)資訊

查看更多內(nèi)容