在小說閱讀器讀本章
去閱讀
咱就是說啊,這年頭做一個小短劇,真的不要太簡單。
因為,現(xiàn)在手搓一集國漫小短劇,真的是幾張圖就能搞定!
話不多說,直接來看效果:
不論是打斗的特效還是背景音效、人物的旁白,都是一鍋出的那種!
這就是生數(shù)科技 Vidu Q3正式發(fā)布的參考生視頻,主打的就是一個為劇而生,萬物可參,聲畫同出。
(早在 Vidu Q3 在今年 1 月發(fā)布的時候,它就登頂了國際權(quán)威 AI 基準測試機構(gòu) Artificial Analysis 榜單。并且在全球首個參考生榜單,SuperClue 榜單中,Vidu Q3 斷層登頂,一舉拿下多圖 / 單圖參考任務(wù)雙榜第一?。?/p>
剛才的國漫小片段,所需要的素材,僅僅就是一個人物主體、一張背景圖,再搭配一段 Prompt 即可:


6 大特效:粒子、流體、動力學、運鏡、轉(zhuǎn)場、光影,通過自然語言就能控制
5 大音效:環(huán)境、動態(tài)、氛圍、擬音、情緒,聽覺也有了敘事連續(xù)性
4 大場景:短劇、漫劇、影視劇、廣告核心場景提升了能力,可作為商用的內(nèi)容單元
嗯,不難看出,Vidu Q3 是沖著劇而來的。
萬物皆可參考,人人都有一個影視庫
那么 Vidu Q3 到底能把劇做到什么程度,我們接下來就從特效、音效和場景三大角度來一波實測。
六大特效,把想象力給 " 畫 " 出來
首先是特效方面,我們實測的是一段未來科幻賽博風的視頻,先來準備三張圖:

豎屏 9 比 6,高清科幻質(zhì)感,電影級動態(tài)運鏡;機甲戰(zhàn)士激活核心,藍紫霓虹粒子束噴涌而出,流體能量光帶環(huán)繞周身,金屬機甲動力學形變自然絲滑;抬手釋放等離子護盾,光影體積光穿透煙霧,鏡頭極速推進 +360 ° 環(huán)繞轉(zhuǎn)場,建筑破碎、碎片飛濺遵循真實物理碰撞;全程無對白,僅保留高能科幻特效轟鳴,10 秒無崩壞,成片級未來科技視覺沖擊力拉滿。
在稍等片刻之后,特效拉滿的視頻片段就誕生了:
可以看到,視頻中的特效內(nèi)容、運鏡等等,都和 Prompt 中的要求做到了一致。
區(qū)別于其他模型單一特效疊加的生硬感,Vidu Q3 參考生視頻的特效高度服務(wù)于劇情節(jié)奏,光影明暗呼應(yīng)情緒起伏,運鏡轉(zhuǎn)場貼合敘事邏輯。
而且是幾張參考圖和一段 Prompt 就能解鎖影視級特效的那種。
更宏觀、更細節(jié)、更天馬行空的特效,現(xiàn)在拿著 Vidu Q3 也是手拿把掐:
鎖定參考圖 @圖 2 星云主體 + @圖 1 星環(huán)場景,全程無人物,純宏觀宇宙視覺,6 秒無縫連貫,無崩壞;粒子 / 流體 / 光影 / 運鏡四大特效拉滿,低頻宇宙轟鳴音效,史詩級沉浸感 0-2s 上帝視角俯沖推進,深空暗藍基底,鎏金星塵粒子呈漩渦狀流體涌動,體積光穿透星云,光暈彌散 2-4s 鏡頭 360 ° 環(huán)繞拉升,巨型星環(huán)緩緩自轉(zhuǎn),碎星剛體動力學漂浮碰撞,藍紫能量光帶環(huán)繞星環(huán)流轉(zhuǎn) 4-6s 中心超新星微光爆發(fā),金白粒子射線輻射全域,光影明暗極致對比,定格浩瀚宇宙史詩畫面,音效低頻震顫收尾。
像下面這個火焰特效,是直接可以在電影中使用的程度:
動漫中的華麗特效亦是如此:
五大音效,聽聲音就很有感覺
接下來,我們繼續(xù)實測一下音效方面的能力。
同樣是先丟兩張圖進來,但這次設(shè)計的 Prompt 將更加聚焦于聲音:
圖 1 一條茂密的雨林小徑,兩側(cè)高聳松樹形成天然走廊。中景霧氣緩緩飄移,降低能見度。背景樹木逐漸隱入灰白雨幕。雨滴持續(xù)穿過樹冠,落在潮濕的樹葉和地面水洼上。景深大,鏡頭沿小徑緩慢前移,沉浸寧靜氛圍,寫實風格,平滑運動,自然雨動態(tài)。圖 2 在圖一的中間走著。不要音樂,只要環(huán)境音

以及像影視片段里經(jīng)??吹脚髟谖枧_演唱,Vidu Q3 也能把唱歌這事給 hold ?。?/p>
0-2s 慢推近景,女生指尖撥動吉他琴弦,發(fā)絲隨動作輕揚,舞臺暖光柔焦閃爍,吉他弦震動擬音清晰自然 2-4s 固定中景,女生開口彈唱 " 星光為我加冕,歌聲奔赴山海 ",口型精準匹配歌詞,音色清甜元氣,環(huán)境音適配舞臺混響,光影隨旋律明暗律動音效配置:吉他彈奏原聲、舞臺空間混響、輕柔氛圍音,聽覺層次飽滿,人聲與伴奏融合自然
四大場景,總有一個是你需要的
除了上面提到的動漫、電影,再來看下一個快節(jié)奏短劇的實測:
有一說一,這個質(zhì)感,乍一看真還以為是真人出演的短劇了。
最后,我們再來看下 Vidu Q3 參考生視頻做廣告視頻的能力,Prompt 如下:
豎屏 9 比 16,輕奢廣告大片質(zhì)感,特寫 + 中景無縫切換;柔光冷調(diào)光影,模特指尖輕捏唇釉,瓶身鎏金光澤細膩,特寫鏡頭展示唇釉絲絨質(zhì)地,上唇絲滑無卡紋;無多余臺詞,僅高端畫外音:" 一抹鎏金,定義高級質(zhì)感 ";音效極簡高級(瓶身碰撞輕響、膏體絲滑摩擦音),背景無雜音,人物妝容精致統(tǒng)一,鏡頭高級不浮夸,適配美妝廣告批量生成、多版本迭代。
同樣依舊是穩(wěn)穩(wěn)實現(xiàn)了 Prompt 中的各種細節(jié)要求,有了 Vidu Q3 參考生,現(xiàn)在做個廣告也是圖片 + 自然語言就能搞定的事了。
參考生優(yōu)等生,不斷自己超越自己
在整體實測過后,最大的感受或許就是——
曾經(jīng) AI 視頻圈子里比拼的一致性等問題,到了 Vidu Q3 參考生視頻這里已經(jīng)是個基本項,它追求的是一種全新的內(nèi)容生產(chǎn)范式。
萬物可參,是 Vidu Q3 最核心的突破。角色形象、場景布景、服化道細節(jié)、核心視覺元素全部支持可復用建模,創(chuàng)作者無需再依賴一次性隨機生成,而是像搭建專業(yè)影視素材庫一般,自由組合、反復調(diào)用、靈活迭代,每一次生成都能穩(wěn)定輸出專業(yè)級、影視級的標準化內(nèi)容,解決了 AI 視頻創(chuàng)作中風格割裂、形象崩壞、細節(jié)失控的行業(yè)痛點,讓低成本、高質(zhì)量的批量內(nèi)容生產(chǎn)成為現(xiàn)實。

Q1 版本重新定義敘事邏輯,夯實了 AI 視頻基礎(chǔ)生成能力;Q2 版本解鎖 AI 演技,賦予虛擬角色靈動的微表情與肢體表現(xiàn)力,打破虛擬人物僵硬感;而全新的 Q3 版本,正式宣告 AI 視頻工具邁入工業(yè)化內(nèi)容生產(chǎn)階段,以" 為劇而生 "為核心定位,徹底轉(zhuǎn)型為可落地、可商用的專業(yè)影視創(chuàng)作生產(chǎn)力工具。
更值得一提的,是 Vidu Q3 打造的參考生全家桶全鏈路生態(tài)。模型層面,完整覆蓋文生視頻、圖生視頻、參考生視頻三大核心能力,形成無死角創(chuàng)作矩陣;服務(wù)層面,以 Q3 模型為核心底座,Vidu SaaS(Vidu Agent、Vidu Claw)、Vidu MaaS(Vidu AI 開放平臺、Vidu.API)全面接入核心能力,構(gòu)建起創(chuàng)作、生產(chǎn)、交付一體化的閉環(huán)服務(wù)體系。
同時,Vidu Q3 兼顧了專業(yè)性與普惠性:0 門檻快速上手,價格僅為行業(yè)平均水平的 1/3,生成速度快、鏡頭切鏡自然流暢,即便在使用高峰期也能保持穩(wěn)定輸出,還支持定制化提示詞調(diào)優(yōu)、全流程工作流適配。無論是個人獨立創(chuàng)作者、短視頻工作室,還是影視制作公司、品牌廣告團隊,都能低成本接入,快速將創(chuàng)意轉(zhuǎn)化為可直接交付的成片內(nèi)容。
從技術(shù)突破到生態(tài)落地,從創(chuàng)意生成到商用交付,Vidu Q3 用一次次自我迭代,重新定義了 AI 視頻的行業(yè)標準。一句 "Action"、幾張參考圖、一段文字指令,人人都能化身專業(yè)導演,一鍵開拍影視級大片,這便是 Vidu 獻給整個內(nèi)容行業(yè)的全新答案。
最后,送上一波福利:
輸入專屬邀請碼:JQZXN3,登陸 Vidu.cn。注冊即送 500 積分。
一鍵三連「點贊」「轉(zhuǎn)發(fā)」「小心心」
歡迎在評論區(qū)留下你的想法!
— 完 —
點亮星標
科技前沿進展每日見