电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER 合作

Vidu Q3 悶聲放大招,參考生之王回歸,漫劇短劇影視廣告的好日子來(lái)了

1977 年,喬治 · 盧卡斯為了拍《星球大戰(zhàn)》,專門成立了一家公司,叫工業(yè)光魔。

究其原因,當(dāng)時(shí)根本沒(méi)有任何現(xiàn)成的工具,能實(shí)現(xiàn)他腦子里的那些畫面。這家公司后來(lái)成了好萊塢特效工業(yè)的基石。但它能做到的事,在相當(dāng)長(zhǎng)的時(shí)間里,只屬于有能力養(yǎng)得起它的那些劇組。

鏡頭語(yǔ)言、音效層次、特效密度,它們共同決定了一部作品的「成片感」,但構(gòu)建它們需要的資源,把絕大多數(shù)創(chuàng)作者擋在了門外。

直到生成式 AI 掀翻了牌桌,這道高墻才第一次真正出現(xiàn)裂縫。

門檻是降了,可 AI 卻像個(gè)難以馴服的「抽卡盲盒」。極差的「一致性」,成了 AI 視頻邁向可用階段最要命的攔路虎。針對(duì)這個(gè)問(wèn)題,由國(guó)內(nèi)生數(shù)科技開(kāi)發(fā)的視頻生成大模型 Vidu 兩年前在業(yè)界首創(chuàng)了參考生功能。

角色、場(chǎng)景、服化道,全部可以作為參考輸入,AI 在你給定的視覺(jué)錨點(diǎn)上展開(kāi)創(chuàng)作,整套素材庫(kù)可以復(fù)用。最近,APPSO 注意到,Vidu Q3 參考生功能也正式上線。

值得一提的是,今年 1 月,Vidu Q3 發(fā)布后登頂了國(guó)際權(quán)威 AI 基準(zhǔn)測(cè)試機(jī)構(gòu) Artificial Analysis 榜單,這份真刀真槍拼出來(lái)的榜單成績(jī),也讓后續(xù)一系列能力升級(jí)有了更厚實(shí)的底氣。

工業(yè)光魔用了幾十年,才將「能拍出來(lái)」這件事的門檻大幅拉低。如今,Vidu Q3 的野心更大,要給劇組的每一個(gè)工種配一個(gè) AI 副手,讓每一個(gè)創(chuàng)作者,都站在同一條、也是更高的起跑線上。

AI 視頻生成的盡頭,是把重心還給「講故事」

如果說(shuō) Vidu Q1 是在建立基礎(chǔ)的敘事能力,Q2 是讓角色開(kāi)始懂一點(diǎn)「演戲」,那 Q3 的目標(biāo)就只有一個(gè):讓生成的內(nèi)容直接嵌入制作流程。

為了做到這一點(diǎn),Q3 參考生在特效、音效、場(chǎng)景三個(gè)維度上做了系統(tǒng)性升級(jí)。六大特效(粒子、流體、動(dòng)力學(xué)、運(yùn)鏡、轉(zhuǎn)場(chǎng)、光影)、五大音效(環(huán)境、動(dòng)態(tài)、氛圍、擬音、情緒)、四大場(chǎng)景(漫劇、短劇、影視劇、廣告)的創(chuàng)作,全部圍繞著一個(gè)核心:

讓 AI 視頻生成真正為劇而生。

這套能力管不管用?我們可以掰開(kāi)來(lái)看看,Vidu Q3 是怎么摳細(xì)節(jié)的。

漫?。耗阒挥辛泓c(diǎn)幾秒的時(shí)間留住觀眾

漫劇是對(duì)特效要求最直接的場(chǎng)景。

受眾不在乎畫面像不像真實(shí),但對(duì)動(dòng)作戲有沒(méi)有爽感極為敏感。一刀劈下去沒(méi)有沖擊力,一拳打出去沒(méi)有震感,觀眾會(huì)直接劃走。這個(gè)判斷發(fā)生在零點(diǎn)幾秒之內(nèi),沒(méi)有商量余地。

Vidu Q3 的粒子加動(dòng)力學(xué)組合,正好命中這個(gè)痛點(diǎn)。

仙俠戰(zhàn)場(chǎng)那段,女主角站于山巔,雙手結(jié)印,暗金粒子從指縫溢出凝聚成旋轉(zhuǎn)符陣,符陣驟然爆裂,神劍破空而來(lái),刀鳴余震持續(xù)顫動(dòng),鏡頭隨劍飛行軌跡快速跟拍,定格至女主與神劍并肩的全景,粒子余燼在空中緩緩飄散。

這段畫面同時(shí)調(diào)度了粒子特效、運(yùn)鏡跟拍、動(dòng)力學(xué)沖擊和光影渲染。

能單獨(dú)生成這些不算稀奇,關(guān)鍵是這些元素的節(jié)奏全部服從敘事邏輯。粒子凝聚的速度、符陣爆裂的時(shí)機(jī)、鏡頭跟拍的弧線,都在配合「召喚神劍」這個(gè)敘事動(dòng)作的情緒節(jié)拍。

深空戰(zhàn)場(chǎng)的機(jī)甲對(duì)決案例同理。

藍(lán)色等離子重?fù)粜厍?,爆炸沖擊波以同心圓向外擴(kuò)散,碎片與金屬殘骸四射,機(jī)甲受損后發(fā)出電弧噼啪聲與機(jī)械嘶鳴。視覺(jué)沖擊力和音效層次同步爆發(fā),每一層都在推進(jìn)戰(zhàn)斗敘事,而不是隨機(jī)無(wú)腦的感官轟炸。

哪怕下面這個(gè)案例中沒(méi)有大場(chǎng)面,沒(méi)有沖突爆發(fā),也能全靠氛圍撐場(chǎng)子。筆尖聲、鋼琴旋律、窗外若有若無(wú)的風(fēng)聲,互不搶戲。

短?。呵榫w是最難造假的東西

如果說(shuō)漫劇靠特效密度,短劇靠的則是克制。短劇不需要大場(chǎng)面,但每一幀都得言之有物。

宮廷相遇戲里,兩人相距不足一步卻又各懷心事。鏡頭以兩人為軸心做慢動(dòng)作環(huán)繞,光影在落花與衣袂間流動(dòng)。畫面靜,情緒滿。這種氛圍的成立,七成靠音效,三成靠畫面。氛圍音賦予場(chǎng)景呼吸感,運(yùn)鏡特效讓情緒在視覺(jué)層面被放大,兩者缺一不可。

雪夜離宮戲則是更明顯的案例,鏡頭極緩?fù)七M(jìn)那只握緊袍袖的手,女主背影越來(lái)越小,風(fēng)雪越來(lái)越大,皇子始終立在原處,一步未動(dòng),全程沒(méi)有臺(tái)詞。

即便敘事完全交給了鏡頭調(diào)度和環(huán)境音。雪聲、風(fēng)聲、腳步聲,這些細(xì)節(jié)構(gòu)成了場(chǎng)景的「底色」,一旦消失,整場(chǎng)戲的情緒就塌了。由于 Vidu Q3 對(duì)氛圍音這一層有專門建模,也讓生成視頻第一次有了真實(shí)的空間感。

影視?。喝攵ㄉ赖摹纲|(zhì)感」從哪來(lái)

進(jìn)入影視劇,質(zhì)感成了三秒內(nèi)決定觀眾去留的關(guān)鍵。而質(zhì)感,是聲音和畫面同時(shí)對(duì)齊的結(jié)果。

飆車戲里,黑色改裝跑車以極速切入彎道,輪胎與地面摩擦發(fā)出刺耳嘯聲,后視鏡中出現(xiàn)追擊車燈越來(lái)越近,主角踩死油門,發(fā)動(dòng)機(jī)轟鳴音調(diào)驟然拉高,車身側(cè)滑甩尾,水花在車身兩側(cè)炸開(kāi)。

雨聲、發(fā)動(dòng)機(jī)聲、心跳聲,三軌音效交疊。

戰(zhàn)場(chǎng)戲的音效設(shè)計(jì)更說(shuō)明問(wèn)題。

炮彈落點(diǎn)極近,沖擊波將士兵掀倒在地,落地瞬間聲音驟然壓低,變成沉悶的耳鳴聲,一切慢動(dòng)作化。隨后耳鳴逐漸消退,槍炮聲、戰(zhàn)友呼喊聲與金屬碰撞聲重新涌入,從壓制到爆發(fā),層次感極強(qiáng)。

廣告:記住,才是唯一的 KPI

對(duì)于商業(yè)廣告的評(píng)判標(biāo)準(zhǔn),看完之后能否留下記憶點(diǎn)幾乎是唯一的標(biāo)準(zhǔn)。

運(yùn)動(dòng)員從黑暗中沖出,每一步落地激起地面破碎的動(dòng)力學(xué)特效,混凝土以沖擊點(diǎn)為圓心炸裂,碎片向外飛散,鞋底離地瞬間爆發(fā)橙色殘影光軌。節(jié)拍鼓點(diǎn)與特效爆發(fā)點(diǎn)精確同步,每次落地等于一個(gè)鼓點(diǎn)。

再比如這個(gè)香水廣告,在極致黑色場(chǎng)景,琥珀色液體超慢動(dòng)作溢出,金霧粒子向四周飄散。大腦也因此自動(dòng)補(bǔ)全了「奢侈品現(xiàn)場(chǎng)感」。

一個(gè)靠轟炸,一個(gè)靠克制,能同時(shí)走通這兩條路,才是真正意義上的「覆蓋寬度夠用」。這也是 AI 生成內(nèi)容過(guò)去最難拿捏的地方,因?yàn)椤阜执绺小惯@東西,你很難用參數(shù)來(lái)描述它,但你一眼就能看出來(lái)有沒(méi)有。

當(dāng)然,Vidu Q3 的能力覆蓋遠(yuǎn)不止于此。選擇這些主流場(chǎng)景進(jìn)行驗(yàn)證,正是因?yàn)樗鼈儗?duì)「可交付成品」的要求天差地別,恰恰能印證 Q3 版本的能力寬度。

出片即交付,Vidu Q3 讓「夠用」變成了「好用」

回頭看前面這四個(gè)場(chǎng)景。漫劇要爽感,短劇要情緒,影視劇要質(zhì)感,廣告要記憶點(diǎn),能力走通,只是第一步。接下來(lái)的問(wèn)題是:這套能力,怎么真正進(jìn)入創(chuàng)作者的工作流?

Vidu Q3 參考生的能力,并沒(méi)有被鎖在單一的產(chǎn)品形態(tài)里。

模型層由 Vidu Q3 提供參考生能力與敘事生成的基礎(chǔ),并通過(guò) MaaS(Vidu AI 開(kāi)放平臺(tái),Vidu.API)和 SaaS(Vidu Agent、Vidu Claw)等方式向全球開(kāi)發(fā)者、創(chuàng)作者和企業(yè)提供服務(wù)。

其中,MaaS 企業(yè)服務(wù)已做到行業(yè)第一,對(duì)比同類產(chǎn)品,在合作層面具備多項(xiàng)差異化優(yōu)勢(shì):0 門檻接入、1/3 的行業(yè)價(jià)格、合理的切鏡邏輯、更快的生成速度、提示詞調(diào)優(yōu)支持、靈活的工作流適配、配套培訓(xùn)服務(wù),以及高峰期依然流暢的使用體驗(yàn)。

使用邀請(qǐng)碼 APPSON3,登錄 Vidu.cn 即可快速體驗(yàn)最新的 Q3 參考生功能,同時(shí)獲贈(zèng) 500 積分。

無(wú)論用哪個(gè)入口,調(diào)用的都是同一套視覺(jué)錨點(diǎn)邏輯和敘事生成能力。

一套素材庫(kù),在不同平臺(tái)、不同工具里反復(fù)調(diào)用,角色設(shè)定不需要為每個(gè)環(huán)境單獨(dú)重建一次。以前靠時(shí)間和人力堆出來(lái)的「風(fēng)格一致性」,現(xiàn)在變成了一個(gè)可以被系統(tǒng)性管理的參數(shù)。

這套能力組合最終指向一個(gè)再清晰不過(guò)的結(jié)論:大模型的生產(chǎn)能力,終于真正嵌入了實(shí)際內(nèi)容生產(chǎn)的每個(gè)環(huán)節(jié)。

放到具體場(chǎng)景里就更直觀:做漫劇時(shí),以往極難處理的連貫打斗鏡頭,現(xiàn)在可以輕松生成;做短劇時(shí),角色的微表情不再僵硬如木偶,多了真實(shí)可感的情緒與人情味;

做影視后期的聲音設(shè)計(jì),AI 生成的音軌可以自然融入原有素材;而在廣告制作中,畫面節(jié)奏與音樂(lè)節(jié)拍的對(duì)齊,在模型生成階段就已自動(dòng)完成。創(chuàng)作者拿到的初稿,本身就是一份完成度極高的成品。

發(fā)現(xiàn)了嗎?這些能力,在以前意味著需要特效師、剪輯師、聲音設(shè)計(jì)師等多方頻繁溝通、協(xié)同作業(yè)才能交付。而現(xiàn)在,它們成了 Vidu Q3 最基礎(chǔ)的基準(zhǔn)輸出。

漫劇、短劇、影視劇、廣告,這些領(lǐng)域都有著共同的痛點(diǎn):內(nèi)容需求巨大、人力成本極高、迭代周期漫長(zhǎng)。以前,大家靠堆人力和時(shí)間來(lái)趕進(jìn)度;現(xiàn)在,一套清晰的降本增效邏輯正在重新丈量這些行業(yè)。

這背后藏著一條關(guān)鍵邏輯。當(dāng)模型的基準(zhǔn)輸出直接達(dá)到可用級(jí)別,協(xié)作鏈條上最耗時(shí)、最容易內(nèi)耗的一環(huán)就自然瓦解了:所有人對(duì)齊同一個(gè)視覺(jué)意圖,過(guò)去被溝通和試錯(cuò)消耗掉的時(shí)間,現(xiàn)在可以全部還給創(chuàng)作本身。

我們常說(shuō) AI 要落地,什么是真正的落地?不是在社交媒體上拿幾十萬(wàn)個(gè)點(diǎn)贊,也不是跑分榜單上的第一名。真正的落地只有一個(gè)標(biāo)準(zhǔn):出片即可用,不用反復(fù)抽卡,初稿就是成品。

可以說(shuō),工業(yè)級(jí)內(nèi)容交付的邊界,第一次這么真實(shí)地向普通創(chuàng)作者和中小團(tuán)隊(duì)敞開(kāi)了。當(dāng) Vidu Q3 已經(jīng)備好了最高規(guī)格的視聽(tīng)語(yǔ)言。那接下來(lái)的問(wèn)題,就變得愈發(fā)純粹了:

面對(duì)這臺(tái)轟鳴的工業(yè)級(jí)引擎,你打算用它,講一個(gè)怎樣的故事?

相關(guān)標(biāo)簽

相關(guān)閱讀

最新評(píng)論

沒(méi)有更多評(píng)論了
愛(ài)范兒

愛(ài)范兒

發(fā)現(xiàn)創(chuàng)新價(jià)值的科技媒體

訂閱

覺(jué)得文章不錯(cuò),微信掃描分享好友

掃碼分享

企業(yè)資訊

查看更多內(nèi)容