电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER 合作

Sora 關(guān)停 13 天后 “歡樂(lè)馬”橫空出世 國(guó)產(chǎn)視頻模型為何能打?

《科創(chuàng)板日?qǐng)?bào)》4 月 10 日訊 3 月 25 日,OpenAI 宣布正式關(guān)停旗下視頻模型產(chǎn)品 Sora。僅 13 天后,國(guó)產(chǎn)視頻模型 " 歡樂(lè)馬 "HappyHorse 橫空出世,并以 1300 的高分迅速屠榜 Artificial Analysis。

據(jù)悉,Artificial Analysis 是當(dāng)今權(quán)威的 AI 評(píng)測(cè)平臺(tái),在該平臺(tái)視頻競(jìng)技場(chǎng)前 15 名榜單中,可以看到字節(jié)跳動(dòng) Seedance 2.0、昆侖萬(wàn)維 SkyReels V4、快手可靈 3.0 等一眾國(guó)產(chǎn)視頻模型的身影。相比之下,以谷歌 Veo 為代表的海外視頻模型僅占據(jù)寥寥幾個(gè)席位。

圖源:Artificial Analysis

Artificial Analysis 視頻競(jìng)技場(chǎng)的排名核心依據(jù)為 " 人類(lèi)盲測(cè)投票 +Elo 評(píng)分系統(tǒng) ":在同一提示詞下,平臺(tái)隨機(jī)選取兩個(gè)模型生成視頻,用戶僅根據(jù)觀看體驗(yàn),投票選擇 " 更好的一段視頻 ",隨后被選中的模型得分,落選的模型失分,并依照分?jǐn)?shù)實(shí)時(shí)生成排名。根據(jù)當(dāng)前結(jié)果,顯然國(guó)產(chǎn)視頻模型在盲測(cè)中更受用戶偏好。

國(guó)盛證券援引業(yè)內(nèi)人士表示,由于 AI 生成的視頻畫(huà)面具備一定隨機(jī)性,因此每次生成的內(nèi)容未必滿意,用戶需要同一提示詞使用多次,才能得到滿意的結(jié)果,業(yè)內(nèi)俗稱(chēng) " 抽卡 ",單個(gè)鏡頭的抽卡次數(shù)可以高達(dá) 7 次之多。

面對(duì)同樣的隨機(jī)性,為何國(guó)產(chǎn)視頻模型生成內(nèi)容更符合用戶審美?

從邏輯上看,模型生成的內(nèi)容能否獲得用戶青睞,與模型自身能力并無(wú)絕對(duì)關(guān)聯(lián),卻更多取決于視頻質(zhì)量(如人物一致性、生成穩(wěn)定性)本身。而這正是國(guó)產(chǎn)視頻模型廠商的發(fā)力方向。

以 HappyHorse 為例,150 億參數(shù)或許不及 Sora、谷歌 Veo 等 " 參數(shù)巨獸 ",但作為目前全球首個(gè)原生支持音視頻聯(lián)合生成的視頻模型,其原生支持英語(yǔ)、普通話、粵語(yǔ)、日語(yǔ)、韓語(yǔ)、德語(yǔ)、法語(yǔ)七種語(yǔ)言的唇形同步,詞錯(cuò)誤率在同類(lèi)開(kāi)源模型中最低。

此前爆火的快手可靈、字節(jié)跳動(dòng) Seedance 也具有相似的特質(zhì)。根據(jù)對(duì)比測(cè)試,可靈 2.0 文生視頻大模型與 Veo2 的勝負(fù)比為 205%,與 Sora 的勝負(fù)比為 367%,在人物一致性、生成穩(wěn)定性等方面遙遙領(lǐng)先;而 Seedance 2.0 憑借強(qiáng)大的中文理解能力、多模態(tài)的文件輸入功能以及對(duì)視頻敘事連貫性的深度優(yōu)化,在多維度敘事、創(chuàng)意生成方面形成獨(dú)特優(yōu)勢(shì)。

除了穩(wěn)定可控的 " 提示詞 - 生成 - 成片 " 路徑,國(guó)產(chǎn)視頻模型還具有獨(dú)到的平臺(tái)生態(tài)優(yōu)勢(shì)。

誠(chéng)然,字節(jié)跳動(dòng)、快手等不僅是視頻模型廠商,更是擁有完整 AI 模型系列的內(nèi)容平臺(tái)型玩家。一方面,如中金公司所言,擁有通用大模型的綜合參與者在進(jìn)軍垂類(lèi)模型時(shí)或擁有一定協(xié)同優(yōu)勢(shì),僅簡(jiǎn)單基于大模型開(kāi)發(fā)的應(yīng)用或競(jìng)爭(zhēng)力不足,而需要深度整合通用大模型和垂類(lèi)模型化學(xué)反應(yīng)。從這個(gè)角度,綜合巨頭確實(shí)存在體系化優(yōu)勢(shì)。

另一方面,上述機(jī)構(gòu)強(qiáng)調(diào),以快手可靈等為代表的產(chǎn)品核心定位是創(chuàng)作者創(chuàng)意工具或社區(qū),其用戶更關(guān)注輸出內(nèi)容質(zhì)量、價(jià)格、一致性等維度。太平洋證券表示,AI 視頻工具是模型能力轉(zhuǎn)化為實(shí)際生產(chǎn)力的載體,因其既依賴于模型技術(shù)支撐,又需專(zhuān)業(yè)視頻內(nèi)容制作實(shí)踐積累。未來(lái),擁有技術(shù)領(lǐng)先優(yōu)勢(shì)的 AI 視頻工具公司更易依托自身創(chuàng)作能力與平臺(tái)生態(tài),產(chǎn)出優(yōu)質(zhì)視頻內(nèi)容。

相關(guān)標(biāo)簽

相關(guān)閱讀

最新評(píng)論

沒(méi)有更多評(píng)論了
科創(chuàng)板日?qǐng)?bào)

科創(chuàng)板日?qǐng)?bào)

上交所科創(chuàng)板電報(bào),股市行情報(bào)道

訂閱

覺(jué)得文章不錯(cuò),微信掃描分享好友

掃碼分享

熱門(mén)推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容