快手可靈戰(zhàn)略提級(jí),視頻大模型混戰(zhàn)時(shí)代來了?觀點(diǎn)
快手可靈戰(zhàn)略提級(jí),視頻大模型混戰(zhàn)時(shí)代來了?
文:互聯(lián)網(wǎng)江湖 作者:劉致呈
有一陣子沒聊AI了,趁著最有時(shí)間,有點(diǎn)看法想跟大家交流。
DeepSeek誕生之后,各個(gè)行業(yè)朝氣蓬勃,百度把DeepSeek做進(jìn)了搜索,騰訊把大模型做進(jìn)了微信,各種行業(yè),各種產(chǎn)品都用上了語言大模型。
一場AI革命,已然發(fā)生了。
前十年,移動(dòng)互聯(lián)網(wǎng)時(shí)代掀起的流量革命,一開始是圖文,然后就是視頻。十年之后的今天,快手、抖音成了全網(wǎng)最大的“注意力黑洞”,虹吸著流量和以流量為生的業(yè)態(tài)。
往后看十年,AI亦如是。
DeepSeek改變了圖文交互、語言交互,今天的AI正在改變視頻交互。
從AI生文、AI生圖再到大模型生成視頻,這一進(jìn)化符合邏輯,也順應(yīng)歷史周期。問題是,新的周期之下,這場AI革命將由誰主導(dǎo)?
快手、抖音:天下英雄“惟使君與操耳”
今天的視頻大模型玩家,大概有這么幾類:
第一類是巨頭。
比如,騰訊混元視頻大模型、阿里通義萬相。
巨頭布局文生視頻,本質(zhì)上是布局入口,同時(shí)為未來業(yè)務(wù)端的需求做技術(shù)儲(chǔ)備。
騰訊做文生視頻,可以給視頻號(hào)做能力儲(chǔ)備,一旦有了真正需求,現(xiàn)成的模型就能拿來用,阿里也是一樣,淘寶越來越內(nèi)容化,文生視頻這個(gè)能力是留個(gè)后手。
符合大廠一貫的做派,我可以不用,但每個(gè)入口都要布局,每個(gè)能力都要面面俱到。如果賽道里有人跑通了,那就砸資源跟進(jìn)。
語言大模型上,騰訊不也是觀望了很久,直到DeepSeek出世,直接整合進(jìn)微信,摘了最大的果子。
第二類,是AI公司。
比如,商湯科技的V-ME,科大訊飛的訊飛繪鏡。
這些AI公司,囿于自身的實(shí)力以及資源限制,能夠在文生視頻上投入的資源并不多,更多的精力其實(shí)還是在自身業(yè)務(wù)。做大主營業(yè)務(wù)是核心KPI。做視頻大模型,陪跑的概率很大。
第三:短視頻平臺(tái)。
短視頻平臺(tái)核心就兩家:快手、抖音。
先來說快手。
最近,市面上有這么一則消息:快手成立了可靈 AI 事業(yè)部。快手高級(jí)副總裁蓋坤擔(dān)任可靈 AI 事業(yè)部負(fù)責(zé)人,AI戰(zhàn)略在快手內(nèi)部提升至最高級(jí)別。
這動(dòng)作是什么意思呢?
槍擦完了子彈上膛,玩兒真的了。
快手可靈AI增長是很猛的。今年2月份可靈 AI 累計(jì)營業(yè)收入已超過 1 億元,今年前三個(gè)月,可靈AI營收超過了2024年總和。商業(yè)化這塊兒,可靈AI很有爆發(fā)力。
快手可靈AI生成的視頻質(zhì)量很高,可靈AI2.0的產(chǎn)品能力已經(jīng)追平甚至部分超過Sora。目前定位于生產(chǎn)力工具。
生產(chǎn)力技術(shù)是最容易變現(xiàn)的。
AI的路線上,快手走的是當(dāng)年微軟走過的路子。
AI這樣的技術(shù),就是新時(shí)代的office,當(dāng)年微軟靠著office 、Windows掙得盆滿缽滿,就是因?yàn)檐浖鳛樯a(chǎn)力是一種剛需。
視頻大模型,只有先把生產(chǎn)力變現(xiàn)的邏輯跑通了,才能支撐后續(xù)源源不斷迭代。所以,快手內(nèi)部會(huì)上,蓋坤也提到要優(yōu)先保證模型效果,聚焦professional creators。
好產(chǎn)品是不缺用戶的。
可靈AI這一億的營收背后是 2200 萬用戶,1.5 萬開發(fā)者和企業(yè)客戶貢獻(xiàn)的。后續(xù)還會(huì)有多少付費(fèi)用戶,且看快手后續(xù)財(cái)報(bào)。
只是,這一個(gè)億就像是一個(gè)標(biāo)桿,后續(xù)視頻大模型能不能觸及商業(yè)化這個(gè)條線,一個(gè)小目標(biāo)就是個(gè)重要的參考系。
與快手不同,抖音走的是另一條路。
最近,豆包大模型團(tuán)隊(duì)組建了AGI 長期研究團(tuán)隊(duì),還發(fā)布 Seaweed-7B 模型,號(hào)稱能在25秒內(nèi)生成高質(zhì)量視頻。可見在視頻大模型上,抖音還是聚焦技術(shù)。
相比快手可靈AI,字節(jié)即夢在視頻生成效果上略顯粗糙,但體驗(yàn)門檻低。這反映出團(tuán)隊(duì)還在繼續(xù)打磨技術(shù)產(chǎn)品,并希望通過降低門檻,來把流量池做起來。
字節(jié)的優(yōu)勢是用戶流量池很大,做AI也是復(fù)制過去成功的路徑。當(dāng)年抖音做起來,也是走的這個(gè)路子。
如今APP工廠的優(yōu)勢還在延續(xù)。
說穿了,字節(jié)做即夢,重點(diǎn)是鋪量,內(nèi)核其實(shí)還是互聯(lián)網(wǎng)產(chǎn)品,并非“生產(chǎn)力邏輯”,而是“游戲運(yùn)營邏輯”。
策略上即夢“先免費(fèi)”,讓99%的輕度用戶免費(fèi)爽,然后反饋數(shù)據(jù)優(yōu)化版本,用1%的重度用戶買單。
是不是跟某些游戲策劃的腦回路很像?
這個(gè)策略最大的一個(gè)好處是,一方面版本可以繼續(xù)升級(jí),又有足夠的用戶交互反饋數(shù)據(jù)樣本來優(yōu)化模型,另一方面也能留一點(diǎn)商業(yè)化的火種。
但“游戲運(yùn)營”,本質(zhì)是個(gè) UGC的路子。這個(gè)策略能不能走下去,關(guān)鍵就在于用戶活躍度能不能維持下去。
維持用戶活躍度,其實(shí)還是得靠產(chǎn)品,產(chǎn)品好用自然就不缺用戶。所以怎么提升技術(shù),產(chǎn)品能力,是即夢眼下最需要解決的問題。
生產(chǎn)力邏輯也好,游戲運(yùn)營邏輯也罷,兩家路線各有優(yōu)劣,就看誰先能跑出來了。
生成式AI對(duì)于短視頻的意義,如同自動(dòng)駕駛對(duì)于網(wǎng)約車平臺(tái)的意義。這個(gè)業(yè)務(wù)做好了,與快手、抖音主業(yè)是有強(qiáng)大的協(xié)同效應(yīng)的。
這種協(xié)同效應(yīng),可能會(huì)進(jìn)一步改寫流量商業(yè)的底層規(guī)則。
視頻大模型,能不能革流量成本的命?
除了短視頻平臺(tái)本身,視頻大模型,還能顛覆很多。
從落地的角度來看,未來視頻大模型的確有兩個(gè)重要的方向。
一個(gè)是專業(yè)化方向。
視頻大模型,最直接的一個(gè)價(jià)值就是降低影視的生產(chǎn)成本。
Sora當(dāng)初之所以備受關(guān)注,是因?yàn)槿藗冾嵏擦巳藗儗?duì)于視覺生產(chǎn)力的認(rèn)知,覺得它能夠顛覆很多行業(yè)的生產(chǎn)方式。
比如,Sora會(huì)改變整個(gè)好萊塢的成本結(jié)構(gòu)。
一項(xiàng)新的技術(shù)、產(chǎn)品,先打透專業(yè)領(lǐng)域是一種普遍的規(guī)律。歷史上,很多偉大的互聯(lián)網(wǎng)產(chǎn)品,都是從B端到C端,比如最早的聊天軟件MSN就是應(yīng)用在商務(wù)端,到后來的QQ、微信普及,才擴(kuò)散到C端。
當(dāng)文生視頻大模型強(qiáng)到一定程度,就變成了魔法,就像魔幻小說里寫的,人人都有了“言出法隨”的能力。
一句話變成了一個(gè)鏡頭、一段視頻,這會(huì)革了攝影師的命。
比特幣有個(gè)口號(hào):“code is law”。代碼即法律。換到視頻生成大模型上就是:“word is movie”。
所述即所見。
放在影視行業(yè)里,所述即所見是很有價(jià)值的。
愛奇藝的自制劇有聲有色,但問題就是自制劇相當(dāng)耗費(fèi)資源,所以成本一直是個(gè)問題。
你看愛奇藝年報(bào),2024年愛奇藝總成本為219.5億,內(nèi)容成本就有157.1億。同年凈利潤同比暴跌60%。天眼查APP融資信息顯示,愛奇藝2018年上市,直到2023年度凈利潤才轉(zhuǎn)正。
這充分說明一個(gè)問題:好內(nèi)容,是要花很多成本打磨的。
《哪吒2》,比如《流浪地球》系列,成本都不低。原因就在于整個(gè)電影工業(yè)化成本的問題。我們的電影行業(yè)缺乏工業(yè)基礎(chǔ),好內(nèi)容的制作成本還是太高了。能解決這個(gè)問題的,目前看來只有AI。
在內(nèi)容行業(yè),降本這件事兒,是能解放創(chuàng)造力的。
人類歷史中,鐵器的大規(guī)模使用降低了農(nóng)業(yè)生產(chǎn)成本,人活著的成本降低了,才有了諸子百家、才會(huì)有文藝復(fù)興。
這幾年,影視行業(yè)很慘,大的影視公司都在降本,從降本來看,視頻大模型是個(gè)不錯(cuò)的方案。成本降下去了,好內(nèi)容多了,影視消費(fèi)也才能起得來。大家周末更愿意進(jìn)電影院了,也能帶動(dòng)其他服務(wù)消費(fèi)。
至此,服務(wù)消費(fèi)的正循環(huán)就有了。
專業(yè)化方向之外,視頻大模型的另一個(gè)方向是大眾化。
百度有一個(gè)產(chǎn)品叫“秒噠”,這個(gè)產(chǎn)品可以通過自然語言描述需求快速生成應(yīng)用程序,門檻很低。這個(gè)產(chǎn)品對(duì)于編程來說是劃時(shí)代的,有了這個(gè)產(chǎn)品,普通也能變成了程序員。
對(duì)于今天的內(nèi)容行業(yè)而言,文生視頻大模型也是劃時(shí)代的。這意味未來的內(nèi)容創(chuàng)作者數(shù)量可能再次井噴,流量基礎(chǔ)設(shè)施發(fā)生改變。
做內(nèi)容行業(yè)這么多年,我有這么一個(gè)感覺:內(nèi)容這個(gè)東西,本質(zhì)上是一種注意力貨幣,是會(huì)發(fā)生通縮的。也因此內(nèi)容越繁榮,供給越多,實(shí)際的單流量成本越低。
從圖文、到視頻,各種各樣的內(nèi)容暴增,單位流量成本是在一直降低的。
比如說,公眾號(hào)時(shí)代,圖文單位流量比搜索流量便宜。于是,微商崛起。短視頻時(shí)代,視頻平臺(tái)單位流量比圖文要便宜。然后直播帶貨崛起。
大模型時(shí)代,內(nèi)容供給成本降低,創(chuàng)作數(shù)量一定會(huì)再次暴增,到那時(shí)候,生成視頻的單位流量會(huì)不會(huì)更便宜?在此基礎(chǔ)上會(huì)不會(huì)有新商業(yè)形態(tài)?
我認(rèn)為這些都是可以期待的。
視頻大模型的價(jià)值,一方面在于改變成本,另一方面也在于改變?nèi)藗儎?chuàng)造信息世界的方式。
人們創(chuàng)造信息世界,主要靠三種方式:“碼字,代碼,拍攝”。
前兩種已經(jīng)被大模型顛覆,現(xiàn)在正經(jīng)歷的是第三種。
現(xiàn)在的互聯(lián)網(wǎng)上的大部分視覺內(nèi)容,要么拍照片,要么拍視頻上傳,太沒有效率了。不符合互聯(lián)網(wǎng)的基本邏輯:極致的效率。
AI天生就是效率機(jī)器。
幻方量化為什么能孵化出DeepSeek,因?yàn)榻鹑诒旧碜非髽O致效率,這與AI的基因是相契合的。
不能否認(rèn),內(nèi)容創(chuàng)作是需要?jiǎng)?chuàng)意的,創(chuàng)意這個(gè)東西,AI還不能完全替代人類,但有了這個(gè)效率工具,我們一定能加速進(jìn)入下一個(gè)視覺互聯(lián)網(wǎng)時(shí)代。
大模型生成視頻,只是推動(dòng)互聯(lián)網(wǎng)向下個(gè)時(shí)代變革的第一步,走出了這一步,也許離真正的元宇宙互聯(lián)網(wǎng)就不遠(yuǎn)了。
最后,行業(yè)格局未定,視頻大模型仍有變數(shù)。今天的可靈AI、即夢、通義萬相,一如當(dāng)年的微信、飛信、來往。
圖文AI領(lǐng)域,過去以為大家都以為最后的王者會(huì)是文心一言、會(huì)是ChatGPT,誰承想最后跑出來了DeepSeek。
DeepSeek顛覆了很多人的認(rèn)知,證明大模型賽道,小而精的路線跑得通。那么問題來了,未來視頻大模型,會(huì)不會(huì)出現(xiàn)像DeepSeek一樣的Gamechanger?
最終,一切都要交給時(shí)間去驗(yàn)證。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。