對于“百模大戰(zhàn)”,幾乎所有大佬的口風(fēng)都180 °大轉(zhuǎn)變了?觀點(diǎn)

幫助OpenAI在接下來的時間內(nèi)占據(jù)大模型領(lǐng)域在場景應(yīng)用方向的優(yōu)勢,場景應(yīng)用,李彥宏試圖為接下來的大模型應(yīng)用開發(fā)趨勢下一個結(jié)論。
文 | 智能相對論
作者 | 陳泊丞
在2024世界人工智能大會暨人工智能全球治理高級別會議產(chǎn)業(yè)發(fā)展主論壇上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏談了些對于AI大模型的看法,語驚四座。
他先是指出,“百模大戰(zhàn)造成了社會資源的巨大浪費(fèi),尤其是算力的浪費(fèi)。但同時也使得我們追趕世界上最先進(jìn)基礎(chǔ)模型的能力得到了建立。”
而后又強(qiáng)調(diào),“沒有應(yīng)用,光有基礎(chǔ)模型,不管是開源還是閉源都一文不值。”同時李彥宏也表示,要跳出移動時代的思維邏輯,避免掉入“超級應(yīng)用陷阱”,不是只有10億DAU的應(yīng)用才叫成功。
可以說,李彥宏的發(fā)言挺激烈的。這似乎也是第一次有大佬在這么高級別的場合去把“百模大戰(zhàn)”和大模型的發(fā)展攤開了說。
當(dāng)然,秉持著類似觀點(diǎn)的,也不只是李彥宏。
金沙江創(chuàng)投主管合伙人朱嘯虎在6月的黑馬大課上也提到,很多創(chuàng)業(yè)者盲目投資AI底層技術(shù)。雖然創(chuàng)造了“百模大戰(zhàn)”的盛況,但也造成了社會資源浪費(fèi)。
他強(qiáng)調(diào),“很顯然,AI創(chuàng)業(yè)的賺錢風(fēng)向,已經(jīng)徹底變了。”
怎么變?
除了李彥宏、朱嘯虎之外,還有獵豹移動董事長兼CEO、獵戶星空董事長傅盛,智譜AI COO張帆、百川智能創(chuàng)始人王小川等大佬在不同的場合也或多或少談到了大模型行業(yè)競爭轉(zhuǎn)變的方向,能最終達(dá)成共識的關(guān)鍵點(diǎn)在于“場景”和“應(yīng)用”。
聚焦基礎(chǔ)大模型的“卷”所導(dǎo)致的“百模大戰(zhàn)”似乎該喊停了,大模型的重點(diǎn)還是得“卷”場景應(yīng)用。
大佬們在這一點(diǎn)上達(dá)成了共識。今年以來,大家的口風(fēng)都變了!
不要過度競爭基礎(chǔ)大模型,該“卷”場景應(yīng)用了
在過去一段時間內(nèi),美國涌向了大量專注于大模型應(yīng)用開發(fā)的創(chuàng)業(yè)公司,如Adept、Stability.ai、Runway、BettrData、Tinybird、UnSkript等等。
同時,像OpenAI、Anthropic這樣的大模型頭部領(lǐng)軍企業(yè)以及如谷歌、微軟等科技巨頭也在致力于利用開源模型或自主研發(fā)的基礎(chǔ)模型,開發(fā)出各種應(yīng)用場景的解決方案。
GPTs的推出以及OpenAI宣稱的一系列給開發(fā)者讓利的行為,都旨在吸引更多的創(chuàng)業(yè)團(tuán)隊(duì)參與到GPT技術(shù)的創(chuàng)新和應(yīng)用中,從而豐富GPT生態(tài)系統(tǒng),幫助OpenAI在接下來的時間內(nèi)占據(jù)大模型領(lǐng)域在場景應(yīng)用方向的優(yōu)勢。
以國外大模型行業(yè)的趨勢來看,國內(nèi)這些大佬們的口風(fēng)轉(zhuǎn)變并非空穴來風(fēng)。
目前,百度文心一言的日均調(diào)用量已經(jīng)超過5億,而在兩個月前百度官方才剛剛宣布文心一言的日調(diào)用量超過2億。
期間2個月的時間,調(diào)用量就發(fā)生如此之大的變化,可見大模型要“卷”場景應(yīng)用不僅僅是廠商們的推動,還有整個市場的需求已經(jīng)擺上臺面,呈現(xiàn)出爆發(fā)式增長趨勢。
類似的信號也在阿里云的主場上釋放。
在世界人工智能大會上,阿里云CTO周靖人公布了近期通義大模型和阿里云百煉平臺的最新進(jìn)展——近2個月,通義千問開源模型下載量增長2倍,突破2000萬次,阿里云百煉服務(wù)客戶數(shù)從9萬增長至23萬,漲幅超150%。
談及大模型,比起參數(shù)上的比較,現(xiàn)如今國內(nèi)的大佬們似乎更愿意去告訴市場自家的大模型如何好用,有多少人用,接下來還能怎么用等等一系列與場景應(yīng)用落地相關(guān)的事情。
而以朱嘯虎為代表的投資者們也開始在應(yīng)用層去尋找大模型的投資機(jī)會。
市場的風(fēng)向變了,不僅僅只是大佬的口風(fēng)在變。
“超級能干”的應(yīng)用在哪?
“AI時代,‘超級能干’的應(yīng)用比只看DAU的‘超級應(yīng)用’更重要。”在世界人工智能大會上,李彥宏試圖為接下來的大模型應(yīng)用開發(fā)趨勢下一個結(jié)論。
然而,“超級能干”的應(yīng)用或許理解起來并不難,市場懸而未決的問題在于這樣的應(yīng)用是如何開發(fā)出來的,又是如何推向大眾?
基于現(xiàn)階段的行業(yè)表現(xiàn),「智能相對論」認(rèn)為有幾點(diǎn)思考值得探究。
一、在“超級能干”的應(yīng)用背后,大模型技術(shù)的迭代和適配是必要的。
行業(yè)的趨勢大多殊途同歸,大模型領(lǐng)域在今年以來掀起的MoE架構(gòu)迭代趨勢,則是代表了在技術(shù)方面大模型正為“卷”場景應(yīng)用而作支撐。
如今,OpenAI的GPT-4、谷歌的Gemini、Mistral AI的Mistral、xAI的Grok-1、昆侖萬維的天工AI、浪潮信息的源2.0-M32、通義千問團(tuán)隊(duì)發(fā)布的Qwen1.5-MoE-A2.7B等國內(nèi)外大模型都采用了MoE架構(gòu)。
MoE架構(gòu)通過引入專家網(wǎng)絡(luò)(Expert Networks)和門控機(jī)制(Gating Mechanism)實(shí)現(xiàn)了模型的稀疏化和模塊化,在數(shù)據(jù)處理、算力資源調(diào)配、輸出結(jié)果優(yōu)化等方面都有相當(dāng)不錯的反饋。這為大模型的場景應(yīng)用落地和推廣提供了非常關(guān)鍵的技術(shù)支持。
比如,微軟就提出了一個端到端的MoE訓(xùn)練和推理解決方案DeepSpeed-MoE,其通過深度優(yōu)化MoE在并行訓(xùn)練中的通信,減少通信開銷,實(shí)現(xiàn)了高效的模型并行。此外,DeepSpeed-MoE還提出了基于微調(diào)的專家排序機(jī)制,可以根據(jù)訓(xùn)練過程中專家的損失動態(tài)調(diào)整輸入樣本到專家的分配,提升效果。
二、“超級能干”的應(yīng)用意味著一場更商業(yè)化的生態(tài)競爭。
技術(shù)沒問題,但商業(yè)化路徑不清晰仍然會在今天的市場面臨崩盤。日前,微軟官網(wǎng)更新了一條通知——“GPT Builder即將停用”。曾經(jīng)掀起AI圈無數(shù)熱議與高潮的GPTs似乎正在走向敗局。
誰又能想起,當(dāng)時GPTs概念橫空出世的那場發(fā)布會還被外界形容為“OpenAI的iPhone時刻”。
OpenAI本意是想借助低門檻的技術(shù)能力以及全球開發(fā)者們共同打造出一批“超級能干”的應(yīng)用,結(jié)果卻因技術(shù)問題帶來的體驗(yàn)瑕疵以及模糊不清的貨幣化政策,讓GPTs這一概念的商業(yè)化路徑始終走不通,最終只能“涼涼”。
“超級能干”的應(yīng)用大多是建立在成熟的商業(yè)生態(tài)之上,或許全球的AI廠商都需要認(rèn)清楚這一點(diǎn)。值得一提的,在大洋的彼岸,阿里云在2022年11月牽頭發(fā)起的開源AI模型社區(qū)剛剛斬獲2024 SAIL之星獎的魔搭ModelScope。
歷經(jīng)一年多的發(fā)展,魔搭社區(qū)已成為國內(nèi)規(guī)模最大、最活躍的AI模型社區(qū),匯聚5500多款優(yōu)質(zhì)模型和上千數(shù)據(jù)集,為超過560萬開發(fā)者提供了模型及免費(fèi)算力服務(wù)。或許,OpenAI沒能走通的生態(tài)路徑,在中國會有新的生機(jī)吧。
三、“超級能干”的應(yīng)用必然萌芽于行業(yè)場景中。
朱嘯虎送給大模型創(chuàng)業(yè)者的忠告,“不要迷信AI,聚焦尖刀場景盡快落地。”——場景是孵化“超級能干”應(yīng)用的搖籃,然而更深入地來看,也不能只看場景,最終還得看用戶反饋和價值呈現(xiàn)。
醫(yī)療、教育、金融、制造、交通、農(nóng)業(yè)等等這些行業(yè)領(lǐng)域是大模型應(yīng)用“高發(fā)”場景,但打造出來的智能體或解決方案究竟如何,“如人飲水,冷暖自知”罷了。
To B的項(xiàng)目看效率。在快遞領(lǐng)域,目前通過大模型來幫助處理訂單,就可以做到了“一張圖、一句話寄快遞”,不再需要其他繁瑣的流程,時間從3分多鐘縮短到19秒。而且90%以上的售后問題,也都由大模型來解決。——這樣的效率提升,才稱得上是“超級能干”。
To C的場景看用戶。此前,在高峰期,百度的高考智能體每天要回答超過兩百萬個考生的問題。對于全國1000萬的考生來說,這一比例是相當(dāng)高的。——這樣的用戶數(shù)量,也算得是“超級能干”。
今天,大模型應(yīng)用覆蓋文本生成、數(shù)據(jù)處理、PPT制作、市場營銷、客服售后、醫(yī)療診斷等各類通用的和垂直的場景。實(shí)際上,市場并不缺場景,而是缺乏能干、有效的應(yīng)用,“卷”應(yīng)用須在場景中找用戶、找價值。
*本文圖片均來源于網(wǎng)絡(luò)
此內(nèi)容為【智能相對論】原創(chuàng),
僅代表個人觀點(diǎn),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。
部分圖片來自網(wǎng)絡(luò),且未核實(shí)版權(quán)歸屬,不作為商業(yè)用途,如有侵犯,請作者與我們聯(lián)系。
?AI產(chǎn)業(yè)新媒體;
?澎湃新聞科技榜單月度top5;
?文章長期“霸占”鈦媒體熱門文章排行榜TOP10;
?著有《人工智能 十萬個為什么》
?【重點(diǎn)關(guān)注領(lǐng)域】智能家電(含白電、黑電、智能手機(jī)、無人機(jī)等AIoT設(shè)備)、智能駕駛、AI+醫(yī)療、機(jī)器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。