TMT观察网_独特视角观察TMT行业

大模型爭霸的下一站:不僅是超越GPT-4,更是尋求模型之間的平衡應用觀點

智能相對論 2024-05-06 20:11
分享到:
導讀

對大模型的場景應用提出了新的思路,這也是目前商湯科技在AI大模型領域領先行業的關鍵點,目前主流的AI廠商在迭代和發布系列模型時。

文 | 智能相對論

作者 | 沈浪

知名科學雜志《Nature》發表了一篇關于大模型規模參數大小爭議的文章《In Al, is bigger always better?》——AI大模型,越大越好嗎?隨著大模型應用走向實踐,這一問題不可避免地成為了當前AI行業發展的焦點與爭議。

有人認為,大模型當然是越大越好,參數越大,性能越優。也有人認為,小模型更好,消耗更小,更能精準地解決專業問題。兩相對比之下,各有各的道理,懸而未決,究竟什么才是AI大模型發展的出路?

這一問題或許在日前商湯科技舉辦的技術交流日活動上有所解答。在活動現場,商湯科技發布了行業首個“云、端、邊”全棧大模型產品矩陣,以滿足不同規模場景的應用需求,對大模型的場景應用提出了新的思路,并且全新升級了“日日新SenseNova 5.0”大模型體系,綜合能力全面對標GPT-4 Turbo。

當然,在當前節點上,領先的意義已經不僅僅是超越GPT-4,更是探索出能解決實際應用問題的有效路徑。

01、離譜or靠譜?日日新端側大模型“暴打”GPT-4

在技術交流日活動的現場,商湯科技以一個很有趣的畫面闡釋了大模型與小模型之間的差別。基于拳皇游戲的畫面演示,商湯科技將自家的SenseChat-Lite 版本日日新端側?模型與GPT-4進行PK。

一開始,GPT-4還能略占上風,但是SenseChat-Lite出拳速度更快,隨后各種連招打到他根本反應不過來,只得被商湯科技的模型“暴打”,直接K.O出局。

這一結局似乎太離譜了?商湯科技對此做了解釋:實際上其中的差距并非模型能力強弱問題,而是在不同的適用場景之下小模型決策速度快。當大模型還在計算的時候,小模型已經完成了判斷并且出拳了,而且實實在在打到了對手身上。

正所謂,“天下武功,唯快不破”!對比大模型,小模型在具體的場景應用中有著更明顯的決策優勢。

因此,業內正在形成一個全面的共識:在實際應用中,大模型并非越大越好,而是得看具體場景需求。前不久,美國AI公司Anthropic發布Claude 3系列模型,一度超越GPT-4,登頂全球最強大模型。其中Claude 3系列就給出了不同量級的模型產品,包括Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,以便適用于不同的企業和場景。

同樣的,基于這一思路,商湯科技也在搭建完善的基模型體系與小模型系統方案,并發布了一系列的垂類大模型和端側大模型。其中,SenseChat-Lite版本端側大模型就可以面向手機、平板、VR 眼鏡、智能汽車等提供輕量、高效的大模型能力,結合端云解決方案,及時適應變化的環境和需求,保持高性能和準確性。

對比來說,中國更注重實踐。商湯科技在這個思路上給出的解決方案更具有主動性和服務意識以及更有實踐價值。具體的,商湯端側大模型不僅是參數量級小,還講究端側部署與端側處理能力的強化,在解決實際問題上響應更快速。

與此同時,商湯科技還面向金融、代碼、醫療、政務等多個領域推出了邊緣產品“商湯企業級大模型一體機”,在實際場景應用中更能滿足專業化需求,主動貼合客戶需求。比如,“大醫”醫療健康大模型一體機就可以在醫療機構內部一鍵部署大模型應用,實現“開箱即用”,并有效針對智能問診、導診、病歷結構化、影像報告解讀等場景,支持智能調整回復內容的語言風格、詳略程度、格式要求等。

當然,這也是目前商湯科技在AI大模型領域領先行業的關鍵點。同樣的思路,以小模型為應用焦點,商湯比別人多走了幾步,提出了軟硬兼顧的解決方案。

02、在尺度定律之下,沒有永恒的“最強”,唯有“日日新”

從經濟性而言,小模型更利于企業應用與解決實際問題。那么,是否對于AI行業而言,就不需要訓練大模型了?

實則不然。

在技術交流日活動現場,商湯科技提到了一個同為業內共識的理論:尺度定律。在普遍的認知中,以尺度定律為參考,隨著模型的參數變大、數據量變大、訓練時長加長,則算法性能會越來越好。

OpenAl于2020年曾發布一篇論文《Scaling Laws for Neural Language Models》,其中也有類似的觀點,即模型性能隨著模型參數大小的增長而變好。因此,在后續的大模型迭代中,OpenAI通過構建一個巨大的海量數據集,再簡單增加GPT模型的深度,就做出了具有驚人的涌現能力的大模型產品。

對此,很多廠商也作了相關驗證,包括谷歌、商湯科技等。其中,谷歌曾精調了三個尺寸的Minerva模型,分別使用了80億,620億和5400億個參數的預訓練PaLM模型。

結果發現,Minerva的性能隨著規模的擴大而提高。在整個MATH數據集上,最小模型的準確率為25%,中型模型達到43%,最大模型突破50%大關。

由此,基于尺度定律的認知,他們發現自家的模型產品在一定測試級上超越GPT-4的能力,并非不可能。如今,商湯科技發布的最新的“日日新SenseNova 5.0”大模型體系,其性能就超越了GPT-4。

其中,日日新·商量大模型5.0主模型在語言、知識、推理、數學、代碼等領域的能力,在主流客觀評測上就達到或超越了GPT-4 Turbo,在聊天、多輪對話、信息提取、寫作等場景能和GPT-4 Turbo相媲美。

更值得一提的是,日日新·商量多模態大模型的圖文感知能力達到了全球領先水平,在多模態大模型權威綜合基準測試MMBench中綜合得分排名首位,并在多個知名多模態榜單MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU 取得領先成績。

換句話說,在尺度定律的認知下,GPT-4被超越是遲早的事情,AI大模型領域沒有永恒的“最強”。

當然,若要登頂最強,雖說可行,但絕不簡單。大模型的參數爭議,其中就有能耗的問題。谷歌曾坦言,PaLM的訓練在2個月內消耗了大約300個美國家庭一年的電力消耗,其中所需要的算力、數據等基礎設施絕非常規企業可以負擔。

在這一點上,商湯科技秉持“大模型+大算力”的“雙輪驅動”戰略布局又一次為其拓寬了道路。其中,SenseCore商湯大裝置作為商湯科技前瞻決策所打造的高效率、低成本、規模化的新一代AI基礎設施,可以支撐超過20個千億超大模型同時訓練,并支持萬億參數大模型的全生命周期生成,為大模型的打造提供了非常關鍵的支撐。

簡單來說,雖說有尺度定律作為理論支持,但是以SenseCore商湯大裝置為代表的大算力才是商湯科技能超越GPT-4的底氣。從這個角度來看,商湯科技做AI,比大多企業要更加純粹且徹底。

03、大模型的最優解,是場景平衡

從國內外的實驗與實踐來看,模型的大小之爭意義不大,離開基礎理論和場景應用去拋棄任何一方都不可取。因此,目前主流的AI廠商在迭代和發布系列模型時,往往都會推出主模型與小模型以及垂類專業模型,根據場景需求按需提供服務。

這一點將在接下來的時間里拉開專業AI服務商之間的差距。目前,日日新SenseNova5.0大模型體系采用了混合專家模式,這樣做的目的在于通過將模型分割成多個具有專門功能的模塊,使得模型在推理過程中能更有效地利用計算資源,并可能提高模型的泛化能力和應對復雜任務的性能。

具體來看,商湯瓊宇發布的3D高斯潑濺技術,就具備輕量化的web渲染能力,可以產生更輕量的模型資產,使城市級三維模型的構建和編輯重建效果更加真實,成本更低,也可以應用在更多場景。

這是混合專家模式思想在實際應用中的體現,通過不同技術和模型組件之間的配合,實現了對特定任務定制化處理和資源優化,從而加速大模型在不同場景中的應用,實現AI普惠。目前,瓊宇已服務客戶超過60個,實現了15個城市120多種場景的重建。

因此,當我們把目光投遞到實際中的場景問題,就會發現大模型和小模型均有用武之地,問題則在于如何去平衡地調配資源,實現最優解。由此來看,商湯科技對混合專家模式的應用,可以視為是一種領先行業的熟練決策。

未來不屬于大模型或小模型,而是大小模型之間的平衡。因此,“AI大模型是否越大越好”類似的問題不必糾結,但需要面對,即如何去打造大模型,又如何把大模型的能力調配出小模型服務好市場,會是各大廠商接下來的必修課程。

*本文圖片均來源于網絡

此內容為【智能相對論】原創,

僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。

?AI產業新媒體;

?澎湃新聞科技榜單月度top5;

?文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

?著有《人工智能 十萬個為什么》

?【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發者以及背后的芯片、算法等。


模型 AI 科技
分享到:

1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。


主站蜘蛛池模板: 电池挤压试验机-自行车喷淋-车辆碾压试验装置-深圳德迈盛测控设备有限公司 | UV固化机_UVLED光固化机_UV干燥机生产厂家-上海冠顶公司专业生产UV固化机设备 | 证券新闻,热播美式保罗1984第二部_腾讯1080p-仁爱影院 | 知名电动蝶阀,电动球阀,气动蝶阀,气动球阀生产厂家|价格透明-【固菲阀门官网】 | 石牌坊价格石牌坊雕刻制作_石雕牌坊牌楼石栏杆厂家_山东嘉祥石雕有限公司 | 北京公司注册_代理记账_代办商标注册工商执照-企力宝 | 酒水灌装机-白酒灌装机-酒精果酒酱油醋灌装设备_青州惠联灌装机械 | 货车视频监控,油管家,货车油管家-淄博世纪锐行电子科技 | 粘度计NDJ-5S,粘度计NDJ-8S,越平水分测定仪-上海右一仪器有限公司 | 全自动包衣机-无菌分装隔离器-浙江迦南科技股份有限公司 | 铝箔-铝板-花纹铝板-铝型材-铝棒管-上海百亚金属材料有限公司 | 润滑脂-高温润滑脂-轴承润滑脂-食品级润滑油-索科润滑油脂厂家 | 硅胶制品-硅橡胶制品-东莞硅胶制品厂家-广东帝博科技有限公司 | 河南中整光饰机械有限公司-抛光机,去毛刺抛光机,精密镜面抛光机,全自动抛光机械设备 | 手板-手板模型-手板厂-手板加工-生产厂家,[东莞创域模型] | 农产品溯源系统_农产品质量安全追溯系统_溯源系统 | 重庆轻质隔墙板-重庆安吉升科技有限公司 | 海外仓系统|国际货代系统|退货换标系统|WMS仓储系统|海豚云 | 中天寰创-内蒙古钢结构厂家|门式刚架|钢结构桁架|钢结构框架|包头钢结构煤棚 | 蜘蛛车-高空作业平台-升降机-高空作业车租赁-臂式伸缩臂叉装车-登高车出租厂家 - 普雷斯特机械设备(北京)有限公司 | 瑞典Blueair空气净化器租赁服务中心-专注新装修办公室除醛去异味服务! | 磁力反应釜,高压釜,实验室反应釜,高温高压反应釜-威海自控反应釜有限公司 | 韦伯电梯有限公司| 齿轮减速机_齿轮减速电机-VEMT蜗轮蜗杆减速机马达生产厂家瓦玛特传动瑞环机电 | 光纤测温-荧光光纤测温系统-福州华光天锐光电科技有限公司 | 焊接减速机箱体,减速机箱体加工-淄博博山泽坤机械厂 | 细砂提取机,隔膜板框泥浆污泥压滤机,螺旋洗砂机设备,轮式洗砂机械,机制砂,圆锥颚式反击式破碎机,振动筛,滚筒筛,喂料机- 上海重睿环保设备有限公司 | 慢回弹测试仪-落球回弹测试仪-北京冠测精电仪器设备有限公司 | 中天寰创-内蒙古钢结构厂家|门式刚架|钢结构桁架|钢结构框架|包头钢结构煤棚 | 自动钻孔机-全自动数控钻孔机生产厂家-多米(广东)智能装备有限公司 | 水平筛厂家-三轴椭圆水平振动筛-泥沙震动筛设备_山东奥凯诺矿机 包装设计公司,产品包装设计|包装制作,包装盒定制厂家-汇包装【官方网站】 | LED显示屏_LED屏方案设计精准报价专业安装丨四川诺显科技 | 恒温槽_恒温水槽_恒温水浴槽-上海方瑞仪器有限公司 | 螺杆式冷水机-低温冷水机厂家-冷冻机-风冷式-水冷式冷水机-上海祝松机械有限公司 | 乐考网-银行从业_基金从业资格考试_初级/中级会计报名时间_中级经济师 | 烟气在线监测系统_烟气在线监测仪_扬尘检测仪_空气质量监测站「山东风途物联网」 | 杭州|上海贴标机-百科| 智能电表|预付费ic卡水电表|nb智能无线远传载波电表-福建百悦信息科技有限公司 | 反渗透水处理设备|工业零排放|水厂设备|软化水设备|海南净水设备--海南水处理设备厂家 | 聚天冬氨酸,亚氨基二琥珀酸四钠,PASP,IDS - 远联化工 | 布袋除尘器|除尘器设备|除尘布袋|除尘设备_诺和环保设备 |