TMT观察网_独特视角观察TMT行业

清華學霸引爆“長文本”大戰(zhàn),大模型的應用前景清晰了嗎?觀點

智能相對論 2024-04-02 11:57
分享到:
導讀

答案正是大模型的長文本處理能力,在Kimi開放20萬字文本處理能力的時候,告訴用戶自家的長文本處理能力足夠。

文 | 智能相對論

作者 | 沈浪

Long-LLM(長文本大模型)時代似乎來得有些突然,而引爆這場熱潮的,竟是一家由清華學霸牽頭的本土AI初創(chuàng)企業(yè)。

前不久,月之暗面(Moonshot AI)公司宣布旗下對話式 AI 助理產品 Kimi 應用現(xiàn)已支持200萬字無損上下文輸入。

對比去年10月份Kimi上線時僅支持的20萬字,這一波升級直接提升了10倍文本處理能力,同時也引起了強烈的市場反應,特別是在資本市場,Kimi概念股應運而生,諸如九安醫(yī)療、華策影視、中廣天擇等都受益于Kimi概念而實現(xiàn)了股價不同程度的漲幅。

這些刺激更讓大模型領域徹底卷起了長文本大戰(zhàn)。

01 “長文本”大戰(zhàn),卷的不是字數(shù)而是財力

阿里率先完成自家的大模型產品升級,強化長文本處理能力,免費面向大眾開放最高1000萬字的長文本處理能力。

360則緊隨其后,宣布旗下360智腦正式內測500萬字的長文本功能,并在360AI瀏覽器開放給用戶使用。

而百度也宣布在下個月進行版本升級,開放長文本能力,文字范圍會在200萬-500萬字。

目前,文心一言的文本上限大致為2.8萬字。而像GPT-4Turbo-128k公布的文本范圍也不過為10萬漢字,Claude3200k上下文約16萬漢字。

可以說,這一波熱潮直接把國內的大模型廠商一下子都拉進了百萬量級的長文本競賽,而主流廠商的入局也為這場“長文本”大戰(zhàn)增添了很多看頭。

目前來看,“長文本”大戰(zhàn)的賽點主要呈現(xiàn)在兩個方面。

一方面,是大模型的支持文本參數(shù)。類似阿里通義千問的1000萬字、360智腦的500萬字、百度文心一言的200萬-500萬字、Kimi的200萬字等等,都在極力向市場爭“彩頭”,告訴用戶自家的長文本處理能力足夠“長”。

另一方面,是長文本處理能力的開放程度。有意思的是,Kimi是免費開放給用戶使用的,阿里通義千問的長文本處理功能也是免費的,360智腦、百度文心一言也沒有要收費的意思。——以“長文本”大戰(zhàn)為例,今年的大模型競爭遠比去年要“卷”得多。

還記得去年大火的妙鴨相機,以及各式各樣的圖片生成式服務,都或多或少地通過各種形式如充值、辦會員等,要求用戶付費才能體驗。

今年大模型領域的這把“火”燒得旺,也燒的離奇地“free”。

為什么?

Kimi自升級以來,就有大量用戶不斷涌入,激增的流量更是一度讓月之暗面(Moonshot AI)的服務器承受了巨大的壓力,一度陷入宕機,旗下的App和小程序都無法正常使用。

根據月之暗面(Moonshot AI)發(fā)布的官方消息,從3.20觀測到流量異常增高后,已經進行了5次擴容工作。推理資源會持續(xù)配合流量進行擴容,以盡量承載持續(xù)增長的用戶量。

簡單來說,用戶對長文本功能是非常有興趣的,相關的市場需求還在保持持續(xù)性的、爆炸性的增長。同時,大量的用戶涌進,不僅提高了大模型產品的知名度,更重要的是在大量用戶的基礎上通過類似于UGC的模式去探索大模型的應用,或許更能進一步推動Long-LLM(長文本大模型)的商業(yè)化進程。

當然,在這個過程中,不可避免地就得投入大量資金,一旦商業(yè)化加速,大模型廠商就得做好“卷”財力的準備。

阿里通義千問目前免費對所有人開放高達萬頁的文檔處理能力,如果要計算成本,按照目前最便宜的市價0.1元/頁,10000頁的文檔光解析費用就要1000元,這還不包括解析完成之后大模型處理文檔的成本。考慮到通義千問網頁、APP、釘釘?shù)榷鄠€端口的用戶基數(shù),需要投入的資金恐怕不會是個小數(shù)目。

大模型的商業(yè)化在開始階段并非“賺錢”,而是“燒錢”。

02 長文本,直接“接駁”商業(yè)化場景

在大模型的商業(yè)化進程上,長文本的爆火是很關鍵的一環(huán)。

就大模型的技術原理而言,解決長文本問題是必要的。因為文本長度的提高,對應的模型能解決問題的邊界也將大幅提升,兩者呈現(xiàn)出明顯的正向關系。

傳統(tǒng)的文本處理模型受限于訓練結構,可支持的文本范圍都不算長,在處理復雜任務和深度專業(yè)知識(這一類知識往往都是長篇巨著)時,只能拆解輸入訓練,由此就有可能導致輸出的結果上下文邏輯不連貫不順暢等問題。

區(qū)別于傳統(tǒng)的文本處理模型,長文本模型就具備更準確的文本理解和生成能力以及更強大的跨領域遷移能力。這對于打造垂直領域的行業(yè)專家是一個非常必要的能力支持,比如面向一些長篇巨制的醫(yī)療文獻、法律文件、財務報告等,長文本模型就具備更好的理解能力,對應完成跨領域學習和應用,從而打造出更專業(yè)的醫(yī)療助理、法律助理以及金融助理等應用。

話不多說,實踐一下。

在這里,「智能相對論」向阿里通義千問相繼“投喂”了幾本長達數(shù)百頁的專業(yè)書籍,涵蓋以《高產母豬飼養(yǎng)技術有問必答》為代表的農業(yè)養(yǎng)殖、以《犬貓營養(yǎng)需要》為代表的寵物喂養(yǎng)等等小眾領域。

結果所能實現(xiàn)的效果確實令人驚訝,阿里通義千問不僅能高度概括總結這些長篇巨著的主要內容,還能有針對性的給出具體篇章的知識解答。比如,在《高產母豬飼養(yǎng)技術有問必答》一書中,「智能相對論」向其提問“夏季高溫提問應該如何飼養(yǎng)母豬?”很快就得到了書中的精煉解答。

這意味著什么?只要用戶有足夠多的專業(yè)書籍“投喂”給大模型,那么大模型就可以成長為一個專業(yè)的專家助理,幫助用戶快速解答相關專業(yè)問題。

在日常生活中,或許有很多書籍是我們沒辦法去仔細閱讀和學習的,但是只要有長文本大模型予以支持,那么基本上人人都能創(chuàng)造一個專業(yè)的垂直領域助理。

這或許會顛覆現(xiàn)在我們獲取信息、知識的渠道,去百度搜索或是去知乎提問、亦或是去小紅書討論這些路徑都將被替代。

在Kimi開放20萬字文本處理能力的時候,其做了一個簡單的對比,20萬字等于什么?答案是等于先秦的全部古籍。隨著長文本大模型進入百萬量級的迭代,那么這些能力還能實現(xiàn)進一步的進化,對應所賦予場景應用的機會就是無限的。

如今,在AI領域,Agent的話題也很火,被認為是下一個主流的應用形態(tài)。那么,打造Agent的關鍵是什么?答案正是大模型的長文本處理能力。

比如,Kimi就在幫助元隆雅圖等公司進行營銷升級,基于長文本處理能力來提供爆品文案分析、文案寫作、市場分析、輔助營銷策劃等功能。

盡管現(xiàn)在很多相關的應用還處在探索階段,但是誰又能確定下一個爆款應用不是出自自家的大模型+某個C端用戶的想法/某個企業(yè)客戶的業(yè)務融合?正因如此,大模型廠商們才不顧一切的升級并開放長文本功能,為下一場應用上的爆火做準備。

目前,長本文的火爆還只是技術上的,接下來的爆點大概率將是應用上的爆發(fā)。

03 寫在最后

2024年是大模型大規(guī)模走向商業(yè)化的關鍵一年。從Kimi的火爆程度來看,以長文本為代表的技術迭代走向C端引發(fā)了非常積極的反饋。同時,在「智能相對論」的實踐中,也預感這一能力隨著技術的成熟和完善,必然會在C端用戶的手中被“玩出花來”。

只是目前很多的“玩法”還缺乏打磨,顯得比較粗糙。OpenAI在發(fā)布GPT商店時,就期望要打造一個全新的生態(tài),人人都能創(chuàng)造自己的專屬GPTs。

現(xiàn)在,擺在大眾面前的長文本熱潮,其實就是一個全民時代到來的信號。只要用戶有書,會投喂,那么同樣可以在國內的大模型平臺上打造出屬于自己想要的專業(yè)助理,進而延伸到應用端的火爆。

當然,在這個過程中,書籍的版權問題、平臺的審核問題以及巨大的流量涌入所帶來的諸多挑戰(zhàn)和問題,也是大模型走向商業(yè)化的難點。但是,其根本的方向是清晰的,Long-LLM(長文本大模型)時代已經拉開序幕,從技術到應用,接下來大模型廠商們有得卷了。

說實在,就目前各大廠商公布的參數(shù),從500萬到1000萬,基本上也足夠用了。大模型在長文本技術層面或許不會再有什么值得卷了,哪怕是有也只是背地里正常迭代和發(fā)展。

接下來的爆點只能是往應用層面來看。不管是To C還是To B,誰家的平臺最先把大眾化的應用探索并驗證出來,再加以打磨推向大眾市場,那么誰就有可能成為下一個市場的寵兒。

*本文圖片均來源于網絡

此內容為【智能相對論】原創(chuàng),

僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡,且未核實版權歸屬,不作為商業(yè)用途,如有侵犯,請作者與我們聯(lián)系。

?AI產業(yè)新媒體;

?澎湃新聞科技榜單月度top5;

?文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

?著有《人工智能 十萬個為什么》

?【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫(yī)療、機器人、物聯(lián)網、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。


模型 文本 用戶
分享到:

1.TMT觀察網遵循行業(yè)規(guī)范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創(chuàng)文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創(chuàng)的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。


主站蜘蛛池模板: 国际线缆连接网 - 连接器_线缆线束加工行业门户网站 | 加热制冷恒温循环器-加热制冷循环油浴-杭州庚雨仪器有限公司 | 浩方智通 - 防关联浏览器 - 跨境电商浏览器 - 云雀浏览器 | 空调风机,低噪声离心式通风机,不锈钢防爆风机,前倾皮带传动风机,后倾空调风机-山东捷风风机有限公司 | 钢格板_钢格栅_格栅板_钢格栅板 - 安平县鑫拓钢格栅板厂家 | 杭州高温泵_热水泵_高温油泵|昆山奥兰克泵业制造有限公司 | 北京易通慧公司从事北京网站优化,北京网络推广、网站建设一站式服务商-北京网站优化公司 | 浙江皓格药业有限公司| 跨境物流_美国卡派_中大件运输_尾程派送_海外仓一件代发 - 广州环至美供应链平台 | 成都办公室装修-办公室设计-写字楼装修设计-厂房装修-四川和信建筑装饰工程有限公司 | 浙江红酒库-冰雕库-气调库-茶叶库安装-医药疫苗冷库-食品物流恒温恒湿车间-杭州领顺实业有限公司 | 软文发布平台 - 云软媒网络软文直编发布营销推广平台 | uv机-uv灯-uvled光固化机-生产厂家-蓝盾机电| 千斤顶,液压千斤顶-力良企业,专业的液压千斤顶制造商,shliliang.com | 意大利Frascold/富士豪压缩机_富士豪半封闭压缩机_富士豪活塞压缩机_富士豪螺杆压缩机 | 氨水-液氨-工业氨水-氨水生产厂家-辽宁顺程化工 | 合肥风管加工厂-安徽螺旋/不锈钢风管-通风管道加工厂家-安徽风之范 | 餐饮加盟网_特色餐饮加盟店_餐饮连锁店加盟 | 行业分析:提及郑州火车站附近真有 特殊按摩 ?2025实地踩坑指南 新手如何避坑不踩雷 | 微波萃取合成仪-电热消解器价格-北京安合美诚科学仪器有限公司 | 短信通106短信接口验证码接口群发平台_国际短信接口验证码接口群发平台-速度网络有限公司 | 中央空调温控器_风机盘管温控器_智能_液晶_三速开关面板-中央空调温控器厂家 | 上海办公室设计_办公楼,写字楼装修_办公室装修公司-匠御设计 | 北京公司注册_代理记账_代办商标注册工商执照-企力宝 | 玻璃钢格栅盖板|玻璃钢盖板|玻璃钢格栅板|树篦子-长沙川皖玻璃钢制品有限公司 | 杭州货架订做_组合货架公司_货位式货架_贯通式_重型仓储_工厂货架_货架销售厂家_杭州永诚货架有限公司 | [官网]叛逆孩子管教_戒网瘾学校_全封闭问题青少年素质教育_新起点青少年特训学校 | 大巴租车平台承接包车,通勤班车,巴士租赁业务 - 鸿鸣巴士 | 开锐教育-学历提升-职称评定-职业资格培训-积分入户 | 电动手术床,医用护理床,led手术无影灯-曲阜明辉医疗设备有限公司 | 杭州荣奥家具有限公司-浙江办公家具,杭州办公家具厂 | 双工位钻铣攻牙机-转换工作台钻攻中心-钻铣攻牙机一体机-浙江利硕自动化设备有限公司 | 上海律师事务所_上海刑事律师免费咨询平台-煊宏律师事务所 | SDG吸附剂,SDG酸气吸附剂,干式酸性气体吸收剂生产厂家,超过20年生产使用经验。 - 富莱尔环保设备公司(原名天津市武清县环保设备厂) | 纸布|钩编布|钩针布|纸草布-莱州佳源工艺纸布厂 | vr安全体验馆|交通安全|工地安全|禁毒|消防|安全教育体验馆|安全体验教室-贝森德(深圳)科技 | 517瓜水果特产网|一个专注特产好物的网站 | 海尔生物医疗四川代理商,海尔低温冰箱四川销售-成都壹科医疗器械有限公司 | 华东师范大学在职研究生招生网_在职研究生招生联展网 | 垃圾压缩设备_垃圾处理设备_智能移动式垃圾压缩设备--山东明莱环保设备有限公司 | 破碎机_上海破碎机_破碎机设备_破碎机厂家-上海山卓重工机械有限公司 |