TMT观察网_独特视角观察TMT行业

DeepSeek,做AI競爭的破局者互聯網+

伯虎財經 2025-02-07 09:44
分享到:
導讀

不大力也能出奇跡。

來源 | 伯虎財經(bohuFN) 

作者 | 森系 

中美大模型的差距在1-2年。起碼在今年春節之前,這還是一個獲得普遍認同的觀點。

直到中國科技公司深度求索發布了推理模型DeepSeek-R1,用不到GPT二十分之一的成本,獲得了和OpenAI的頂尖推理模型o1相當的能力。

DeepSeek的影響很快擴散到大洋彼岸。

1月27日,美國科技股遭遇“黑色風暴”,費城半導體指數(SOX)狂瀉9.2%,創下2020年3月以來的最大單日跌幅。英偉達股價重挫近17%,市值一夜之間蒸發近6000億美元,創下美股歷史上最大的單日市值縮水規模。博通、臺積電、ASML、Google和微軟等科技巨頭也未能幸免,股價分別下跌17.4%、13%、7%、4%和2.14% 。

與此同時,歐洲科技股市場同樣哀鴻遍野,各類科技股慘遭拋售。

引發全球資本市場“強烈地震”的幕后主角——DeepSeek,不是任何發力大模型的大廠,或者創業明星,而是一家此前名聲不顯的小型科技初創公司。它由幻方量化創始人梁文鋒一手創辦,成立僅一年多。

最能喚醒讀者記憶的,可能是去年8月,DeepSeek率先宣布其API價格大幅下調,輸入費用調整為0.1元/百萬tokens,輸出費用為2元/百萬tokens,隨后各家大廠紛紛跟進。大模型價格戰也就此打響。

實際上,DeepSeek的創始人梁文鋒或許是最早把目光投向AI的那批人。不僅僅是他創立了量化基金,更有意思的例證是,在算力緊缺的2023年,國內只有五家公司擁有萬塊規模的顯卡,前四位是阿里巴巴、騰訊、百度和字節跳動,剩下的那個就是幻方量化。

開源、創新、成本。在硅谷,DeepSeek被稱作“來自東方的神秘力量”。他們一面跟隨,推出類似的推理模型,一面攻擊,要求對其進行封殺甚至算力封鎖。

1月28日,DeepSeek曾連續發布兩條公告稱,DeepSeek線上服務受到大規模惡意攻擊。

客觀來講,從產品實際表現來看,DeepSeek目前只是躋身行業第一梯隊,尚未實現對市面上現有產品的全面超越,也并非在技術底層實現了范式創新。

但DeepSeek確實為全球AI行業的長期發展探索出了新的模式,也讓長期被硅谷霸占話語權的AI行業出現了一些不一樣的聲音。正如AI領域泰斗吳恩達所言:“DeepSeek的創新表明,中美在生成式AI領域的差距正在迅速縮小,在某些領域中國已現領先跡象。”

 01 DeepSeek,破了誰的金身?

去年12月,36氪旗下的暗涌賬號采訪了DeepSeek。采訪中提到了去年8月由DeepSeek發起的價格戰,原因指向了一個事實——與很多大廠燒錢補貼不同,DeepSeek是有利潤的。

早在去年5月,DeepSeek發布的DeepSeekV2模型,就展現了他們非凡的效率:推理成本被降到每百萬token僅1塊錢,約等于Llama370B的七分之一,GPT-4Turbo的七十分之一。

并且相較于OpenAI公司來自全球頂尖學府幾千人的大公司人力成本,DeepSeek公司只有寥寥幾百人,也沒有全球前50的人才密度,聚集的是國內一眾大學相關學科的博碩精英人才。

更加難能可貴的是,DeepSeek-V3在訓練時使用的GPU是英偉達的H800,一款在性能上被閹割的特供AI芯片。相比之下,GPT-4o使用的是上萬塊英偉達H100芯片(性能優于H800)。

這和我們過去的認知是不同的。

英偉達及美股大跌的原因直指DeepSeek,原因在于DeepSeek的成功打破了AI大模型領域“拼投入”的慣常邏輯。AI大模型只有砸錢、砸算力才能做出來的觀念在行業中深入人心。

2023年,OpenAI的CEO奧特曼(SamAltman)曾經訪問印度,他對印度團隊能否憑借僅 1000 萬美元的預算,在AI領域構建出具有實質性成果的模型表示懷疑。

在他看來,如果沒有上億美元的訓練成本,是煉不出好的大模型的。畢竟作為AI行業的領軍企業OpenAI至今都尚未實現盈利,很大一部分原因在于尖端AI模型的訓練耗資驚人,運行成本也十分高昂。據測算,僅維持ChatGPT的運營,每天成本就高達70萬美元。奧特曼則表示,未來的AI模型成本預計將超過10億美元。

高昂的成本也讓后來者紛紛以OpenAI為標桿加大投入。馬斯克旗下的xAI,其超級計算數據中心裝配了10萬顆英偉達H100 GPU芯片,成為全球最強大的AI訓練集群之一。特朗普上臺后,宣布投資5000億美元啟動“星際之門”項目,試圖憑借巨額資金與強大算力,鞏固美國在AI領域的霸權地位。

其他科技巨頭們也在積極布局。過去一年,微軟和谷歌的資本支出均超過 500 億美元,其中大部分資金用于AI相關的基礎設施建設,并且計劃在2025財年將這一投入提升至700 - 800億美元。國內方面,根據浙商證券的分析,2024年字節跳動的資本開支約為800億元,預計2025年將達到1600億元,其中約900億元將用于AI算力的采購,700億元用于 IDC 基建以及網絡設備。

DeepSeek并非是擁有什么降本魔法,而是摸索出了一條不一樣的道路。DeepSeek的研究員提出了一種新的MLA(一種新的多頭潛在注意力機制)架構,與 DeepSeek MoESparse (混合專家結構)結合,這種架構的優勢是顯存占用僅為常用MHA架構的5%-13%。

與此同時,和行業慣常的用數萬億token(文本單位)訓練模型不同,而是選擇通過“數據蒸餾”,降低了數據計算程度,從而實現降本。

正因為如此,DeepSeek也有了“AI屆的拼多多”之稱,盡管這種表述可能并不完全準確,但也基本表達了DeepSeek對當前主流AI的沖擊。通過這一低成本模式使得DeepSeek能夠更快速地推出新產品和服務,并極大地降低了其市場進入門檻,可以吸引了更多企業和機構參與到AI研發中來。

02 開源會是更好的選擇?

當然,DeepSeek對AI的沖擊還不止于此。

作為一家中國公司,DeepSeek表現出了前所未有的自信,對產品實施開源策略,也就是公開模型的代碼和架構等等,允許公眾查看、使用和修改。這就意味著,很多中小企業可以直接使用其模型,極大降低了很多企業的研發成本。

相比之下,OpenAI和谷歌等旗下的AI產品都是閉源,DeepSeek的開源和低價策略,對于國際上那些依靠高收費的主流AI工具,也將帶來巨大沖擊。

DeepSeek并不是個例,在開源浪潮席卷全球的時代,Meta的LLaMA、阿里的通義千問,都在試圖證明“開放才能贏未來”。甚至就連馬斯克也是開源技術的支持者,此前曾批評OpenAI走向閉源,稱其為“CloseAI”,并指責其違背了最初的開源初衷而奧特曼則是埋頭向前,繼續閉源。這個爭議還不僅是打口水仗,還曾對薄公庭。

但盡管如此,依然也有不少業內人士對此嗤之以鼻。

去年,有行業人士表示:閉源大模型,才是AI商業化的最優解。

究其原因,開源模型仍有致命傷:“所謂模型開源,往往只提供了模型的大量參數。但想要有效應用這些模型,還需要進行很多后續工作。”即便公布參數,開發者仍難窺見參數的生成過程和數據源等核心“配方”。這種半透明狀態,導致二次開發如同盲人摸象。

“由于不了解這些參數的生成過程和數據源,難以直接實現‘眾人拾柴火焰高’的協同效應。即使獲取了模型源代碼,也可能不清楚訓練這些參數所使用的具體數量和比例。因此,拿到這些開源資料,并不足以讓人直接站在巨人的肩膀上輕松進行迭代與開發。

這也是為什么OpenAI能夠通過閉源在一定時間內保持了技術的領先性和獨特性,構建了自己的商業生態的原因之一。

另外,在醫療、金融等高敏感領域,閉源優勢還可以在保護技術和商業利益方面有其獨特作用,能保障知識產權安全,防止技術濫用。

但不可否認的是,DeepSeek的確迎來了填補生態位的絕佳機會。

在和暗涌的采訪里,梁文鋒就表示,長遠來說,我們希望形成一種生態,就是業界直接使用我們的技術和產出,我們只負責基礎模型和前沿的創新,然后其它公司在DeepSeek的基礎上構建toB、toC的業務。

用戶無需付費即可享受強大AI推理能力,推動AI技術普及,讓普通用戶在日常工作生活中體驗前沿科技的便利。在開源生態上,它已吸引大量開發者,形成了蓬勃發展的社區。隨著越來越多的開發者和企業認可開源模式,DeepSeek有望進一步擴大其影響力,重塑AI產業格局。

03 一場DeepSeek風暴,揭開中美AI敘事重心的搖擺

實際上,在全球矚目的目光聚焦于DeepSeek出圈的背后,從技術領域、產業范疇到資本市場,DeepSeek都以非凡之勢打破了人們對AI發展的固有認知,掀起了一場前所未有的技術變革浪潮,在某種程度上預示著算力軍備競賽的終結。

長期以來,AI行業形成了一種依賴大規模算力與巨額資金投入的研發模式。以OpenAI等公司為例,它們在模型訓練上動輒投入數億美元,大規模采購英偉達最頂尖的GPU芯片,致力于構建龐大的數據中心。英偉達憑借早期賣顯卡的業務基礎,順勢踏上AI算力的發展大潮,締造了算力芯片領域的商業神話。一時間,谷歌、OpenAI、蘋果等各路科技巨頭紛紛排隊向英偉達輸送資金,使其在AI算力市場占據了主導地位。

然而,DeepSeek卻以顛覆性的創新打破了這一格局。它僅使用2000塊芯片,投入不到600萬美元,就實現了與行業巨頭相媲美的性能。這一成果引發了行業的深刻反思:“如果DeepSeek的創新是真實有效的,那AI公司真的還需要如此大量的顯卡嗎?”當英偉達還在為每秒200TB的顯存帶寬而自鳴得意時,DeepSeek用一行開源代碼有力地證明了:真正的人工智能不應被算力所束縛。

根據全球半導體觀察的不完全統計,目前已有包括英偉達、AMD、微軟、亞馬遜云科技、英特爾等國外巨頭,沐曦、天數智芯、摩爾線程、海光信息等國內GPU企業,華為云、騰訊云、天翼云、阿里云、百度智能云、火山引擎等云計算大廠,以及無問芯穹、壁仞科技、硅基流動、PPIO派歐云、云軸科技等共計20家企業宣布適配及上架DeepSeek模型服務。隨著多家國內外知名云平臺和科技企業相繼上線DeepSeek大模型,AI市場迎來了新一輪的變革浪潮。

從另一方面看,英偉達股價的大幅下跌恰恰而言折射出的是在經受DeepSeek風暴沖擊下其AI芯片霸權的逐漸被終結。正如塔勒布現任對沖基金Universa Investments的顧問的警告,當英偉達把一切都建立在人們會使用你的芯片的希望之上,希望需求持續增加,同時假設不會出現軟件上的革命性改進或其他創新方法。而現在,這些假設受到挑戰,未來或將出現數倍于當前跌幅的回調。

值得關注的是,DeepSeek帶來的這種技術路徑的轉變,不僅是對美國科技霸權的有力回擊,也讓全球開發者重新認識到中國AI的巨大潛力。在美國不斷通過各種限令限制中國AI和芯片發展的背景下,這場由中國團隊發起的“效率革命”,或許將重現電動車顛覆燃油車的精彩歷程——以更低的成本、更開放的生態,讓AI從“美國巨頭的專屬玩具”轉變為“全民普惠的實用工具”。

正如DeepSeek技術白皮書扉頁所寫:“我們并非在追趕GPT,而是在證明:通向AGI的道路,絕不止硅谷這一種走法?!睆漠a業發展的角度來看,隨著DeepSeek不斷發展壯大,未來將逐步采用更多國產芯片,有效降低產業鏈風險。在DeepSeek的引領下,國產芯片有望逐步從中低端邁向高端,最終擺脫對美國芯片的依賴,在全球AI產業中占據更為重要的地位。

文章封面首圖及配圖,版權歸版權所有人所有。若版權者認為其作品不宜供大家瀏覽或不應無償使用,請及時聯系我們,本平臺將立即更正。 


DeepSeek AI 模型
分享到:

1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。


主站蜘蛛池模板: 广东高华家具-公寓床|学生宿舍双层铁床厂家【质保十年】 | 祝融环境-地源热泵多恒系统高新技术企业,舒适生活环境缔造者! | 深圳VI设计-画册设计-LOGO设计-包装设计-品牌策划公司-[智睿画册设计公司] | 千淘酒店差旅平台-中国第一家针对TMC行业的酒店资源供应平台 | 泰安塞纳春天装饰公司【网站】| 户外健身路径_小区健身器材_室外健身器材厂家_价格-浩然体育 | 开锐教育-学历提升-职称评定-职业资格培训-积分入户 | 山东信蓝建设有限公司官网 | 萃取箱-萃取槽-PVC萃取箱厂家-混合澄清槽- 杭州南方化工设备 | 定做大型恒温循环水浴槽-工业用不锈钢恒温水箱-大容量低温恒温水槽-常州精达仪器 | 数控专用机床,专用机床,自动线,组合机床,动力头,自动化加工生产线,江苏海鑫机床有限公司 | 全温恒温摇床-水浴气浴恒温摇床-光照恒温培养摇床-常州金坛精达仪器制造有限公司 | 企业管理培训,企业培训公开课,企业内训课程,企业培训师 - 名课堂企业管理培训网 | 协议书_协议合同格式模板范本大全 | 鑫铭东办公家具一站式定制采购-深圳办公家具厂家直销 | 阳光模拟试验箱_高低温试验箱_高低温冲击试验箱_快速温变试验箱|东莞市赛思检测设备有限公司 | 铝镁锰板厂家_进口钛锌板_铝镁锰波浪板_铝镁锰墙面板_铝镁锰屋面-杭州军晟金属建筑材料 | 丽陂特官网_手机信号屏蔽器_Wifi信号干扰器厂家_学校考场工厂会议室屏蔽仪 | 成都治疗尖锐湿疣比较好的医院-成都治疗尖锐湿疣那家医院好-成都西南皮肤病医院 | 雪花制冰机(实验室雪花制冰机)百科 | 北京企业宣传片拍摄_公司宣传片制作-广告短视频制作_北京宣传片拍摄公司 | 餐饮小吃技术培训-火锅串串香培训「何小胖培训」_成都点石成金[官网] | 山东太阳能路灯厂家-庭院灯生产厂家-济南晟启灯饰有限公司 | 科研ELISA试剂盒,酶联免疫检测试剂盒,昆虫_植物ELISA酶免试剂盒-上海仁捷生物科技有限公司 | 成都装修公司-成都装修设计公司推荐-成都朗煜装饰公司 | 无尘烘箱_洁净烤箱_真空无氧烤箱_半导体烤箱_电子防潮柜-深圳市怡和兴机电 | 高温热泵烘干机,高温烘干热泵,热水设备机组_正旭热泵 | 恒温恒湿试验箱厂家-高低温试验箱维修价格_东莞环仪仪器_东莞环仪仪器 | 棉柔巾代加工_洗脸巾oem_一次性毛巾_浴巾生产厂家-杭州禾壹卫品科技有限公司 | 油液红外光谱仪-油液监测系统-燃油嗅探仪-上海冉超光电科技有限公司 | 【ph计】|在线ph计|工业ph计|ph计厂家|ph计价格|酸度计生产厂家_武汉吉尔德科技有限公司 | 电梯乘运质量测试仪_电梯安全评估测试仪-武汉懿之刻 | 激光内雕_led玻璃_发光玻璃_内雕玻璃_导光玻璃-石家庄明晨三维科技有限公司 激光内雕-内雕玻璃-发光玻璃 | 天津试验仪器-电液伺服万能材料试验机,恒温恒湿标准养护箱,水泥恒应力压力试验机-天津鑫高伟业科技有限公司 | 高防护蠕动泵-多通道灌装系统-高防护蠕动泵-www.bjhuiyufluid.com慧宇伟业(北京)流体设备有限公司 | 压片机_高速_单冲_双层_花篮式_多功能旋转压片机-上海天九压片机厂家 | 电磁辐射仪-电磁辐射检测仪-pm2.5检测仪-多功能射线检测仪-上海何亦仪器仪表有限公司 | 篮球地板厂家_舞台木地板品牌_体育运动地板厂家_凯洁地板 | Dataforth隔离信号调理模块-信号放大模块-加速度振动传感器-北京康泰电子有限公司 | 卫生人才网-中国专业的医疗卫生医学人才网招聘网站! | China plate rolling machine manufacturer,cone rolling machine-Saint Fighter |