DeepSeek的普惠效應引發產業變革 如何高效部署成關鍵快訊
助力DeepSeek模型推理性能提升30%+,DeepSeek模型發布即原生支持昇騰,昇騰通過并行推理優化技術+專家負載均衡能力。
【TechWeb】DeepSeek作為AI領域的創新先鋒,正在通過工程創新和技術突破,顯著提升普惠優質AI的可獲得性,激發全產業的創新活力。
DeepSeek加速了AI技術的普惠化進程。通過工程創新,DeepSeek將訓練效率提升了2~3倍,推理效率提升了5~7倍,極大地縮短了模型開發和部署的時間成本,推動了從基礎研究到商業應用的全產業鏈變革。
在企業端(To B),不分行業,各企業以沖刺方式接入DeepSeek,獲取流量。自R1發布后的20天內(截至2月12日),國內外已有160多家企業集體接入DeepSeek。
在消費端(To C),用戶呈爆炸式增長,超級APP快速出現,加速了LLM的全面普及。DeepSeek以現象級表現提升了社會對LLM的認知,促進了新商業模式的成型,實現了商業正循環。
DeepSeek正通過極致工程優化,提升算力利用率,穩定可靠的算力底座仍是模型創新的關鍵。
據了解,DeepSeek模型發布即原生支持昇騰,國內70%客戶、伙伴基于昇騰快速上線。截至2月12日,80+ 客戶/伙伴基于昇騰已上線DeepSeek,20+適配測試中(預計兩周內全部上線),昇騰助力20+省、25城市AICC啟動部署DS系列模型,全國超70%區域可獲取本地支持。
在訓練能力方面,昇騰超節點支持DeepSeek全系模型預訓練及微調,支持DualPipe、跨節點All2All等DeepSeek核心優化技術,超大帶寬通信域更適合DeepSeek的流水線并行算法及冗余專家等能力。DeepSeek R1是強化學習RL模型,昇騰超節點是更適合DeepSeek V3/R1的解決方案。
在推理能力方面,昇騰通過并行推理優化技術+專家負載均衡能力,助力DeepSeek模型推理性能提升30%+。DeepSeek小專家創新架構,帶來的是通信耗時及專家負載不均挑戰,更多的小專家并行,引入極大的通信開銷,更多專家的數據負載難以均衡。
目前,昇騰聯合伙伴推出形態豐富的產品和解決方案(如:一體機、云服務、硬件+開源社區等)幫助企業快速部署,已覆蓋互聯網、金融、運營商、政務、教育等多個行業。(御風)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。