“鐵打的應(yīng)用,流水的模型”形勢(shì)下,該如何構(gòu)建企業(yè)級(jí)AI應(yīng)用?快訊
亞馬遜云科技就已為企業(yè)提供了4種方式來(lái)部署DeepSeek-R1系列模型,亞馬遜云科技現(xiàn)已推出針對(duì)DeepSeek-R1模型四種不同的部署方式,基于場(chǎng)景選擇合適的模型只是企業(yè)構(gòu)建應(yīng)用旅程的第一步。
【TechWeb】2月7日消息,新年伊始,AI領(lǐng)域又迎來(lái)了一位耀眼的新星——DeepSeek。這位初出茅廬卻勢(shì)不可擋的選手,以驚人的速度席卷全球,超越ChatGPT成為全球增速最快的AI應(yīng)用,也吸引了越來(lái)越多的企業(yè)使用DeepSeek系列模型。
事實(shí)上,類似的劇情在過(guò)去一年中已屢見(jiàn)不鮮,從GPT4到Claude 3.5再到o1……雖然這次的主角是DeepSeek,但AI領(lǐng)域還處于“模型爭(zhēng)霸”時(shí)代的本質(zhì)依然沒(méi)變。
每當(dāng)一個(gè)更強(qiáng)模型出現(xiàn)時(shí),對(duì)普通用戶而言,要使用最新AI很簡(jiǎn)單,下載對(duì)應(yīng)的APP(比如這次是DeepSeek APP)直接用起來(lái)就行了。但是,對(duì)依賴大模型構(gòu)建的企業(yè)級(jí)AI應(yīng)用來(lái)說(shuō),要想每次都能快速、無(wú)縫使用上最新大模型的能力,就沒(méi)這么簡(jiǎn)單了,需要解決一系列部署和使用模型中的工程化問(wèn)題。
站在企業(yè)視角,“模型爭(zhēng)霸”時(shí)代可謂是“鐵打的應(yīng)用,流水的模型”。那么,自身鐵打的應(yīng)用,該如何每次都能無(wú)縫搭乘上流水般涌現(xiàn)的新模型的東風(fēng),無(wú)疑是企業(yè)最關(guān)心的事。
“不會(huì)有一個(gè)模型一統(tǒng)天下”,亞馬遜CEO Andy Jassy在2024 re:Invent上分享了亞馬遜自身部署人工智能的關(guān)鍵洞察時(shí)就強(qiáng)調(diào)過(guò)。
在此洞察下,亞馬遜云科技對(duì)幫助客戶構(gòu)建企業(yè)級(jí)AI應(yīng)用早已有了一套成熟的思維方式和工具箱。比如,在第一時(shí)間,亞馬遜云科技就已為企業(yè)提供了4種方式來(lái)部署DeepSeek-R1系列模型。
這里一起看看亞馬遜云科技構(gòu)建企業(yè)級(jí)AI應(yīng)用的思維和工具。
認(rèn)識(shí)到模型多樣性的重要
如同Andy Jassy在此前的演講中所述:“就像數(shù)據(jù)庫(kù)領(lǐng)域,探討了10年,大家會(huì)使用各種各樣的關(guān)系型數(shù)據(jù)庫(kù)或者非關(guān)系型數(shù)據(jù)庫(kù)。在分析領(lǐng)域也是如此,曾經(jīng)大家覺(jué)得TensorFlow會(huì)成為唯一的AI框架,而一直強(qiáng)調(diào)會(huì)有很多不同框架出現(xiàn),最終PyTorch成為了最受歡迎的那個(gè)。”企業(yè)在基于大模型構(gòu)建應(yīng)用時(shí),不同的應(yīng)用場(chǎng)景需要的技術(shù)指標(biāo)也各不相同,延遲、成本、微調(diào)能力、知識(shí)庫(kù)協(xié)調(diào)能力、多模態(tài)支持能力等等,都會(huì)因場(chǎng)景需求的不同而被取舍。

2024年12月亞馬遜CEO Andy Jassy在2024 re:Invent上演講
就以DeepSeek為例,其于2024年12月推出DeepSeek-V3模型后,于2025年1月20日相繼發(fā)布了參數(shù)規(guī)模達(dá)6710億的DeepSeek-R1、DeepSeek-R1-Zero以及參數(shù)范圍覆蓋15億至700億的DeepSeek-R1-Distill系列模型。2025年1月27日,DeepSeek又新增了基于視覺(jué)的Janus-Pro-7B模型。這些模型均已開(kāi)源,公開(kāi)資料顯示,DeepSeek系列模型通過(guò)強(qiáng)化學(xué)習(xí)等創(chuàng)新訓(xùn)練方法,在推理能力方面具有顯著優(yōu)勢(shì),并且成本效益比同類模型高出90%-95%。
但是,以快速響應(yīng)場(chǎng)景為例,DeepSeek R1的深層思考模式顯然不太合適,其生成首個(gè)token的用時(shí)超過(guò)30秒,而Amazon Nova模型則只需要數(shù)百毫秒即可生成響應(yīng)。另外,目前的DeepSeek-V3模型只是文生文模型,不支持圖形等多模態(tài)信息的輸入。
可見(jiàn),強(qiáng)如DeepSeek模型也不是萬(wàn)能的。
正是從最初就洞察到“不會(huì)有一個(gè)模型一統(tǒng)天下”,亞馬遜云科技在精進(jìn)自身大模型的同時(shí),一直致力于為企業(yè)用戶提供豐富的模型“選擇”。
目前,Amazon Bedrock已上架AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI、poolside等廠商的最新大模型,近期還上線了Luma AI Ray 2 模型。
同時(shí),亞馬遜云科技還推出了Amazon Bedrock Marketplace功能,為客戶提供100多個(gè)熱門、新興及專業(yè)模型,這其中就包括DeepSeek-R1。
如Andy Jassy所言,亞馬遜云科技提供的豐富且有深度的模型,讓客戶能夠根據(jù)自身獨(dú)特需求,精確選擇最合適的解決方案。關(guān)注客戶需求與技術(shù)發(fā)展,亞馬遜云科技持續(xù)擴(kuò)展模型選擇,既要有潛力的新興模型,也要有行業(yè)內(nèi)的經(jīng)典模型。
打造企業(yè)級(jí)AI工具全家桶
需要注意的是,基于場(chǎng)景選擇合適的模型只是企業(yè)構(gòu)建應(yīng)用旅程的第一步。隨著構(gòu)建的深入,解決工程化問(wèn)題的能力成為能否成功構(gòu)建的關(guān)鍵。
模型成本、性能、能否針對(duì)私有數(shù)據(jù)進(jìn)行定制優(yōu)化,夠不夠安全,不同尺寸的模型和日益增長(zhǎng)的各種智能體的復(fù)雜調(diào)度等等,這些企業(yè)部署和使用模型中的工程化問(wèn)題都需要得到完美解決。
以DeepSeek為例,其公開(kāi)的模型有V3和R1等不同的型號(hào),R1也有不同的尺寸規(guī)模,如DeepSeek-R1-Distill系列模型參數(shù)范圍是15億至700億,而R1和R1-Zero的參數(shù)規(guī)模則達(dá)到6710億。要完整部署R1實(shí)現(xiàn)完美推理和響應(yīng),還需要配套的便捷工具。
Amazon Bedrock聚焦企業(yè)應(yīng)用AI的實(shí)際需求,在提供豐富模型選擇的同時(shí),增添了一系列工具和功能。如低延遲優(yōu)化推理、模型蒸餾、提示詞緩存等功能,大幅提升推理效率。以模型蒸餾功能為例,它能夠?qū)⑻囟ㄖR(shí)從功能強(qiáng)大的大模型轉(zhuǎn)移到更小、更高效的模型,運(yùn)行速度最快可提高500%,成本降低75%。
Amazon Bedrock支持基于企業(yè)自有數(shù)據(jù)的定制優(yōu)化。如模型微調(diào)功能,支持GraphRAG等圖數(shù)據(jù),以及夠快速且經(jīng)濟(jì)高效地從文檔、圖像、音頻以及視頻中提取信息,并將其轉(zhuǎn)換為結(jié)構(gòu)化格式的Amazon Bedrock Data Automation功能等。
Amazon Bedrock負(fù)責(zé)任AI的安全和審查,通過(guò)不斷豐富Guardrails功能,以簡(jiǎn)化企業(yè)實(shí)施負(fù)責(zé)任AI的投入,例入為其加入自動(dòng)推理檢查功能,從而能夠輕松識(shí)別事實(shí)性錯(cuò)誤,以提升生成回答的準(zhǔn)確性。
Amazon Bedrock不但提供智能體功能,還針對(duì)智能體的快速發(fā)展,進(jìn)一步推出了多智能體協(xié)作功能,使客戶能夠輕松地構(gòu)建和協(xié)調(diào)專業(yè)智能體來(lái)執(zhí)行復(fù)雜的工作流程。憑借多智能體協(xié)作功能,客戶可以通過(guò)為項(xiàng)目的特定步驟創(chuàng)建和分配專用智能體,從而獲得更準(zhǔn)確的結(jié)果,并通過(guò)編排多個(gè)并行工作的智能體來(lái)加速任務(wù)。
目前,亞馬遜云科技現(xiàn)已推出針對(duì)DeepSeek-R1模型四種不同的部署方式,企業(yè)可以在熟悉的亞馬遜云科技環(huán)境中輕松部署該系列模型,例如在Amazon Bedrock Marketplace中部署,或在Amazon SageMaker Jumpstart中部署,也可以通過(guò)Amazon Bedrock自定義導(dǎo)入功能或Amazon EC2 Trn1實(shí)例中部署DeepSeek-R1-Distill系列模型。

圖注:在Amazon Bedrock Marketplace中調(diào)用DeepSeek-R1模型

圖注:在Amazon SageMaker Jumpstart中部署DeepSeek-R1模型
總結(jié)來(lái)看,亞馬遜云科技圍繞云和AI領(lǐng)域展開(kāi)的全棧式創(chuàng)新,為企業(yè)運(yùn)用全球領(lǐng)先模型提供三大支持:
首先是云端本身的優(yōu)勢(shì),與本地部署相比,云端部署更靈活更易擴(kuò)展,同時(shí)也能與云端豐富且成熟的分析、數(shù)據(jù)等基礎(chǔ)服務(wù)進(jìn)行無(wú)縫集成;
其次是多樣化的模型選擇優(yōu)勢(shì),不同的場(chǎng)景能夠靈活選擇不同成本、性能、響應(yīng)速度的模型,從而實(shí)現(xiàn)最優(yōu)的性價(jià)比組合;
最后是模型從原型走向企業(yè)化生產(chǎn)環(huán)境時(shí)必須要考慮的一系列重要功能,堪稱企業(yè)級(jí)AI全家桶,包括優(yōu)化成本、根據(jù)自有數(shù)據(jù)定制提升準(zhǔn)確性、至關(guān)重要的安全性以及針對(duì)未來(lái)復(fù)雜的多智能體構(gòu)建和管理等。
亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建強(qiáng)調(diào):“亞馬遜云科技是全球云計(jì)算的開(kāi)創(chuàng)者和引領(lǐng)者,更是企業(yè)構(gòu)建和應(yīng)用生成式AI的首選。我們不僅在云的核心服務(wù)層面持續(xù)創(chuàng)新,更在從芯片到模型,再到應(yīng)用的每一個(gè)技術(shù)堆棧取得突破,讓不同層級(jí)的創(chuàng)新相互賦能、協(xié)同進(jìn)化。我相信,只有這樣全棧聯(lián)動(dòng)的大規(guī)模創(chuàng)新才能真正滿足當(dāng)今客戶的發(fā)展需求,加速前沿技術(shù)的價(jià)值釋放,助力各行各業(yè)重塑未來(lái)。”(果青)
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。