亞馬遜云科技推出配備72個英偉達Blackwell GPU的新實例 算力提升20倍快訊
亞馬遜云科技已推出了基于NVIDIA Blackwell GPU的Amazon EC2 P6-B200實例,Amazon EC2 P6-B200實例的GPU計算能力是其2.25倍,Amazon SageMaker HyperPod將支持Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200實例。
【TechWeb】7月10日消息,為了加速推理模型、Agentic AI系統等新興生成式AI技術的發展,亞馬遜云科技宣布由NVIDIA Grace Blackwell Superchips加速的_Amazon EC2 P6e-GB200 UltraServer_現已正式可用。P6e-GB200 UltraServer專為訓練和部署最大規模、最復雜的AI模型而設計。
今年早些時候,亞馬遜云科技已推出了基于NVIDIA Blackwell GPU的Amazon EC2 P6-B200實例,支持多樣化的AI和高性能計算工作負載。
Amazon EC2 P6e-GB200 UltraServer是亞馬遜云科技迄今為止最強大的GPU產品,配備最多72個NVIDIA Blackwell GPU,這些GPU通過第五代NVIDIA NVLink互連,并作為單一計算單元運行。每臺UltraServer可提供高達360 petaflops的高密度FP8算力,以及13.4TB的高帶寬顯存(HBM3e)——相比P5en實例,在單個NVLink域內的計算能力提升超過20倍,內存容量提升超過11倍。Amazon EC2 P6e-GB200 UltraServer支持高達28.8 Tbps的第四代Elastic Fabric Adapter(EFAv4)網絡帶寬。
Amazon EC2 P6-B200實例為廣泛AI場景提供靈活選擇。每個實例配備8個通過NVLink互連的NVIDIA Blackwell GPU,擁有1.4TB高帶寬顯存和最高3.2 Tbps的EFAv4網絡帶寬,以及第五代Intel Xeon Scalable處理器。與Amazon EC2 P5en實例相比,Amazon EC2 P6-B200實例的GPU計算能力是其2.25倍,顯存容量為其1.27倍,顯存帶寬為其1.6倍。
目前,亞馬遜云科技通過多種部署路徑簡化Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200實例的啟用過程,客戶可快速開始使用Blackwell GPU,同時保持其現有的運維模式。
Amazon SageMaker HyperPod將支持Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200實例,并通過優化使工作負載保持在同一NVLink域內,以實現性能最大化。亞馬遜云科技還在構建一套完整的多層級恢復機制:Amazon SageMaker HyperPod可在同一NVLink域內自動用預配置的備用實例替換故障節點。內置儀表板將提供從GPU利用率、內存使用情況到工作負載指標和UltraServer運行狀態的全面可視化信息。
同時,Amazon EC2 P6e-GB200 UltraServer也將通過NVIDIA DGX Cloud提供。DGX Cloud是一個統一的AI平臺,在各層架構均經過優化,具備多節點AI訓練與推理能力,并集成英偉達完整的AI軟件棧。客戶可充分利用英偉達最新的性能優化方案、基準測試方法和技術專長,以提升效率與性能。該平臺還提供靈活的服務期限選擇,以及由英偉達專家提供的全面支持與服務,助力客戶加速推進AI項目。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。