混合推理+最強編碼能力大模型Claude Sonnet 3.7上線Amazon Bedrock快訊
Claude 3.7 Sonnet同時具備深度推理(深度思維模式,首個混合推理模型Claude Sonnet 3.7,開發者可通過Amazon Q為特定任務選擇最合適的模型(例如Claude 3.7 Sonnet)。
【TechWeb】2月26日消息,Anthropic首款混合推理模型Claude Sonnet 3.7近日發布,并第一時間上架亞馬遜云科技,用戶通過Amazon Bedrock等即可絲滑使用。

作為Anthropic迄今為止最智能的模型,Claude 3.7 Sonnet在編碼和前端Web開發方面顯著提升,實現了全面領先。
此外,Claude 3.7 Sonnet的突出優勢是:其是首個混合推理模型,既能快速響應也能進行深度思維,能通過細致、逐步的推理解決復雜問題。通過API調用時,用戶可精準控制大模型思考時間,進而準確控制推理成本。一經上線,吸引業內廣泛關注。
亞馬遜云科技CEO Matt Garman在LinkedIn上發文表示:“Claude 3.7 Sonnet現已在Amazon Bedrock上線,它代表了人工智能推理技術的一項進步。作為Anthropic目前最智能的模型,3.7 Sonnet引入了混合推理功能,既能快速響應,又能進行深入分析,并且可以在這兩種模式之間切換。這意味著它具備非凡的靈活性,無論是驅動面向客戶的人工智能智能體,還是處理復雜的工作流程,都能對速度、性能和成本進行控制。”
首個混合推理模型Claude Sonnet 3.7,推理成本優化能手
如Anthropic強調,Claude 3.7 Sonnet與市面上的其他推理模型不同,它是一款混合推理模型。
“正如人類使用同一個大腦進行快速反應和深度思考一樣,我們認為推理應該是前沿模型的綜合能力,而不是完全獨立的模型。這種統一的方法也為用戶創造了更無縫的體驗。”
因此,Claude 3.7 Sonnet同時具備深度推理(深度思維模式,一步一步思考復雜答案)與快速回復(標準模式,實時生成答案)的能力。API用戶可以對模型的思考時間進行細粒度控制。
具體而言,Claude 3.7 Sonnet Claude 3.7 Sonnet既可以當作大語言模型使用,也可以當作深度推理模型使用:用戶可以選擇什么時候讓模型快速回答,什么時候讓它在回答之前思考更長時間。
在標準模式下,Claude 3.7Sonnet代表了Claude 3.5 Sonnet的升級版。在深度思維模式下,它在回答之前進行深度思考,這提高了Claude 3.7Sonnet在數學、物理、指令遵循、編碼和許多其他任務上的表現。
與Claude 3.5 Sonnet相比,Claude 3.7Sonnet模型的輸出長度提升15倍以上。Claude 3.7 Sonnet支持最長128K token的輸出(64K為普遍可用版本,128K為測試版)。這一增強能力在需要詳細內容、多個示例或額外上下文及背景信息時尤為實用。若要生成長輸出,可嘗試要求模型提供詳細大綱(針對寫作場景,可指定段落級大綱細節并包含目標字數),然后要求響應按大綱索引段落并重申字數。
當通過API使用Claude 3.7 Sonnet時,用戶可以精準控制模型的思考時間,開發者可以通過精準控制模型在處理查詢時使用的計算資源量,API用戶可以告訴Claude思考的數量不超過 N 個token,N 的值可以是任何值,但輸出上限不能超過 128K個token。而模型能力的表現,取決于允許思考的token數量,Claude 3.7 Sonnet讓開發者在速度(和成本)與答案質量之間進行權衡。

另外值得一提的是,Claude 3.7 Sonnet也是Anthropic最強大的編碼模型,在編碼和前端Web開發方面顯著提升,實現了全面領先。
根據Anthropic的數據,其標準模式在SWE-bench Verified上的成績為70.3%,達到行業領先水平。Claude 3.7 Sonnet在多數基準測試中的表現也優于Claude 3.5 Sonnet。這些增強能力使其成為驅動AI智能體和復雜工作流的理想選擇。
Claude 3.7 Sonnet的增強能力可惠及多個行業場景。企業可創建直接與客戶交互的先進AI助手與智能體;在醫療領域,它能輔助醫學影像分析與研究摘要;在金融服務領域,它解決復雜金融建模問題的能力能帶來諸多益處。對于開發者而言,它可作為編碼助手,審查代碼、解釋技術概念,并針對不同語言提出改進建議。
上線Amazon Bedrock,助力構建更強大的生成式AI應用
Anthropic的Claude 3.7 Sonnet基礎模型在發布的第一時間就已上線Amazon Bedrock。
Claude 3.7 Sonnet提供兩種模式——標準模式和深度思維模式,可在Amazon Bedrock中切換,用戶可控制思考預算,幫助用戶在速度、成本和性能之間找到最優解。
此外,Claude 3.7 Sonnet也被加入Amazon Q Developer的模型列表中。Amazon Q基于Amazon Bedrock構建,開發者可通過Amazon Q為特定任務選擇最合適的模型(例如Claude 3.7 Sonnet),以支持更高級的編碼工作流,從而加速整個軟件開發生命周期的構建。
據亞馬遜云科技生成式AI副總裁Vasi Philomin介紹:"使用 Claude 3.7 Sonnet 的早期用戶反饋,在使用深度思維模式時,該模型在數學、物理、競賽編程和深入分析方面表現最為出色。再結合Amazon Bedrock的豐富功能,Claude 3.7 Sonnet將幫助客戶構建更強大的生成式AI應用。"
下面,附上Amazon Bedrock上使用Claude 3.7 Sonnet的方法:
在Amazon Bedrock控制臺中請求訪問權限。在導航窗格中,選擇模型訪問。然后,修改模型訪問以請求訪問Claude 3.7 Sonnet。

嘗試Claude 3.7 Sonnet,選擇導航窗格中Playgrounds下的Chat/Text。然后,選擇“選擇模型”,并在“類別”下選擇了“ Anthropic”,在“模型”下選擇“Claude 3.7 Sonnet”。為了啟用深度思維模式,在“配置”下切換“模型推理”(Model reasoning)。即可在右側文本框輸入需求問題進行體驗。

Claude 3.7 Sonnet還有很強的圖像到文本的視覺能力,上傳了一張使用Amazon Bedrock創建的詳細建筑平面圖的圖像,就可以收到這份網站計劃的詳細分析和合理見解。

1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。