精品国产乱码久久久久,а√天堂中文在线资源8,日本综合色

“地球上最聰明AI”Grok 3發布，頭部大模型之爭愈演愈烈快訊

TechWeb.com.cn 2025-02-18 18:02

分享到：

導讀

馬斯克團隊運行這段代碼，埃隆·馬斯克的人工智能初創公司xAI發布了Grok 3大模型，Grok3 推理系列模型更是達到了 90 及以上的分數。

【TechWeb】北京時間2月18日中午，埃隆·馬斯克的人工智能初創公司xAI發布了Grok 3大模型，馬斯克稱之為“地球上最聰明的人工智能”。Grok 3的發布，勢必將現在已經炙熱的模型之戰推向新的高潮。

Grok3的現場演示

在當天的直播中，馬斯克與該公司的三位工程師一起進行了現場演示，包括使用Grok3幫助火星飛船計算航天發射窗口，以及把俄羅斯方塊和消消樂兩款游戲“融合成一款”等。

尤其是工程師僅用“開發結合俄羅斯方塊和寶石迷陣玩法的2D游戲”這一自然語言指令，Grok3完成核心代碼生成與調試的演示令人印象深刻。

在演示的過程中，馬斯克要求使用Grok 3使用pygame組件設計一款游戲，把俄羅斯方塊和寶石迷陣縫合到一起。

同時還提示代碼可能會很長，需要保存到一個文件當中，運行成功后，生成的游戲即保留了俄羅斯方塊的經典玩法，而且還加入了“同色消除”的新規則。

在發布會上，馬斯克放話，今后Space X的發射任務，包括2026年火星探索任務，都將會借助Grok 3進行AI輔助。

隨后，在場的工程師要求Grok 3現場生成一段太空發射3D動畫的代碼，而在Grok-3生成代碼后，馬斯克團隊運行這段代碼，之后畫面上顯示出了飛船在地球和火星間往返的動畫的演示，突出了Grok-3的編程能力，這對AI模型理解復雜物理知識的要求非常高。

馬斯克對此表示，我們非常高興能夠推出 Grok-3，我們認為，在很短的時間內，它的功能比Grok-2強大一個數量級。這要歸功于一支不可思議的團隊的辛勤工作，我很榮幸能與這樣一支優秀的團隊合作。此外，他還預測，三年內，計算機將在各方面打破人類水平，實現諾貝爾獎級別突破。

推理能力超競爭對手

發布會演示顯示，在數學推理、科學邏輯推理等多方面的性能表現上，Grok3和Grok-3 mini都超過或媲美Gemini、DeepSeek和ChatGPT等對手，此外xAI還推出了功能更為強大的Grok3 Thinking推理模式。

具體表現在Grok3 在 AIME'24（美國數學競賽）、GPQA（研究生水平科學知識問答能力的基準測試）等測試中均取得了比 Gemini-2 pro、DeepSeek-v3、Claude 3.5 Sonnet 和 GPT-4o 更好的效果。

尤其在推理方面，Grok 3 Reasoning 和 Grok 3 mini Reasoning 在 AIME'24、GPQA 等測試中取得了壓倒性的優勢，最高分達到 96 分，超過了 o3 mini(high)、o1 和 DeepSeek-R1 等前沿模型。甚至在最新的 AIME 2025 評測中，Grok3 推理系列模型更是達到了 90 及以上的分數，稍微領先 o3 mini(high) 的 87 分。

此外，在 Chatbot Arena 評估中，Grok-3 的得分更是達到了 1400 分，同樣超過了 Gemini 系列和 chatgpt-4o 和 DeepSeek-R1。

值得一提的是，GPT-4o和Gemini相比，Grok 3在處理復雜問題時不僅能給出正確答案，還能詳細解釋解題思路，幫助用戶理解背后的邏輯。

除了數學、編程、推理能力超強外，Grok3的多模態能力也是提升明顯，另外，Grok 3引入了DeepSearch，它能夠掃描互聯網和X平臺（原Twitter），為用戶提供信息摘要，幫助用戶查找最新的科技信息。

在發布會現場，xAI團隊預測2025年NCAA“瘋狂三月”籃球賽的全部勝負結果，最終Grok 3給出了它認為的2025年NCAA冠軍，具體預測正確與否，答案即將在3月揭曉。

xAI團隊在直播中展示稱，在訓練Grok的過程中，團隊搭建了大型算力集群，并克服了散熱、電力等問題帶來的挑戰，用了122天讓首批10萬張GPU投入使用并正常運行，后續還計劃將集群規模繼續擴大一倍。

最后，馬斯克表示，未來，最快一周后Grok 將獲得“語音模式”。幾周后，Grok 3模型將與 DeepSearch功能一起出現在xAI企業的API中。而當下一個版本完全發布時，我們將開源Grok的上一個版本。

頗具挑戰意味的是，就在Grok 3發布前數小時，OpenAI首席執行官兼聯合創始人SamAltman表示，對于高要求的測試者來說，試用GPT-4.5帶來的AGI的感受體驗，遠比我預期的要深刻得多，看來GPT-4.5已經進入測試階段，離正式發布也不遠了。

可以預見，隨著Grok-3的發布，頭部AI大模型的競爭將愈演愈烈。（御風）

Grok 馬斯克 Grok- 模型團隊

分享到：

1.TMT觀察網遵循行業規范，任何轉載的稿件都會明確標注作者和來源；
2.TMT觀察網的原創文章，請轉載時務必注明文章作者和"來源：TMT觀察網"，不尊重原創的行為TMT觀察網或將追究責任；
3.作者投稿可能會經TMT觀察網編輯修改或補充。

TMT观察网_独特视角观察TMT行业

“地球上最聰明AI”Grok 3發布，頭部大模型之爭愈演愈烈快訊