“地球上最聰明AI”Grok 3發布,頭部大模型之爭愈演愈烈快訊
馬斯克團隊運行這段代碼,埃隆·馬斯克的人工智能初創公司xAI發布了Grok 3大模型,Grok3 推理系列模型更是達到了 90 及以上的分數。
【TechWeb】北京時間2月18日中午,埃隆·馬斯克的人工智能初創公司xAI發布了Grok 3大模型,馬斯克稱之為“地球上最聰明的人工智能”。Grok 3的發布,勢必將現在已經炙熱的模型之戰推向新的高潮。
Grok3的現場演示
在當天的直播中,馬斯克與該公司的三位工程師一起進行了現場演示,包括使用Grok3幫助火星飛船計算航天發射窗口,以及把俄羅斯方塊和消消樂兩款游戲“融合成一款”等。

尤其是工程師僅用“開發結合俄羅斯方塊和寶石迷陣玩法的2D游戲”這一自然語言指令,Grok3完成核心代碼生成與調試的演示令人印象深刻。
在演示的過程中,馬斯克要求使用Grok 3使用pygame組件設計一款游戲,把俄羅斯方塊和寶石迷陣縫合到一起。
同時還提示代碼可能會很長,需要保存到一個文件當中,運行成功后,生成的游戲即保留了俄羅斯方塊的經典玩法,而且還加入了“同色消除”的新規則。
在發布會上,馬斯克放話,今后Space X的發射任務,包括2026年火星探索任務,都將會借助Grok 3進行AI輔助。

隨后,在場的工程師要求Grok 3現場生成一段太空發射3D動畫的代碼,而在Grok-3生成代碼后,馬斯克團隊運行這段代碼,之后畫面上顯示出了飛船在地球和火星間往返的動畫的演示,突出了Grok-3的編程能力,這對AI模型理解復雜物理知識的要求非常高。
馬斯克對此表示,我們非常高興能夠推出 Grok-3,我們認為,在很短的時間內,它的功能比Grok-2強大一個數量級。這要歸功于一支不可思議的團隊的辛勤工作,我很榮幸能與這樣一支優秀的團隊合作。此外,他還預測,三年內,計算機將在各方面打破人類水平,實現諾貝爾獎級別突破。
推理能力超競爭對手
發布會演示顯示,在數學推理、科學邏輯推理等多方面的性能表現上,Grok3和Grok-3 mini都超過或媲美Gemini、DeepSeek和ChatGPT等對手,此外xAI還推出了功能更為強大的Grok3 Thinking推理模式。

具體表現在Grok3 在 AIME'24(美國數學競賽)、GPQA(研究生水平科學知識問答能力的基準測試)等測試中均取得了比 Gemini-2 pro、DeepSeek-v3、Claude 3.5 Sonnet 和 GPT-4o 更好的效果。

尤其在推理方面 ,Grok 3 Reasoning 和 Grok 3 mini Reasoning 在 AIME'24、GPQA 等測試中取得了壓倒性的優勢,最高分達到 96 分,超過了 o3 mini(high)、o1 和 DeepSeek-R1 等前沿模型。甚至在最新的 AIME 2025 評測中 ,Grok3 推理系列模型更是達到了 90 及以上的分數,稍微領先 o3 mini(high) 的 87 分。

此外,在 Chatbot Arena 評估中,Grok-3 的得分更是達到了 1400 分,同樣超過了 Gemini 系列和 chatgpt-4o 和 DeepSeek-R1。
值得一提的是,GPT-4o和Gemini相比,Grok 3在處理復雜問題時不僅能給出正確答案,還能詳細解釋解題思路,幫助用戶理解背后的邏輯。
除了數學、編程、推理能力超強外,Grok3的多模態能力也是提升明顯,另外,Grok 3引入了DeepSearch,它能夠掃描互聯網和X平臺(原Twitter),為用戶提供信息摘要,幫助用戶查找最新的科技信息。
在發布會現場,xAI團隊預測2025年NCAA“瘋狂三月”籃球賽的全部勝負結果,最終Grok 3給出了它認為的2025年NCAA冠軍,具體預測正確與否,答案即將在3月揭曉。
xAI團隊在直播中展示稱,在訓練Grok的過程中,團隊搭建了大型算力集群,并克服了散熱、電力等問題帶來的挑戰,用了122天讓首批10萬張GPU投入使用并正常運行,后續還計劃將集群規模繼續擴大一倍。
最后,馬斯克表示,未來,最快一周后Grok 將獲得“語音模式”。幾周后,Grok 3模型將與 DeepSearch功能一起出現在xAI企業的API中。而當下一個版本完全發布時,我們將開源Grok的上一個版本。
頗具挑戰意味的是,就在Grok 3發布前數小時,OpenAI首席執行官兼聯合創始人SamAltman表示,對于高要求的測試者來說,試用GPT-4.5帶來的AGI的感受體驗,遠比我預期的要深刻得多,看來GPT-4.5已經進入測試階段,離正式發布也不遠了。
可以預見,隨著Grok-3的發布,頭部AI大模型的競爭將愈演愈烈。(御風)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。