TMT观察网_独特视角观察TMT行业

“地球上最聰明AI”Grok 3發布,頭部大模型之爭愈演愈烈快訊

TechWeb.com.cn 2025-02-18 18:02
分享到:
導讀

馬斯克團隊運行這段代碼,埃隆·馬斯克的人工智能初創公司xAI發布了Grok 3大模型,Grok3 推理系列模型更是達到了 90 及以上的分數。

【TechWeb】北京時間2月18日中午,埃隆·馬斯克的人工智能初創公司xAI發布了Grok 3大模型,馬斯克稱之為“地球上最聰明的人工智能”。Grok 3的發布,勢必將現在已經炙熱的模型之戰推向新的高潮。

Grok3的現場演示

在當天的直播中,馬斯克與該公司的三位工程師一起進行了現場演示,包括使用Grok3幫助火星飛船計算航天發射窗口,以及把俄羅斯方塊和消消樂兩款游戲“融合成一款”等。

尤其是工程師僅用“開發結合俄羅斯方塊和寶石迷陣玩法的2D游戲”這一自然語言指令,Grok3完成核心代碼生成與調試的演示令人印象深刻。

在演示的過程中,馬斯克要求使用Grok 3使用pygame組件設計一款游戲,把俄羅斯方塊和寶石迷陣縫合到一起。

同時還提示代碼可能會很長,需要保存到一個文件當中,運行成功后,生成的游戲即保留了俄羅斯方塊的經典玩法,而且還加入了“同色消除”的新規則。

在發布會上,馬斯克放話,今后Space X的發射任務,包括2026年火星探索任務,都將會借助Grok 3進行AI輔助。

隨后,在場的工程師要求Grok 3現場生成一段太空發射3D動畫的代碼,而在Grok-3生成代碼后,馬斯克團隊運行這段代碼,之后畫面上顯示出了飛船在地球和火星間往返的動畫的演示,突出了Grok-3的編程能力,這對AI模型理解復雜物理知識的要求非常高。

馬斯克對此表示,我們非常高興能夠推出 Grok-3,我們認為,在很短的時間內,它的功能比Grok-2強大一個數量級。這要歸功于一支不可思議的團隊的辛勤工作,我很榮幸能與這樣一支優秀的團隊合作。此外,他還預測,三年內,計算機將在各方面打破人類水平,實現諾貝爾獎級別突破。

推理能力超競爭對手

發布會演示顯示,在數學推理、科學邏輯推理等多方面的性能表現上,Grok3和Grok-3 mini都超過或媲美Gemini、DeepSeek和ChatGPT等對手,此外xAI還推出了功能更為強大的Grok3 Thinking推理模式。

具體表現在Grok3 在 AIME'24(美國數學競賽)、GPQA(研究生水平科學知識問答能力的基準測試)等測試中均取得了比 Gemini-2 pro、DeepSeek-v3、Claude 3.5 Sonnet 和 GPT-4o 更好的效果。

尤其在推理方面 ,Grok 3 Reasoning 和 Grok 3 mini Reasoning 在 AIME'24、GPQA 等測試中取得了壓倒性的優勢,最高分達到 96 分,超過了 o3 mini(high)、o1 和 DeepSeek-R1 等前沿模型。甚至在最新的 AIME 2025 評測中 ,Grok3 推理系列模型更是達到了 90 及以上的分數,稍微領先 o3 mini(high) 的 87 分。

此外,在 Chatbot Arena 評估中,Grok-3 的得分更是達到了 1400 分,同樣超過了 Gemini 系列和 chatgpt-4o 和 DeepSeek-R1。

值得一提的是,GPT-4o和Gemini相比,Grok 3在處理復雜問題時不僅能給出正確答案,還能詳細解釋解題思路,幫助用戶理解背后的邏輯。

除了數學、編程、推理能力超強外,Grok3的多模態能力也是提升明顯,另外,Grok 3引入了DeepSearch,它能夠掃描互聯網和X平臺(原Twitter),為用戶提供信息摘要,幫助用戶查找最新的科技信息。

在發布會現場,xAI團隊預測2025年NCAA“瘋狂三月”籃球賽的全部勝負結果,最終Grok 3給出了它認為的2025年NCAA冠軍,具體預測正確與否,答案即將在3月揭曉。

xAI團隊在直播中展示稱,在訓練Grok的過程中,團隊搭建了大型算力集群,并克服了散熱、電力等問題帶來的挑戰,用了122天讓首批10萬張GPU投入使用并正常運行,后續還計劃將集群規模繼續擴大一倍。

最后,馬斯克表示,未來,最快一周后Grok 將獲得“語音模式”。幾周后,Grok 3模型將與 DeepSearch功能一起出現在xAI企業的API中。而當下一個版本完全發布時,我們將開源Grok的上一個版本。

頗具挑戰意味的是,就在Grok 3發布前數小時,OpenAI首席執行官兼聯合創始人SamAltman表示,對于高要求的測試者來說,試用GPT-4.5帶來的AGI的感受體驗,遠比我預期的要深刻得多,看來GPT-4.5已經進入測試階段,離正式發布也不遠了。

可以預見,隨著Grok-3的發布,頭部AI大模型的競爭將愈演愈烈。(御風)

Grok 馬斯克 Grok- 模型 團隊
分享到:

1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。


主站蜘蛛池模板: 药品仓库用除湿机-变电站用防爆空调-油漆房用防爆空调-杭州特奥环保科技有限公司 | 双齿辊破碎机-大型狼牙破碎机视频-对辊破碎机价格/型号图片-金联机械设备生产厂家 | 聚合甘油__盐城市飞龙油脂有限公司 | 菲希尔FISCHER测厚仪-铁素体检测仪-上海吉馨实业发展有限公司 | 高压微雾加湿器_工业加湿器_温室喷雾-昌润空气净化设备 | 仓储货架_南京货架_钢制托盘_仓储笼_隔离网_环球零件盒_诺力液压车_货架-南京一品仓储设备制造公司 | 工业雾炮机_超细雾炮_远程抑尘射雾器-世纪润德环保设备 | 讲师宝经纪-专业培训机构师资供应商_培训机构找讲师、培训师、讲师经纪就上讲师宝经纪 | 高清视频编码器,4K音视频编解码器,直播编码器,流媒体服务器,深圳海威视讯技术有限公司 | 小港信息港-鹤壁信息港 鹤壁老百姓便民生活信息网站 | 双段式高压鼓风机-雕刻机用真空泵-绍兴天晨机械有限公司 | 北京三友信电子科技有限公司-ETC高速自动栏杆机|ETC机柜|激光车辆轮廓测量仪|嵌入式车道控制器 | 石膏基自流平砂浆厂家-高强石膏基保温隔声自流平-轻质抹灰石膏粉砂浆批发-永康市汇利建设有限公司 | 中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折! | 尾轮组_头轮组_矿用刮板_厢式刮板机_铸石刮板机厂家-双驰机械 | 智成电子深圳tdk一级代理-提供TDK电容电感贴片蜂鸣器磁芯lambda电源代理经销,TDK代理商有哪些TDK一级代理商排名查询。-深圳tdk一级代理 | 市政路灯_厂家-淄博信达电力科技有限公司| 高低温试验箱-模拟高低温试验箱订制-北京普桑达仪器科技有限公司【官网】 | 新密高铝耐火砖,轻质保温砖价格,浇注料厂家直销-郑州荣盛窑炉耐火材料有限公司 | 机床导轨_导轨板_滚轮导轨-上海旻佑精密机械有限公司 | 天津仓储物流-天津电商云仓-天津云仓一件代发-博程云仓官网 | 碳纤维复合材料制品生产定制工厂订制厂家-凯夫拉凯芙拉碳纤维手机壳套-碳纤维雪茄盒外壳套-深圳市润大世纪新材料科技有限公司 | 微型驱动系统解决方案-深圳市兆威机电股份有限公司 | 工业淬火油烟净化器,北京油烟净化器厂家,热处理油烟净化器-北京众鑫百科 | 山东商品混凝土搅拌楼-环保型搅拌站-拌合站-分体仓-搅拌机厂家-天宇 | 伸缩器_伸缩接头_传力接头-巩义市润达管道设备制造有限公司 | 自动售货机_无人售货机_专业的自动售货机运营商_免费投放售货机-广州富宏主官网 | 北京软件开发_软件开发公司_北京软件公司-北京宜天信达软件开发公司 | 知网论文检测系统入口_论文查重免费查重_中国知网论文查询_学术不端检测系统 | 集装袋吨袋生产厂家-噸袋廠傢-塑料编织袋-纸塑复合袋-二手吨袋-太空袋-曹县建烨包装 | 金属回收_废铜废铁回收_边角料回收_废不锈钢回收_废旧电缆线回收-广东益夫金属回收公司 | 嘉兴恒升声级计-湖南衡仪声级计-杭州爱华多功能声级计-上海邦沃仪器设备有限公司 | 手术示教系统-数字化手术室系统-林之硕医疗云智能视频平台 | 高柔性拖链电缆_卷筒电缆_耐磨耐折聚氨酯电缆-玖泰特种电缆 | 轴流风机-鼓风机-离心风机-散热风扇-罩极电机,生产厂家-首肯电子 | 压缩空气冷冻式干燥机_吸附式干燥机_吸干机_沪盛冷干机 | 球盟会·(中国)官方网站| 液氮罐_液氮容器_自增压液氮罐_杜瓦瓶_班德液氮罐厂家 | CE认证_产品欧盟ROHS-REACH检测机构-商通检测| VI设计-LOGO设计公司-品牌设计公司-包装设计公司-导视设计-杭州易象设计 | 隧道风机_DWEX边墙风机_SDS射流风机-绍兴市上虞科瑞风机有限公司 |