華為離職天才少年創(chuàng)業(yè)項目 智元機器人發(fā)布首個通用具身基座大模型快訊
GO-1大模型借助人類和多種機器人數(shù)據(jù),GO-1大模型是通用機器人策略模型,完成小樣本快速泛化。
3月10日消息,今日,“稚暉君”創(chuàng)業(yè)項目智元機器人發(fā)布了首個通用具身基座模型——智元啟元大模型(Genie Operator-1)。
該大模型開創(chuàng)性地提出了Vision-Language-Latent-Action(ViLLA)架構(gòu),該架構(gòu)由VLM(多模態(tài)大模型)+MoE(混合專家)組成,實現(xiàn)了可以利用人類視頻學習,完成小樣本快速泛化,降低了具身智能門檻,并成功部署到智元多款機器人本體。
通過ViLLA架構(gòu),智元機器人在五種不同復雜度任務上測試GO-1,相比已有的最優(yōu)模型,GO-1成功率大幅領先,平均成功率提高了32%(46%->78%)。
其中 “Pour Water”(倒水)、“Table Bussing”(清理桌面) 和 “Restock Beverage”(補充飲料) 任務表現(xiàn)尤為突出。
此外還單獨驗證了ViLLA架構(gòu)中Latent Planner的作用,可以看到增加Latent Planner可以提升12%的成功率(66%->78%)。
據(jù)介紹,GO-1大模型借助人類和多種機器人數(shù)據(jù),讓機器人獲得了革命性的學習能力,可泛化應用到各類的環(huán)境和物品中,快速適應新任務、學習新技能。
同時,它還支持部署到不同的機器人本體,高效地完成落地,并在實際的使用中持續(xù)不斷地快速進化。
這一系列的特點可以歸納為4個方面:
人類視頻學習:GO-1大模型可以結(jié)合互聯(lián)網(wǎng)視頻和真實人類示范進行學習,增強模型對人類行為的理解,更好地為人類服務。
小樣本快速泛化:GO-1大模型具有強大的泛化能力,能夠在極少數(shù)據(jù)甚至零樣本下泛化到新場景、新任務,降低了具身模型的使用門檻,使得后訓練成本非常低。
一腦多形:GO-1大模型是通用機器人策略模型,能夠在不同機器人形態(tài)之間遷移,快速適配到不同本體,群體升智。
持續(xù)進化:GO-1大模型搭配智元一整套數(shù)據(jù)回流系統(tǒng),可以從實際執(zhí)行遇到的問題數(shù)據(jù)中持續(xù)進化學習,越用越聰明。
據(jù)悉,2020年,彭志輝(稚暉君)以“華為天才少年計劃”最高檔年薪201萬元,加入華為團隊,從事昇騰AI芯片和AI算法相關研究工作,2022年年底從華為離職,2023年2月聯(lián)合創(chuàng)立智元機器人。(拾柒)
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控熑危?br>
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。