中國版“Scale AI” 螞蟻數科發布 AI 數據標注產品觀點

提高數據數量、安全和多樣性,對提升大模型性能,推動產業落地至關重要。
提高數據數量、安全和多樣性,對提升大模型性能,推動產業落地至關重要。記者從 2024 Incluison·外灘大會上了解到,螞蟻數科發布新一代數據標注產品,向企業客戶提供AI 驅動的全流程數據服務。
傳統數據標注以人工為主,進入大模型時代,企業面對數據指數級增長及非結構化的包圍,其標注成本和效率往往達不到平衡。據了解,螞蟻數科具備領先的 AI 算法,在標注產品中配置了模塊化服務和算法調度能力,能夠在高效匹配“人和任務”的前提下降低標注的復雜度,幫助用戶解決通用大模型、多模態大模型和行業垂類大模型的數據標注需求。據悉,該產品可以覆蓋多行業場景文本、圖像、音頻、視頻標注需求。
實測數據顯示,在同類結構和同等規模數據量下,使用螞蟻數科 AI 標注產品后的標注效率提升了 40%以上。這背后不僅有技術,針對產業高復雜度數據需求,專家驗證必不可少。記者了解到,螞蟻數科配備近萬人的人工標注團隊,垂直專業領域和高階標注人才占比超過 90%,以此提升AI數據服務的專業性。
數據是AI領域公認的三大支柱之一,也是大模型在產業落地所面臨的主要矛盾。螞蟻數科發布AI標注產品后,一只腳踏入了Scale AI 同一條賽道。后者在三個月前,完成了新一輪由 Accel 領投的近 10 億美元融資,估值升至 138 億美元。
與Scale AI 不同的是,螞蟻數科還提供數據加工、合成服務。螞蟻數科鏈接眾多數據資源,積累了涵蓋多模態、多領域、多場景的數據集,可以給到客戶需要的“精標數據集”,幫助客戶實現數據服務的“就地取材”。同時,在尚未充分挖掘的企業私域和垂直領域,螞蟻數科具備領先的數據泛化算法能力,能夠幫助企業針對性模擬生成交通、政務、金融等場景下的“擬合數據”,提升模型面對新數據時的表現能力。
隨著基礎大模型能力持續增強,高質量數據將成為每家企業人工智能戰略必需品,新型數據管理和處理領域的公司正站在風口上。螞蟻數科圍繞集數據標注、加工、生成為一體的綜合方案,將進一步提升數據豐富度,為企業用好大模型鋪平道路。
據了解,螞蟻數科已經形成ABC三大業務板塊,服務產業數字化。A是指AI服務(AI+),以AI技術重構升級風控、營銷等場景效率,助力企業在大模型時代建立競爭優勢;B是指區塊鏈服務(Blockchain+),通過科技構建產業信任,提升數字化協作效率,加速數據資產流通;C是指云服務(Cloud+),幫助企業邁入數字化「上云」階段,打造更強大的科技引擎。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。