登上CMMLU性能評測榜單第一 四大維度解碼夸克自研大模型觀點

11月14日,擁有千億參數的夸克自研大模型正式發布,立刻占據CMMLU榜單第一名。
11月14日,擁有千億參數的夸克自研大模型正式發布,立刻占據CMMLU榜單第一名??淇舜竽P蛯糜谕ㄓ盟阉鳌⑨t療健康、教育學習、職場辦公等多個場景。性能方面,其整體水平已經超過GPT-3.5,其中在寫作、考試等部分場景中可以超過GPT-4,成為國產大模型中名副其實的“學霸”。
評測成績顯示,夸克大模型在發布后一舉登頂CMMLU榜單,平均分達到77.08分,在社會科學和其他兩個類別中分別斬獲第一。在國內專業考試測試中,夸克大模型取得高考滿分的成績,還通過了臨床執業醫師資格考試。一系列優異成績的背后,是夸克在大模型技術研發方面的戰略定力與持續投入。經過多年發展,夸克積累的四方面優勢,才是培養出這位“新學霸”的原動力。
首先,夸克大模型擁有的海量數據優勢,基于智能化的搜索能力和自然語言處理技術,夸克擁有最完整的中文數據庫,在每天數以億計的信息處理后,能更好地理解、評估、提煉中文知識體系,了解不同用戶對工作、學習、生活上的真實需求。這些搜索請求和大數據也組成了夸克大模型的第一層優勢。
第二,夸克在教育、醫療、文檔等垂直領域上的優勢可以繼續在大模型領域發揮作用。目前,夸克自建及擁有各類題庫、知識點、醫療知識圖譜、書籍及出版物等資料,沉淀了非常豐富的數據及用戶場景,無論是考試資料還是硬核知識,夸克都構建了一套完整的知識內容體系,在大模型原生應用落地的過程中,將進一步提升用戶效率。
第三,夸克通過技術能力可以更好地識別知識正確性。尤其在通用知識、圖文知識、專業知識、推理知識、寫作增強等方面,夸克建立了從內容、搜索再到推理的一套可辨別知識真偽的技術體系,讓大模型提供的內容更具有準確性和專業性。
第四,就是夸克的平臺優勢。據悉,為了實現全棧自研的技術路線,夸克搭建數百人規模的獨立產研團隊,每天處理過億級別的實時數據。同時,在搜索、教育醫療垂直業務,有行業團隊會根據用戶需求的變化,進行大模型的預訓練與精調,以幫助用戶解決生活中面臨的實際問題。
在國內大模型賽道持續火爆的當下,夸克為什么能做出千億級參數的自研大模型?夸克技術負責人表示,堅持自研大模型的研發路線是服務于夸克的業務戰略,也是持續推動夸克App在產品體驗創新和邁向新一代搜索的技術底座。
作為近年來成長速度最快的互聯網產品之一,夸克App在跨場景應用上引領行業風向。根據QuestMobile發布的《2023年輕人群智能效率應用研究》報告顯示,夸克App在泛學生人群和新生代職場人群的用戶占比最高,年輕用戶使用時長位列行業第一。
去年底ChatGPT掀起新一輪人工智能熱潮以來,業內就有觀點認為,以搜索為代表的信息服務場景是大模型開發及應用的最佳平臺。大模型產品仍在跑馬圈地,夸克大模型依托四大優勢,發布千億級參數的大模型,或將開啟AIGC信息服務新風向,更精準、高效地滿足用戶解決實際問題的需求。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。