釘釘AI震撼升級:加入多模態、工作流等能力觀點

3月28日,釘釘 AI 助理重磅升級,上線圖片理解、文檔速讀、工作流等產品能力,率先探索多模態、長文本與 RPA 技術在 AI 應用的落地。
3月28日,釘釘 AI 助理重磅升級,上線圖片理解、文檔速讀、工作流等產品能力,率先探索多模態、長文本與 RPA 技術在 AI 應用的落地。
基于阿里通義千問大模型,升級后的釘釘 AI 助理擁有更強的視覺推理能力和長文本速讀能力。目前,用戶在釘釘 IM 消息框或點擊魔法棒按鈕進入 AI 助理對話框,發送長文件、在線文檔、網頁鏈接、視頻內容,即可根據內容識人、識地點、分析、答題、翻譯、摘要、提取文字,甚至可以通過多輪交互進一步做智能問答。
釘釘 AI 已支持圖像理解、視頻速讀,化身全能“小百科”
LLM(大語言模型)之后,大模型領域迎來了新的爆點“多模態”,為 AI 應用帶來了更大的想象力。
基于通義千問 Qwen-VL-Max 視覺理解模型,釘釘 AI 助理能夠準確描述和識別圖片信息,并根據圖片進行信息推理、擴展創作、文字提取、翻譯等,相當于一個全能的“圖片小百科”。
不管圖片展示的是某件物體、某個人物、風景,還是菜譜、社交梗圖、數學題和衣服標簽,AI 助理都能一秒識別圖片內容,并在此基礎上進行多輪對話問答。比如,旅游時看到一個很美的建筑,拍照發給釘釘AI助理,就能迅速了解它的歷史背景和相關故事。
利用這一能力,用戶還可以實現識圖翻譯或提取圖片中的文字,讓信息獲取更加便捷。比如,不知道某件衣服的洗滌方式,把衣服標簽拍個照發給釘釘 AI助理,就可以翻譯上面的英文。
通義千問 Qwen-VL-Max 擁有更強的視覺推理和中文理解能力,整體性能堪比GPT-4V和Gemini Ultra。在MMMU、MathVista等測評中遠超業界所有開源模型,在文檔分析(DocVQA)、中文圖像相關(MM-Bench-CN)等任務上超越 GPT-4V,達到世界最佳水平。
此外,AI 助理也支持視頻內容的速讀。發送給 AI 助理的短視頻、直播切片或培訓視頻可以被快速“觀看”, AI 助理會根據視頻內容生成字幕,提取關鍵詞,并生成一份智能摘要,對于最高 2GB 的視頻內容,僅需 3 分鐘即可完成智能解讀。
“文檔速讀”能力升級,從冗長信息中解放生產力
利用大模型技術從文本中檢索、總結信息,可以說是每個人日常生活、工作、學習的需求場景。
基于通義千問大模型,釘釘 AI 助理可以快速閱讀本地文件如 Word、PDF、PPT、Excel 等、釘釘文檔、網頁鏈接等多種格式文件,輕松解析各類學術論文、產品手冊、使用教程、數據表格、新聞報道、多國語言的圖書等。
比如,臨時需要分析一個業務數據時,上傳相關的 Excel 表格,AI 助理就可以直接給出數據結論;企業復雜的產品手冊發送給 AI 助理后,可以快速總結和智能問答,大幅提升信息效率。
值得一提的是,釘釘 AI 助理對長文本的處理能力已支持單次閱讀500頁的文件,可以為法律、醫學、金融等專業領域提供更全面、準確的信息服務。
比如,有研究者將一份《大模型與自動駕駛如何結合研究報告》的長論文發送后,AI 助理在幾秒內就快速總結了相應的內容,并給出了這一研究具體是什么、研究的技術創新點、研究方法等諸多論文的關鍵要素。用戶還可以進一步追問某個知識點的具體來源或相關信息,從閱覽文檔、反復檢索的冗長工作中徹底解放。
AI 助理上線“工作流”, AI 也能干復雜的活了
隨著 OpenAI 帶火 Agent(智能體),大模型融入自動化技術成為當前最具共識的方向之一。
今年1月,釘釘 AI 助理正式上線,企業和個人 AI 助理已進入到工作和生產力場景中。為讓 AI 助理可以完成一系列更復雜的任務,釘釘 AI 助理上線了工作流能力。
工作流是 AI Agent 的一種進階玩法,不僅可以在創建時對 AI 執行任務的流程進行拆解和編排,使得 AI 助理可以主動接管完成相應操作,還能夠打通外部的系統數據和 API 能力,進一步擴展了它的行動能力,比如搭建能自動寫腳本并生成視頻的創作 AI 助理。
為降低用戶的使用門檻,釘釘官方還提供了多種工作流模板。已有企業使用工作流創建了門店信息收集助理,將用戶反饋自動化整理,并存儲到一張釘釘多維表中,幫助員工節約瑣碎的時間;個人用戶也通過連接微博 API,創建了自動追蹤熱點并撰寫文章的助理,一個指令就能批量執行,大幅提升內容生產的效率。
目前,用戶可在釘釘 APP 或 PC 客戶端直接使用 AI 助理的各項功能,包括多模態、長文本和工作流,體驗 AI 帶來的便捷與高效。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。