Moonshot AI發(fā)布首款自主強化學習Agent產品Kimi-Researcher,開啟灰度測試快訊
【TechWeb】Moonshot AI公司近日正式推出其首款Agent產品——Kimi-Researcher(深度研究),能夠獨立規(guī)劃任務流程并輸出完整的研究結果,Kimi-Researcher能夠自主判斷在信息沖突時的處理策略。
【TechWeb】Moonshot AI公司近日正式推出其首款Agent產品——Kimi-Researcher(深度研究),并且已經(jīng)開始進行小范圍的灰度測試。

Kimi-Researcher采用端到端自主強化學習(end-to-end agentic RL)技術構建,在HLE測試中表現(xiàn)出色,其性能超過了Claude 4 Opus、Gemini 2.5 Pro以及OpenAI Deep Research等知名模型,與Gemini-Pro的Deep Research Agent性能相當。
這款智能研究助手Kimi-Researcher具有高度的自主性,能夠獨立規(guī)劃任務流程并輸出完整的研究結果。它與其他Agent的最大不同點在于其零結構設計,無需依賴復雜的提示詞或預設流程,完全依靠自主決策能力在動態(tài)環(huán)境中運作。
Kimi-Researcher能夠自主判斷在信息沖突時的處理策略,決定任務節(jié)點的轉換時機,以及篩選中間信息的重要性,始終以實際解決任務效果為核心驅動力。
作為一款專注于深度研究的模型,Kimi-Researcher整合了多個來源的數(shù)據(jù),并支持每條引用的直接追溯,這保證了研究的嚴謹性,并有效降低了幻覺問題的出現(xiàn)。Moonshot AI表示,未來將逐步開放Kimi-Researcher的基礎預訓練模型及強化學習優(yōu)化版本的源代碼,以促進Agent強化學習領域的進一步探索和發(fā)展。(Suky)
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉載時務必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或將追究責任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。