OpenAl采用智譜標準評測GPT-4.1系列大模型快訊
導讀
ComplexFuncBench是由智譜團隊提出的專用于評估大模型復雜函數調用能力的測試基準,ComplexFuncBench要求大模型對真實場景下的用戶需求進行細粒度理解,ComplexFuncBench主要評測大模型在128K的長上下文下進行多步帶約束的函數調用的能力。
【TechWeb】4月15日消息,OpenAI發布的了最新GPT-4.1系列大模型,其中在評測函數調用能力時采用了ComplexFuncBench。

ComplexFuncBench是由智譜團隊提出的專用于評估大模型復雜函數調用能力的測試基準。
據悉,ComplexFuncBench主要評測大模型在128K的長上下文下進行多步帶約束的函數調用的能力。相比于現有函數調用測試基準,ComplexFuncBench要求大模型對真實場景下的用戶需求進行細粒度理解,并在此基礎上進行多步帶推理的函數調用,這對模型的函數調用能力提出了更高的挑戰。(果青)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。