国内在线精品,长河落日电视连续剧免费观看,日韩一区二区在线看

文小言上新：能方言交流、會拍照解題、能生成吉卜力風圖片和視頻快訊

TechWeb.com.cn 2025-03-31 19:53

分享到：

導讀

升級全新語音大模型、圖片問答、AI生圖生視頻等多項能力，3、讓文小言生成吉卜力風格圖片和視頻在文小言app中選擇圖片創作，文小言實現了多模型間的智能協同。

【TechWeb】3月31日消息，在百度推出最新最強多模態大模型文心4.5和推理大模型文心X1后，今天百度旗下AI助手文小言APP正式功能升級。

此次升級，文小言聚焦模型開放與功能創新，支持多模型融合調度，升級全新語音大模型、圖片問答、AI生圖生視頻等多項能力，為用戶帶來更智能、更高效的AI體驗。

其中，文小言此次升級的核心亮點在于“多模型融合調度”。通過整合百度自研的文心X1、文心4.5等頂尖模型，并接入DeepSeek-R1、可靈等第三方優質模型，文小言實現了多模型間的智能協同。

接入全新的端到端語音語言大模型后，文小言不僅能支持更擬真的語聊效果，而且支持重慶、廣西、河南、廣東、山東等特色方言。據介紹，語音大模型具備極低的訓練和使用成本，極快的推理響應速度，語音交互時，可將用戶等待時長從行業常見的3-5秒降低至1秒左右。

圖片問答功能讓用戶可以通過拍攝或上傳圖片，以文字或語音提問直接獲取深度解析。

目前，以上這些大模型能力，用戶在文小言APP內選擇“自動模式”，即可一鍵調用最優模型組合，也可以根據需求靈活選擇單一模型完成特定任務。

從用戶角度來看，目前的文小言不僅能聽得懂方言、能跟用戶直接方言交流外，還可以“化身”老師解題答疑。

最近，OpenAI的多模態大模型GPT-4o因能生成吉卜力動漫風的圖片而大受追捧。現在，文小言不僅能通過文生圖來生成吉卜力風的圖片，還能生成該風格的視頻。

百度AI產品創新業務負責人薛蘇強調：“AI的未來不再是單純的技術參數比拼，而是如何通過多模型協同，真正為用戶創造價值。文小言希望通過開放生態，整合頂尖模型能力，做出更強大、更簡單的AI產品?！?/p>

那么就一起來看看文小言的表現：

1、讓文小言設計三種風格的南偏東客廳效果圖

文小言能夠精準解析裝修風格差異，調用文心X1完成深度推理，生成三幅風格迥異但視角一致的裝修效果圖，圖文混排專業講解，效果更直觀。

2、拍攝一道數學題，讓文小言解題

將上述數學題用文小言拍照輸入，文小言就給出了一下解答結果。

還實時生成了一個由數字人講解的解說視頻。

3、讓文小言生成吉卜力風格圖片和視頻

在文小言app中選擇圖片創作，或者直接在對話框中輸入希望生成的圖片的描述，

例如：

請畫一個宮崎駿風格圖片，比例為9:16，內容為個女孩站在盛開的櫻花樹下，身旁有小貓咪。女孩扎著麻花辮，仰頭望向櫻花樹，欣賞飄落的櫻花。背景是戶外鄉村環境，有一棵櫻花樹，粉色櫻花密集綻放，本古樸木屋。地面上綠草如茵，

整體氛圍清新、寧靜、美好，充滿春日的生機與愜意。

文小言就會生成2張相關圖片。

然后，選擇“視頻生成”按鈕，文小言就能根據圖片生成一段5s中的小視頻。

4、講方言

文小言會說多種方言，包括重慶話、河南話、廣西話等都能聊?？梢匀ヂ犚宦犓v得怎么樣。

百度語音首席架構師賈磊透露，文小言接入了百度在業界首個推出、基于全新互相關注意力(Cross-Attention)的端到端語音語言大模型。在語音場景滿足一定交互指標下，大模型調用成本比行業平均降低50%-90%，推理響應速度極快，將語音交互等待時間壓縮至1秒左右，極大提升了交互流暢性。同時，在大模型加持下，實現了流式逐字的LLM驅動的多情感語音合成，情感飽滿、逼真、擬人，交互聽感也得到極大提升。（宜月）

模型文小言語音圖片用戶

分享到：

1.TMT觀察網遵循行業規范，任何轉載的稿件都會明確標注作者和來源；
2.TMT觀察網的原創文章，請轉載時務必注明文章作者和"來源：TMT觀察網"，不尊重原創的行為TMT觀察網或將追究責任；
3.作者投稿可能會經TMT觀察網編輯修改或補充。

TMT观察网_独特视角观察TMT行业

文小言上新：能方言交流、會拍照解題、能生成吉卜力風圖片和視頻快訊

文小言上新：能方言交流、會拍照解題、能生成吉卜力風圖片和視頻快訊