從“天鏡”大模型透視馬上消費(fèi)自主性生存法則觀點(diǎn)

2023,堪稱大模型元年。
2023,堪稱大模型元年。
年初ChatGPT有如平地驚雷,炸開(kāi)了大模型的應(yīng)用賽道。但有意思的是,一直熱衷于科技賦能的金融行業(yè)在大模型的開(kāi)發(fā)上卻遲遲未有突破。
直到今年8月,馬上消費(fèi)拔得頭籌,其自主研發(fā)的“天鏡”大模型上線,全國(guó)首個(gè)上線的零售金融大模型方才問(wèn)世。這一開(kāi)發(fā)和上線速度不僅超過(guò)了A股上市大行,也超過(guò)了阿里云、騰訊云這樣的科技巨頭。這為整個(gè)行業(yè)的發(fā)展提供了很強(qiáng)的標(biāo)桿意義。
在過(guò)去8年的時(shí)間里,馬上消費(fèi)作為一家沒(méi)有強(qiáng)勢(shì)股東的數(shù)據(jù)供給、流量加持和外部技術(shù)助力的消費(fèi)金融機(jī)構(gòu),不僅做到了穿越周期、風(fēng)雨不倒,云銷雨霽之后,還能保持優(yōu)異的增長(zhǎng)速度和創(chuàng)新能力。這與其長(zhǎng)期深耕消金這一垂直賽道不無(wú)關(guān)系,當(dāng)然,更重要的是,在科技這樣的資產(chǎn)密集、技術(shù)密集領(lǐng)域,馬上消費(fèi)從不因?yàn)椤爸亍本图偈钟谌耍菆?jiān)定地、矢志不移地進(jìn)行長(zhǎng)期投入。究其根本,馬上消金所仰賴的生存密碼離不開(kāi)三個(gè)字:自主性。
1
探路:堅(jiān)定自研
金融賽道的大模型開(kāi)發(fā)進(jìn)程較想象中緩慢不少,原因有二。
首先,金融行業(yè)最重要的兩大特征:資金密集度高、風(fēng)險(xiǎn)敏感度高。在經(jīng)濟(jì)大環(huán)境承壓的背景下,金融監(jiān)管對(duì)于合規(guī)經(jīng)營(yíng)反復(fù)強(qiáng)調(diào),這讓金融行業(yè)的創(chuàng)新探索,步調(diào)格外謹(jǐn)慎。
其次,金融行業(yè)大模型探索面對(duì)的是復(fù)雜場(chǎng)景,科技巨頭們?cè)谝恍┐怪鳖I(lǐng)域掌握的數(shù)據(jù)并不具備絕對(duì)優(yōu)勢(shì),相較而言,在垂直行業(yè)的頭部機(jī)構(gòu)反而更有可能掌握著更加專精的數(shù)據(jù)和開(kāi)發(fā)經(jīng)驗(yàn)。
“天鏡”大模型在上線之前,已經(jīng)在營(yíng)銷獲客、風(fēng)險(xiǎn)審批、安全合規(guī)等零售金融典型場(chǎng)景落地。
馬上消費(fèi)人工智能研究院高級(jí)研究員李寬告訴十字財(cái)經(jīng),馬上消費(fèi)對(duì)大模型的價(jià)值定義主要聚焦在三個(gè)點(diǎn):匯聚群體智能、喚醒沉睡知識(shí)和眾創(chuàng)數(shù)據(jù)價(jià)值。
“智能坐席服務(wù)目標(biāo)明確、場(chǎng)景清晰、工作量數(shù)據(jù)量也很大,是目前大模型運(yùn)用最成熟、落地最深的應(yīng)用場(chǎng)景,也是最能體現(xiàn)‘匯聚群體智能’的服務(wù)領(lǐng)域。”李寬補(bǔ)充,“傳統(tǒng)的AI需要人工參與配流程、配話術(shù),大模型大在參數(shù)量和數(shù)據(jù)量,通過(guò)學(xué)習(xí)優(yōu)秀人工的對(duì)話數(shù)據(jù),在黑盒中完成訓(xùn)練,能夠用擬人化的自然語(yǔ)言隨機(jī)應(yīng)變地與客戶進(jìn)行交流,話術(shù)不長(zhǎng),適配場(chǎng)景,客戶體驗(yàn)很好。”
迄今為止,大模型實(shí)際投入運(yùn)營(yíng)已6個(gè)月,從目前累計(jì)的運(yùn)行數(shù)據(jù)來(lái)看,“天鏡”大模型的意圖理解準(zhǔn)確率達(dá)91%,相較于傳統(tǒng)AI的68%有大幅提升;客戶參與度61%,也遠(yuǎn)高于傳統(tǒng)模型43%的參與率,和人工坐席平均57%的水平。
從馬上消費(fèi)的業(yè)務(wù)規(guī)模來(lái)看,基數(shù)已經(jīng)很大。最新數(shù)據(jù)顯示,馬上消費(fèi)合作金融機(jī)構(gòu)超200個(gè),合作商戶超100萬(wàn),其自主運(yùn)營(yíng)的APP“安逸花”,目前日活躍用戶超160萬(wàn)人次。這意味著,在效能方面哪怕是提升個(gè)位數(shù)的百分比,也能帶來(lái)相當(dāng)大的社會(huì)效益。而效率的大幅提升為研發(fā)帶來(lái)了正向反饋,進(jìn)一步推動(dòng)大模型產(chǎn)品的后續(xù)打磨。
而李寬提及的“喚醒沉睡知識(shí)”和“眾創(chuàng)數(shù)據(jù)價(jià)值”則是馬上消費(fèi)要進(jìn)一步探索的方向所在。
根據(jù)李寬的介紹,所謂“喚醒沉睡知識(shí)”,主要是針對(duì)非結(jié)構(gòu)化的文檔,表現(xiàn)形式眾多,比如規(guī)章制度,技術(shù)方案,會(huì)議紀(jì)要,驗(yàn)收?qǐng)?bào)告,匯報(bào)材料等企業(yè)過(guò)往經(jīng)營(yíng)形成的知識(shí)沉淀。“雖然現(xiàn)在企業(yè)基本上都做到了文檔的數(shù)字化,但仍然面臨著檢索不便、無(wú)法對(duì)有效知識(shí)充分利用的問(wèn)題,‘天鏡’大模型就能夠很好地解決這些問(wèn)題,把文檔給到大模型之后可以直接提問(wèn),獲得答案。”李寬表示。
眾創(chuàng)數(shù)據(jù)價(jià)值則是針對(duì)結(jié)構(gòu)化的數(shù)據(jù)庫(kù)表的利用和分析,當(dāng)下,企業(yè)的大量經(jīng)營(yíng)行為都涉及數(shù)據(jù)分析工作,而結(jié)構(gòu)化的數(shù)據(jù)庫(kù)表需要數(shù)據(jù)分析人員手動(dòng)生成SQL,‘天鏡’大模型上線后,數(shù)據(jù)分析人員只需用自然語(yǔ)言描述數(shù)據(jù)需求,大模型就能直接生成SQL和圖表,大大節(jié)省了數(shù)據(jù)分析人員的工作量,降低了數(shù)據(jù)使用門(mén)檻。
在馬上消費(fèi)的“天境”大模型發(fā)布之后不久,螞蟻、騰訊云面向中小金融機(jī)構(gòu)陸續(xù)發(fā)布了開(kāi)源金融大模型應(yīng)用。
事實(shí)上,對(duì)大多數(shù)中小金融機(jī)構(gòu)而言,要快速實(shí)現(xiàn)大模型應(yīng)用的落地,選擇開(kāi)源大模型無(wú)疑是更具效率和性價(jià)比的方式。對(duì)這一點(diǎn),馬上消費(fèi)也十分清楚。
“相較而言,自研大模型無(wú)疑是一條更為艱難的道路。需要投入數(shù)倍于前者的時(shí)間、人力、財(cái)力,其中甚至有很多資源注定會(huì)被虛擲。”李寬表示,“開(kāi)源大模型在使用階段也會(huì)面臨許多挑戰(zhàn),比如領(lǐng)域適配性、訓(xùn)練效率、推理速度等,而我們自研的大模型是在零售金融這個(gè)垂直領(lǐng)域做了專門(mén)的適配,用自有數(shù)據(jù)進(jìn)行訓(xùn)練,擁有更專精的領(lǐng)域匹配能力,長(zhǎng)期來(lái)看,也能為將來(lái)贏得更強(qiáng)的技術(shù)自主性,為公司的長(zhǎng)遠(yuǎn)發(fā)展構(gòu)筑更高的競(jìng)爭(zhēng)壁壘。”
“自主性”不僅是過(guò)往8年發(fā)展歷程的總結(jié),也是未來(lái)征程的注腳。
沒(méi)有傘的孩子更要努力奔跑。因?yàn)槊靼走@個(gè)道理,自2015年成立以來(lái),馬上消費(fèi)每年都在持續(xù)大手筆地進(jìn)行技術(shù)研發(fā)投入,迄今為止,已累計(jì)投入33億元,申請(qǐng)發(fā)明專利超1500件,自主研發(fā)出1000多套系統(tǒng),研發(fā)團(tuán)隊(duì)超2000人。這樣的投入規(guī)模和研發(fā)陣容在行業(yè)并不多見(jiàn)。
如今,大模型已經(jīng)是一個(gè)高端玩家的賽道,資金實(shí)力、數(shù)據(jù)沉淀、技術(shù)儲(chǔ)備缺一不可,高筑墻、廣積糧的好處已然呈現(xiàn)。
2
往何處去:安全合規(guī)、數(shù)據(jù)治理
金融大模型的構(gòu)建是一個(gè)系統(tǒng)化工程,需要以實(shí)際需求為驅(qū)動(dòng),逐層從基礎(chǔ)設(shè)施、模型算法,向場(chǎng)景化應(yīng)用、軟件開(kāi)發(fā)修筑起一座大廈,而這座大廈的地基是安全合規(guī)。
對(duì)金融行業(yè)而言,安全合規(guī)是一切創(chuàng)新與探索的前提。馬上消費(fèi)首席信息官蔣寧在大模型發(fā)布之際表示:“希望在任何情況下,它給客戶的回答都是合規(guī)的,并且在任何不可預(yù)期的情況下它的結(jié)果是穩(wěn)定的。”
這既是一個(gè)期望,也是一個(gè)任務(wù)。
馬上消費(fèi)人工智能研究院創(chuàng)新研究部負(fù)責(zé)人馮月介紹稱,通常大模型安全是兩方面的,一方面是其生產(chǎn)內(nèi)容本身的安全性,另一方面是在金融行業(yè)安全合規(guī)上,大模型有什么進(jìn)一步的賦能。
關(guān)于大模型本身的安全,由于大模型本身是生成式模型,其生成內(nèi)容天然帶有不確定性,因此本身就涉及合法合規(guī)問(wèn)題,也即行業(yè)里常說(shuō)的“內(nèi)容安全”問(wèn)題,在技術(shù)領(lǐng)域里也稱為“價(jià)值觀對(duì)齊”問(wèn)題。
對(duì)于這類問(wèn)題,目前是雙管齊下,一是基層大模型本身在訓(xùn)練過(guò)程中就應(yīng)該使用價(jià)值觀正確的、內(nèi)容安全的訓(xùn)練語(yǔ)料,提供正直、善良而非邪惡的基座,這依賴于訓(xùn)練數(shù)據(jù)的篩選;二是應(yīng)用方應(yīng)在使用時(shí)級(jí)聯(lián)一套內(nèi)容安全算法,對(duì)結(jié)果進(jìn)行涉黃、涉暴、涉政等常見(jiàn)違法內(nèi)容管控,在觸發(fā)時(shí)進(jìn)行攔截,這依賴于管控算法本身的訓(xùn)練。
關(guān)于大模型的安全應(yīng)用,金融安全通常指的是合法、合規(guī)和經(jīng)營(yíng)風(fēng)險(xiǎn)規(guī)避三個(gè)部分。合法針對(duì)的普世的國(guó)家法律問(wèn)題,這類問(wèn)題在企業(yè)的表現(xiàn)可以是合同審核問(wèn)題;合規(guī)針對(duì)的是專業(yè)的監(jiān)管機(jī)構(gòu)的規(guī)定、建議等問(wèn)題,這類問(wèn)題可能是信息化建設(shè)、隱私保護(hù)建設(shè)等問(wèn)題;經(jīng)營(yíng)風(fēng)險(xiǎn)規(guī)避針對(duì)的是企業(yè)經(jīng)營(yíng)本身所產(chǎn)生的結(jié)構(gòu)性風(fēng)險(xiǎn),這類問(wèn)題在企業(yè)的表現(xiàn)可以是欺詐的發(fā)現(xiàn)、員工的行為管控、客戶的投訴咨詢等。
如果說(shuō)上述方向是企業(yè)未來(lái)的發(fā)展命題,數(shù)據(jù)治理的未來(lái)則是值得整個(gè)行業(yè)探討的話題。
“中文數(shù)據(jù)的通用大模型的效果要差一些,寫(xiě)高質(zhì)量的中文語(yǔ)料和相應(yīng)數(shù)據(jù)建設(shè)需要行業(yè)的共同努力,也需要時(shí)間。”馬上消費(fèi)技術(shù)部專家表示,“此外,《個(gè)人信息保護(hù)法》出臺(tái)以后,對(duì)于數(shù)據(jù)的運(yùn)營(yíng)和流通,外部監(jiān)管和法律約束變得非常嚴(yán)格,大模型需要大量數(shù)據(jù)喂養(yǎng),更大發(fā)揮價(jià)值的話,一定要想辦法打通同行業(yè)甚至跨行業(yè)的數(shù)據(jù)壁壘。在數(shù)據(jù)治理方面,每個(gè)企業(yè)都有自己制度設(shè)計(jì)和管理方式。對(duì)于數(shù)據(jù)流通的探討從來(lái)沒(méi)有停止過(guò)。聯(lián)邦學(xué)習(xí)、隱私計(jì)算、數(shù)據(jù)的可用不可見(jiàn)都是很好的探索。這些是需要全行業(yè)共同努力的事情。”
科技的本質(zhì)是賦能,無(wú)論多么先進(jìn)的技術(shù)手段,最終都必須落地到業(yè)務(wù)端形成正反饋,否則就毫無(wú)意義。
前途光明,道路崎嶇。但往往,人跡罕至的道路才能抵達(dá)最美的風(fēng)景。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為T(mén)MT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。