TMT观察网_独特视角观察TMT行业

寫對(duì)聯(lián),做唐詩(shī),上海這個(gè)AI公司正在“復(fù)活曹雪芹”互聯(lián)網(wǎng)+

商業(yè)江湖 2019-05-15 17:16
分享到:
導(dǎo)讀

一些文學(xué)問題,最終都是數(shù)學(xué)問題。

一些文學(xué)問題,最終都是數(shù)學(xué)問題。 國(guó)足0:3負(fù)于伊朗后,如果以「抱憾馮瀟霆」作為上聯(lián),你會(huì)對(duì)出什么下聯(lián)? 「緬懷謝安石」,這是人工智能給出的答案。 一個(gè)讓人吃驚的事實(shí)是——今天人工智能的中文閱讀能力達(dá)到『高中生』水平,寫作達(dá)到『小學(xué)生』水平。 這意味著:包括『審批、審計(jì)、簡(jiǎn)報(bào)』等和文字閱讀理解相關(guān)的工作可以交給AI來完成;而在不久的將來包括『文案、記者、作家』等和書寫相關(guān)的職業(yè)也將面臨著AI的挑戰(zhàn)。 終于繼在國(guó)際象棋、圍棋等智力游戲領(lǐng)域完成對(duì)人類的反超之后,AI進(jìn)入了『創(chuàng)造性』的工作領(lǐng)域——在文學(xué)、音樂等工作中替代人們作文和作曲。 一直以來人們都以為那些重復(fù)性的工作會(huì)被AI取代,而文藝創(chuàng)造領(lǐng)域一直是人類固守的智力高地,但現(xiàn)在看,在人工智能面前人類沒有什么真正的“智力高地”。 依照這樣的學(xué)習(xí)速度,距離AI寫出《紅樓夢(mèng)》——復(fù)活曹雪芹的日子或許不遠(yuǎn)了。 (達(dá)觀數(shù)據(jù)創(chuàng)始人、CEO陳運(yùn)文) 在上海張江的浦東軟件園內(nèi),「商業(yè)江湖」見到了達(dá)觀數(shù)據(jù)的創(chuàng)始人兼CEO陳運(yùn)文,他們研發(fā)的人工智能系統(tǒng)已經(jīng)可以替代人類進(jìn)行“閱讀理解”工作,開始在企業(yè)審計(jì)、文本搜集等領(lǐng)域進(jìn)行應(yīng)用。 陳運(yùn)文是復(fù)旦大學(xué)計(jì)算機(jī)博士,曾在百度、盛大、騰訊等負(fù)責(zé)大數(shù)據(jù)研發(fā)、人工智能和自然語(yǔ)言處理系統(tǒng),是業(yè)內(nèi)頂級(jí)的教授AI學(xué)習(xí)文字的專家。 他的主要工作就是通過自然語(yǔ)言處理技術(shù)讓計(jì)算機(jī)學(xué)會(huì)閱讀并書寫文字。
抱憾馮瀟霆,緬懷謝安石 「抱憾馮瀟霆,緬懷謝安石」,這是人工智能系統(tǒng)對(duì)出的對(duì)聯(lián)。 「商業(yè)江湖」于1月25日采訪了陳運(yùn)文,當(dāng)天中國(guó)隊(duì)在2019亞洲杯1/4淘汰賽中0-3負(fù)于伊朗隊(duì)抱憾出局。這輸?shù)舻娜蛉吭醋杂趪?guó)足后衛(wèi)的失誤,其中尤以馮瀟霆第一球失誤為憾。 在驗(yàn)證AI性能時(shí),『商業(yè)江湖』記者將『抱憾馮瀟霆』作為上聯(lián)輸入系統(tǒng),而AI快速對(duì)出來八個(gè)下聯(lián),第一個(gè)是『緬懷謝安石』。 這個(gè)下聯(lián)不僅工整,而且意味深長(zhǎng)。謝安石是東晉政治家,在「淝水之戰(zhàn)」中以八萬兵士大破百萬敵軍,為東晉贏得十余年的和平,是李白的偶像。 字面上以謝安石對(duì)應(yīng)馮瀟霆,而背后的寓意卻是以『淝水之戰(zhàn)』對(duì)應(yīng)『中伊之戰(zhàn)』,并且用『緬懷』對(duì)應(yīng)『抱憾』。 不知道AI系統(tǒng)是否真的理解這個(gè)故事,但如此對(duì)句,讓這個(gè)下聯(lián)在詞字對(duì)仗的同時(shí)甚至有一絲幽默的味道。 (關(guān)于抱憾馮瀟霆,AI對(duì)出了8個(gè)下聯(lián)) AI所以能對(duì)出如此工整的下聯(lián)和數(shù)學(xué)相關(guān)——越是有規(guī)則的中文表達(dá)方式,越容易被人工智能學(xué)會(huì)。 『對(duì)聯(lián)要求字?jǐn)?shù)相同、押韻、平仄等等,這種規(guī)則越多,AI運(yùn)算起來目標(biāo)就越明確,所以寫出來的對(duì)聯(lián)也就越工整。』陳運(yùn)文說。 陳運(yùn)文和同事們研發(fā)的這套系統(tǒng)名為「?jìng)}頡」,取「造字」之意,這是一套用來處理「字詞級(jí)別」的系統(tǒng),而另一套用來「批量處理文章」的系統(tǒng)名為「畢昇」。 『就像小學(xué)生學(xué)習(xí)語(yǔ)文那樣,我們要讓AI學(xué)會(huì)什么是名詞、動(dòng)詞、形容詞,理解什么是「主謂賓、定狀補(bǔ)」,讓他們經(jīng)過大量的閱讀訓(xùn)練來逐步理解文字的意思。』 陳運(yùn)文說,今天AI系統(tǒng)對(duì)于「詞性」和「句式」的分析遠(yuǎn)超很多本科生。 『如果將一個(gè)句子放到倉(cāng)頡系統(tǒng)中,他能快速的分辨出句子結(jié)構(gòu),什么是主語(yǔ)謂語(yǔ),什么是倒裝從句,這可能超過很多白領(lǐng)的水準(zhǔn),AI對(duì)于規(guī)律的掌握,對(duì)于邏輯的學(xué)習(xí)遠(yuǎn)超人類。』 現(xiàn)在隨便從網(wǎng)絡(luò)上復(fù)制一篇新聞稿放到「畢昇」系統(tǒng)中,它能瞬間識(shí)別出這種文章的『核心信息』——總共有多少個(gè)名詞、動(dòng)詞、形容詞;人名、地名、單位名。 甚至可以建立人物、事件關(guān)系圖,例如文中出現(xiàn)馮瀟霆,那么「畢昇」會(huì)以他為主要人物構(gòu)建人物圖,列出馮瀟霆的隊(duì)友、教練、競(jìng)爭(zhēng)對(duì)手、相關(guān)人物等等。 (分析新聞稿后,AI自動(dòng)生成的語(yǔ)義圖譜) 『這和人類的閱讀習(xí)慣類似,如看到《三國(guó)演義》人們就會(huì)想到曹操、劉備、諸葛亮,草船借箭、羅貫中等關(guān)鍵詞,然后可以理解這個(gè)詞背后想要表達(dá)的意思,我們希望計(jì)算機(jī)也具備這種「力透紙背」的能力,能通過綜合的知識(shí)去理解當(dāng)前的文詞。』 達(dá)觀曾將5萬余首唐詩(shī)輸入AI系統(tǒng)做分析,發(fā)現(xiàn)唐詩(shī)中出現(xiàn)最多的字是「人」,其次是「山」和「風(fēng)」字。『所以唐詩(shī)有以人為本的說法。』此外,唐詩(shī)中出現(xiàn)最多的顏色是「白色」,包含顏色的詩(shī)句中有1/5都是指白色。而唐詩(shī)中另兩組高頻詞是「悲和思」、「春和秋」,這給人們慣用的「?jìng)罕铩拐业搅死碚撘罁?jù)。 互聯(lián)網(wǎng)的出現(xiàn)為AI建立起一個(gè)龐大的內(nèi)容網(wǎng)絡(luò),通過這個(gè)網(wǎng)絡(luò),AI幾乎可以掌握人類有文明史以來所有的內(nèi)容。同樣一個(gè)人物或事件,人類能關(guān)聯(lián)的信息如果是10的話,計(jì)算機(jī)可能是10萬。 『文史資料無論是采集還是存儲(chǔ)的成本都非常廉價(jià),存儲(chǔ)200萬冊(cè)紅樓夢(mèng)這樣的書籍大概需要2-3T的空間,一年的存儲(chǔ)成本大概只要1000-2000元,這就意味著我們一年只需要花2000元就可以把一座大學(xué)的圖書館藏書都給存下來。』 陳運(yùn)文說,海量的素材資料為人工智能提供了足夠的『運(yùn)算食糧』,通過閱讀這些內(nèi)容,AI可以快速學(xué)習(xí),像人類一樣理解文本語(yǔ)義。 不要小看『讀懂文本』的能力,實(shí)際上今天社會(huì)上很多工作都和『閱讀理解』相關(guān),今天達(dá)觀的AI系統(tǒng)已經(jīng)可以『自動(dòng)寫文章摘要』,能夠『像秘書一樣提煉文章的核心觀點(diǎn),并且可以分析出文章觀點(diǎn)的正向和負(fù)向。』
理科生正在改變文科世界 AI的文本閱讀理解能力為達(dá)觀數(shù)據(jù)在商業(yè)社會(huì)中找到了盈利的方向。 2016年上半年的某天,陳運(yùn)文同事接到一個(gè)陌生電話,對(duì)方自稱是國(guó)內(nèi)知名電信企業(yè)某技術(shù)部門負(fù)責(zé)人,對(duì)達(dá)觀的技術(shù)很感興趣,希望能面談。 『我同事當(dāng)時(shí)嚇一跳,以為是騙子。』陳運(yùn)文說。 但隨后的對(duì)話讓他打消了這個(gè)疑慮,對(duì)方稱他們?cè)诰W(wǎng)上看到達(dá)觀發(fā)布的一篇技術(shù)文章,和他們當(dāng)前遇到的一些技術(shù)困境相關(guān),希望邀請(qǐng)達(dá)觀的技術(shù)團(tuán)隊(duì)到深圳做當(dāng)面交流。 當(dāng)時(shí),該企業(yè)希望提高「用戶搜索」的準(zhǔn)確性,作為知名的手機(jī)品牌,他們希望快速了解用戶的搜索需求,比如用戶在搜索「XX手機(jī)好不好?」的時(shí)候,他們可以匹配對(duì)應(yīng)內(nèi)容。 但漢語(yǔ)的表達(dá)方式并不唯一,有時(shí)候同樣一個(gè)意思可能有多個(gè)語(yǔ)句表達(dá),例如上述這句話還可以用「XX手機(jī)怎么樣?」「XX手機(jī)好用不?」等句式替代,類似這樣的語(yǔ)義搜尋問題讓實(shí)力雄厚的大企業(yè)也感到困惑。 『不同地區(qū)、不同文化程度的人,他們搜索的句子很可能完全不同,我們很難窮盡這種表達(dá)方式。 所以在文本閱讀處理時(shí),需要讓計(jì)算機(jī)靈活適配各種不同的表達(dá)。』陳運(yùn)文說他們后來幫助該企業(yè)設(shè)計(jì)了一個(gè)『非常精妙的算法』解決了這個(gè)問題。 現(xiàn)在這家公司已經(jīng)成為達(dá)觀長(zhǎng)期的合作客戶,而他們的合作也不再局限于「搜索分析」,而已經(jīng)進(jìn)入到「信息反饋」領(lǐng)域。 消費(fèi)者每天會(huì)在中文網(wǎng)絡(luò)上發(fā)布超過100萬條關(guān)于企業(yè)產(chǎn)品的評(píng)價(jià)信息。如果讓人來閱讀這些信息,十個(gè)人的團(tuán)隊(duì)可能需要一天時(shí)間來完成,但人工智能只需要幾分鐘。 『AI系統(tǒng)可以為這些信息去歸檔整理,甚至是貼標(biāo)簽。』 如AI會(huì)判斷每一條評(píng)論的屬性,是「積極正向的還是消極負(fù)面的」,并為之貼上標(biāo)簽,同時(shí)會(huì)抓去關(guān)鍵詞來告訴管理者,消費(fèi)者的評(píng)價(jià)主要集中在哪些方面。這就方便了品牌方了解用戶需求,了解輿情環(huán)境,并做出應(yīng)對(duì)。 『此前這些工作都需要專門的人工處理,而現(xiàn)在計(jì)算機(jī)都可以完成。』陳運(yùn)文說。 人工智能的這種『閱讀理解』能力正在逐步改變那些文字工作者的職業(yè)環(huán)境,很多此前需要人工閱讀審核的工作,今天都交由人工智能來完成,金融機(jī)構(gòu)就是其中之一。 『我們幫助某金融機(jī)構(gòu)設(shè)計(jì)的系統(tǒng)可以自動(dòng)識(shí)別招股書里面的數(shù)據(jù)和含義,他們給我們列出來大約3000個(gè)審核點(diǎn),我們讓系統(tǒng)學(xué)會(huì)識(shí)別和判斷,提高人工審核的效率。』 陳運(yùn)文解釋說,普通企業(yè)送審的招股說明書厚達(dá)500頁(yè),『常人看一遍就需要一個(gè)月』而現(xiàn)在他們用計(jì)算機(jī)來做初審,可以快速的發(fā)現(xiàn)說明書中的『數(shù)字錯(cuò)誤或者重大風(fēng)險(xiǎn)』。 『公司上市往往需要一年得時(shí)間過會(huì),其中很重要的原因就是閱讀時(shí)間漫長(zhǎng),就算人工分頭來閱讀招股書也需要花費(fèi)很長(zhǎng)時(shí)間。』 某全球著名的會(huì)計(jì)師事務(wù)所也是達(dá)觀數(shù)據(jù)的客戶,他們正試圖用AI替代人來來做審計(jì)。審計(jì)工作中大量的時(shí)間都花在「閱讀」上,一旦審計(jì)一個(gè)公司,這些審計(jì)師需要閱讀大量的公司合同進(jìn)而將數(shù)據(jù)摘錄到審計(jì)底稿中。 現(xiàn)在AI可以幫助他們完成這些工作,AI系統(tǒng)可以將企業(yè)合同中的「關(guān)鍵要素」抽取出來,然后導(dǎo)入審計(jì)師設(shè)計(jì)好的基礎(chǔ)格式中,用以生成基礎(chǔ)版的審計(jì)報(bào)告。 『當(dāng)然,今天的AI還不能取代審計(jì)師來做審計(jì)報(bào)告,但它們可以輔助審計(jì)師快速的抽取數(shù)據(jù)。』 陳運(yùn)文解釋說,審計(jì)師此前需要一個(gè)月做的「基礎(chǔ)審計(jì)報(bào)告」,今天AI「兩分鐘」就可以完成,單從速度方面比較AI比人類有著絕對(duì)的優(yōu)勢(shì)。 『人類一秒鐘大概閱讀24-30個(gè)字,也就是一條微信的長(zhǎng)度,而AI一秒鐘可以閱讀1萬個(gè)字,這將極大的縮短人們的工作時(shí)間。』 憑借AI『閱讀理解』的能力,現(xiàn)在達(dá)觀數(shù)據(jù)的客戶包括中國(guó)光大銀行、中信建投證券、海爾、長(zhǎng)虹、平安等機(jī)構(gòu)。 比較而言,今天人工智能在閱讀方面的應(yīng)用還更多的體現(xiàn)在理解「數(shù)字」上,和文字相比,數(shù)字顯然更方便人工智能理解閱讀。 『人腦不擅長(zhǎng)記憶數(shù)字。』這甚至可以從人類文明點(diǎn)起源中找到依據(jù)。在公元前2500年,活動(dòng)在西亞地區(qū)的蘇美爾人創(chuàng)立了「楔形文字」,而今天能夠找到的最古老的楔形文字是一塊被稱為『庫(kù)辛石板』的泥板。 考古學(xué)家破譯了這塊泥板后發(fā)現(xiàn)這是一條「財(cái)務(wù)」信息——『在37個(gè)月間,總共收到29086單位的大麥,由庫(kù)辛簽核。』 人類第一條文字用來記賬,這說明正是因?yàn)槿四X不擅長(zhǎng)記錄數(shù)據(jù),所以才將數(shù)字以圖形的方式記錄。現(xiàn)在這種差異以另一種方式延續(xù)——人們將不擅長(zhǎng)記憶的數(shù)據(jù)交給電腦來記載。 但隨著人工智能的發(fā)展,這些電腦不再局限于記憶數(shù)字,而開始通過數(shù)字為媒介,逐步進(jìn)入記憶理解文字的范疇。 現(xiàn)在達(dá)觀的文字系統(tǒng)已經(jīng)從造字閱讀的「?jìng)}頡」「畢昇」上升到書寫詩(shī)歌「蘇軾」,可以想象隨著AI對(duì)于文字掌握能力的提高,「雪芹」的出現(xiàn)或許并不遙遠(yuǎn)。 『一些文學(xué)問題,最終都是數(shù)學(xué)問題。』陳運(yùn)文感慨道。 --END--
版權(quán)所有:商業(yè)江湖    轉(zhuǎn)載聯(lián)系微信號(hào):living_lu   郵箱:luhl2017@126.com 盧或者,一個(gè)有著2年海上經(jīng)歷的遠(yuǎn)洋船員;4年市場(chǎng)經(jīng)驗(yàn)的石油銷售,8年媒體經(jīng)驗(yàn)的商業(yè)記者自媒體人。 同步更新,搜狐號(hào)、今日頭條、UC、百家、企鵝號(hào)、大風(fēng)號(hào)、網(wǎng)易號(hào)等。
AI 閱讀 系統(tǒng) 人工智能 人類
分享到:

1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。


主站蜘蛛池模板: 回转窑-水泥|石灰|冶金-巩义市瑞光金属制品有限责任公司 | 冷库安装厂家_杭州冷库_保鲜库建设-浙江克冷制冷设备有限公司 | 南京兰江泵业有限公司-水解酸化池潜水搅拌机-絮凝反应池搅拌机-好氧区潜水推进器 | 泡沫消防车_水罐消防车_湖北江南专用特种汽车有限公司 | 广州食堂承包_广州团餐配送_广州堂食餐饮服务公司 - 旺记餐饮 | 济南办公室装修-厂房装修-商铺装修-工装公司-山东鲁工装饰设计 | 北京包装设计_标志设计公司_包装设计公司-北京思逸品牌设计 | 818手游网_提供当下热门APP手游_最新手机游戏下载 | 【黄页88网】-B2B电子商务平台,b2b平台免费发布信息网 | 模型公司_模型制作_沙盘模型报价-中国模型网 | QQ房产导航-免费收录优秀房地产网站_房地产信息网 | 电位器_轻触开关_USB连接器_广东精密龙电子科技有限公司 | 加中寰球移民官网-美国移民公司,移民机构,移民中介,移民咨询,投资移民 | 基业箱_环网柜_配电柜厂家_开关柜厂家_开关断路器-东莞基业电气设备有限公司 | 【直乐】河北石家庄脊柱侧弯医院_治疗椎间盘突出哪家医院好_骨科脊柱外科专业医院_治疗抽动症/关节病骨伤权威医院|排行-直乐矫形中医医院 | 钢格板|热镀锌钢格板|钢格栅板|钢格栅|格栅板-安平县昊泽丝网制品有限公司 | 武汉印刷厂-不干胶标签印刷厂-武汉不干胶印刷-武汉标签印刷厂-武汉标签制作 - 善进特种标签印刷厂 | 交通信号灯生产厂家_红绿灯厂家_电子警察监控杆_标志杆厂家-沃霖电子科技 | 大功率金属激光焊接机价格_不锈钢汽车配件|光纤自动激光焊接机设备-东莞市正信激光科技有限公司 定制奶茶纸杯_定制豆浆杯_广东纸杯厂_[绿保佳]一家专业生产纸杯碗的厂家 | 亿立分板机_曲线_锯片式_走刀_在线式全自动_铣刀_在线V槽分板机-杭州亿协智能装备有限公司 | 皮带机_移动皮带机_大倾角皮带机_皮带机厂家 - 新乡市国盛机械设备有限公司 | 聚合氯化铝厂家-聚合氯化铝铁价格-河南洁康环保科技 | 首页|专注深圳注册公司,代理记账报税,注册商标代理,工商变更,企业400电话等企业一站式服务-慧用心 | 建筑资质代办-建筑资质转让找上海国信启航 | 刮板输送机,粉尘加湿搅拌机,螺旋输送机,布袋除尘器 | 山东石英砂过滤器,除氟过滤器「价格低」-淄博胜达水处理 | PTFE接头|聚四氟乙烯螺丝|阀门|薄膜|消解罐|聚四氟乙烯球-嘉兴市方圆氟塑制品有限公司 | 控显科技 - 工控一体机、工业显示器、工业平板电脑源头厂家 | TTCMS自助建站_网站建设_自助建站_免费网站_免费建站_天天向上旗下品牌 | 深圳货架厂家_金丽声精品货架_广东金丽声展示设备有限公司官网 | 披萨石_披萨盘_电器家电隔热绵加工定制_佛山市南海区西樵南方综合保温材料厂 | PCB接线端子_栅板式端子_线路板连接器_端子排生产厂家-置恒电气 喷码机,激光喷码打码机,鸡蛋打码机,手持打码机,自动喷码机,一物一码防伪溯源-恒欣瑞达有限公司 假肢-假肢价格-假肢厂家-河南假肢-郑州市力康假肢矫形器有限公司 | 济南货架定做_仓储货架生产厂_重型货架厂_仓库货架批发_济南启力仓储设备有限公司 | 气动隔膜阀_气动隔膜阀厂家_卫生级隔膜阀价格_浙江浙控阀门有限公司 | 昆山PCB加工_SMT贴片_PCB抄板_线路板焊接加工-昆山腾宸电子科技有限公司 | 派财经_聚焦数字经济内容服务平台| 广东风淋室_广东风淋室厂家_广东风淋室价格_广州开源_传递窗_FFU-广州开源净化科技有限公司 | 空气能采暖,热泵烘干机,空气源热水机组|设备|厂家,东莞高温热泵_正旭新能源 | 安全光栅|射频导纳物位开关|音叉料位计|雷达液位计|两级跑偏开关|双向拉绳开关-山东卓信机械有限公司 | 全温恒温摇床-水浴气浴恒温摇床-光照恒温培养摇床-常州金坛精达仪器制造有限公司 | 曙光腾达官网-天津脚手架租赁-木板架出租-移动门式脚手架租赁「免费搭设」 |