TMT观察网_独特视角观察TMT行业

點擊就看新NLP模型如何穩準狠狙擊杠精互聯網+

腦極體 2019-03-19 10:16
分享到:
導讀

將人類注意力引入機器學習算法的訓練,究竟有何意義?

將人類注意力引入機器學習算法的訓練,究竟有何意義? 看完《無敵破壞王2:大鬧互聯網》,資深迪粉的我不禁感慨,我迪自黑和黑起互聯網來,也是無人出其右。
不僅深度“曝光”了互聯網充斥著木馬病毒、彈窗廣告、暗網之類的“陰暗面”,一幕熱門視頻網站“BuzzzTube”所展現的“人間真實”也令人印象深刻:在網絡平臺上,算法可以讓一個普通人成為點贊無數、收入激增的網紅,卻難以阻擋網友們贈送的“人參”萬兩。
當拉爾夫在后臺驚愕地看到無數負面評價并為之難過時,網站的負責人“贊姐”(Yesss) 也只能建議他——“別看評論區……”
這不就是我們每天都會在網絡中圍觀的大型杠精現場嗎? 
無論國別、無論次元,只要網上沖浪,就會遇到水軍、鍵盤俠、噴子、杠精……總有一款奇葩網友在線教你做人,社交媒體上的“網怒癥”也以指數級增長。
當然,平臺們也并非無所作為,只不過,他們似乎總是用不對方法。
比如微博去年就打響了史上最狠評論區保衛戰,推出了凈化功能“拉黑禁言”,只要評論引發博主不適并被拉黑,亂發言的賬號三天內無法再發出任何一條評論。推出后確實震懾到了不少杠精,不過弊端也很明顯,那就是依賴網絡紅人大v博主們一人戰杠精,工作量和維護成本也未免也太大了吧? 既然人肉審查效率太低,那采用自動化呢?Youtube和Facebook以實際行動告訴我們,想要讓系統精準識別哪些是垃圾賬號和惡意行為,實在是做不到啊!
前不久,Facebook一口氣刪除783個“水軍”帳號,原因是存在虛假宣傳和輿論攻擊行為。其中356個Facebook帳戶和162個Instagram帳戶,早在2010年就開始在網絡任性活動了。但由于他們很容易偽裝自己,導致系統根本無法自動清理,最后還是靠手動審查才發現了蛛絲馬跡。
看來,想要讓機器像人一樣精準識別網絡行為背后的意圖,以當前NLP的閱讀理解能力,真的是想太多。
也因此,去年一篇利用人類眼動來提升NLP模型性能的論文,一經問世,就迅速受到關注,為與網絡暴力斗智斗勇的程序員們打開了一扇新的技術之窗。
我們不妨就以這個最新研究成果為契機,來猜想一下,技術如何才能打贏這場爭奪網絡話語權的無聲戰爭。
機器之殤:遠不夠完美的RNN
在了解這個新的RNN模型做了哪些創新之前,我想有必要先簡單介紹一下,NLP的世界里一般是如何使用注意力機制來完成任務的。
以最為常用的序列對序列(sequence to sequence)模型為例,比如說我們要將中文翻譯成英文,如果我們擁有大量的雙語語料,就可以得到兩個知識豐富而結構相似的編碼和解碼網絡,從而訓練出很有效的模型,來實現很好的機器翻譯效果。
但序列模型對機器的記憶力提出了比較殘酷的要求,需要先背誦全文再翻譯,如果是長篇大論,機器就放飛自我了。
于是,注意力模型出現了。
試想一下,人類是如何翻譯的(此處致敬高考英語老師):先完整地讀完整個句子,結合上下文理解大概含義,然后對關鍵單詞和短語重點思索,再著手進行翻譯。
而注意力模型試圖模仿的正是人類這種理解能力。它被設計成一個雙向的RNN網絡,每個單元由LSTM或GRU組成,能夠向前和向后獲取信息,通俗點說就是“聯系上下文”。
每次翻譯時,注意力模型會根據待翻譯部分以及上下文,給予不一樣的注意力(權重參數),接著循序漸進地翻譯出整段話。
注意力機制解決了傳統神經機器翻譯中基于短語的生搬硬套,但并不意味著毫無缺陷。
它的不完美主要體現在三個方面:
1.需要大規模標注數據。
原始RNN在解碼過程中,機器的焦點是分散在整個序列當中的,需要先對序列上的每個元素進行標記,再進行對齊操作。里面就包含了詞性標注、CHUNK識別、句法分析、語義角色識別,甚至包括關鍵詞抽取等很多子任務,顯然不是一個小工程。
2.增加額外運算負擔。
人類在閱讀時,并不關注所有的字,往往會自動忽略掉不想關注或無意義的部分,只重點處理關注需要注意的那一部分。比如“Courage is like a muscle”中,“Courage”和“muscle”就會讓人多看兩眼。這樣做不僅能夠降低任務的復雜度,還能避免腦負荷過載。
而NLP的注意力機制雖然是在模仿人類行為,但機器必須對所有對象進行處理和計算,還要用一個矩陣去存儲不同字節的權重,這些都增加了額外的運算壓力和成本。
3.容易出現歸納偏置。
通俗點說,就是機器在遇到某種沒有見過的東西時,會傾向于給出一個簡單的預測或判斷,以此來決定輸出規則。
比如通過分析,它認為出現“but”“不”等單詞,就說明對方會開始釋放負面甚至攻擊性的語言了。但要是遇上“我跳起來反手就是一個么么噠”之類玩梗的騷操作,可能就會誤傷友軍。
了解了注意力機制的基本工作方式,我們就趕緊來看看這項新的研究成果,究竟是憑什么驚艷了整個學界吧。
NLP希望之鑰,還掌握在人類手中
一句話概括,就是論文作者Maria Barrett和她的同事們,將人類在閱讀時的眼部動作引入了RNN網絡的訓練中,使其能夠在標注型文本和人類注意力信息之間來回切換,以此獲得性能更好的循環神經網絡。
具體是怎么實現的呢?
首先,研究人員利用兩個公開的眼動追蹤語料庫:Dundee Corpus和ZuCo Corpus來研究人類的注意力機制。
其中,Dundee Corpus包含了20篇報紙文章,共2368個句子,閱讀屏幕可以感知眼部動作。ZuCo Corpus則包含了1000個單獨的英語句子,有一部分來自斯坦福情感樹庫,通過紅外染色儀來記錄眼睛運動和面部情緒分析。
根據這些人類閱讀語料時的眼睛動作追蹤數據(比如注視持續時間MEAN FIX DUR),得到了一個“人類注意力”的數據集。
第二步,使用人類眼動數據集與標注好的序列數據集,來共同訓練RNN模型。
從兩個數據集中隨機選擇一個數據,讓機器判斷屬于哪一個數據集。
如果屬于序列數據集,則進一步判斷該句子的類別,計算并預測標簽blabla;如果屬于人類眼動數據集,則計算每個單詞的權重(即attention值),再進行歸一化(最小平方差)處理。
那么,經受了人機雙重挑戰的新RNN網絡效果如何呢?接下來,研究人員通過三個任務對其性能進行了測試:
任務一:句子情感分析。使用新RNN來檢測機器是否能識別出數據集(SEMEVAL TWITTER POS | NEG)中的負面句子和非負面句子;
任務二:語法錯誤檢測。讓新的RNN閱讀經專家注釋的英語論文(數據集FCF),并找出其中的語法錯誤,與正確的句子區分開;
任務三:暴力語言檢測。研究人員安排了20940條設計性別歧視和種族主義等辱罵型語言的推特(數據集Waseem和Hovy),來對新的RNN進行測試。 最終的實驗結果顯示,加入了人類注意力訓練之后的RNN,找重點的能力,以及預測的精準程度,要遠高于原本的序列模型。
這項研究成果很快就引起了反響,并獲得了NLP頂會CoNLL 2018年度最佳研究論文特別獎。
那么,接下來請回答一道送分題:這項成果有何特別之處?
RNN的一小步,NLP的一大步
將人類注意力引入機器學習算法的訓練,究竟有何意義?我來搶答一下:
首先,降低了對序列分類標注語料的依賴,讓NLP模型的訓練有了更多可能性。
讓機器學習注意力函數需要非常大規模的數據,結果就是讓開發者不得不陷入爭奪計算資源的“金錢戰爭”。該項研究為 NLP 中的許多注意力函數提供一個不錯的歸納偏置性能,同時還不要求目標任務數據帶有眼睛跟蹤信息,直接減少了數據需求量。
其次,是從語義到推理的性能跨越。
傳統的序列到序列模型和RNN網絡,只能解決語義理解問題,而該論文證明,使用人眼注意力來規范機器的注意力功能,可以讓一系列NLP任務實現顯著改善,甚至觸及了常識、推理等認知能力。
機器能從“凝視”信息中獲取對多重表達、情緒分析的精準判斷,某種程度上已經學會了模擬人類的注意力。
以后機器也許就能夠輕松挑戰女朋友說“我沒有不高興”這樣雙重否定表否定的高難度閱讀理解了。是不是很期待呢?
而最重要也最接地氣的,則是新模型帶來的網絡沖浪體驗革命了。
研究團隊認為,該模型很快就能夠在一些比較關鍵的實際應用中,判斷網絡文本的犯罪意圖、評論信息和情感傾向。
比如通過帖子或推文的訓練,幫助微博/推特/臉書等社交媒體精準識別出惡意評論的杠精和廢話連篇的水軍,并予以精準過濾和清楚,營造一個更美好的社區氛圍;
再比如通過淘寶/亞馬遜/Yelp,以及各種應用商店中不同類別的反饋,對特殊屬性(衣服的尺寸、使用感受)和商品評價的不同反饋進行分類和提取,幫助商家優化經營,并精準打擊刷單等欺騙行為。
除此之外,該模型還能根據意圖對文本進行分類,比如在遇到緊急問題或檢測到請求幫助的需求(發出帶有自殺或發社會傾向的推文或聊天記錄)時,能夠及時通知執法人員,從而避免災難性事件的發生。
這樣一對比,是不是感覺一個“機器懂我、天下無杠”的美麗新世界在向你招手呢?
再說一點
由此延展到整個AI領域,或許可以發現,人類和智能機器,本質上在做著同樣的事情,只不過AI的功能是將其抽象化并用新的邏輯演繹出來,然后人類給它投喂數據,它消化之后返還給我們或理想或智障的結果……
而機器的內化過程,一直遭遇著黑箱性的詬病,越來越龐大的神經網絡層和數據需求量,也已經讓研究者不堪重負。
前路在哪里?或許那張大家快看吐了的人類與機器人指尖對指尖的圖,正印證著機器學習的未來,那就是:人機協同。
越來越多的研究者開始將人類推理和決策行為引入到機器訓練之中,比如MIT和微軟在訓練無人駕駛汽車時,開始讓它們從人類反饋中找到認知盲點,以此應對那些模糊決策情境。
DeepMind和OpenAI讓沒有技術經驗的人類控制員來選擇預期目標,并以此訓練激勵預期側,讓智能體根據人類的偏好改進自己的行為,最終完成復雜的任務目標,比如后空翻;基于人眼注意力的新RNN網絡也是如此。
這種改變,可以被歸結為深度學習的階段性技術瓶頸,只能靠向人類借力來攻破。
但從某種意義上來說,與人類攜手,將人類的抽象能力與計算機系統邏輯進行更高耦合度的融合,可能才是機器智能更現實也更有效的解決方案。
肯尼迪的那句話放在AI的世界里依然無比適合——不要問機器為你做了什么,要問你能為機器做些什么。相比于等待機器自我迭代到成熟的那一天來服務我們,參與“智能養成游戲”不是更令人期待嗎?
好了不說了,我要背上鍵盤去和杠精們大戰三百回合,為機器貢獻垃圾數據咯。
人類 機器 網絡 注意力 數據
分享到:

1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。


主站蜘蛛池模板: 佛山市德信昌电子有限公司 | 24位ADC|8位MCU-芯易德科技有限公司| 电竞馆加盟,沈阳网吧加盟费用选择嘉棋电竞_售后服务一体化 | 齿轮减速机_齿轮减速电机-VEMT蜗轮蜗杆减速机马达生产厂家瓦玛特传动瑞环机电 | 干式磁选机_湿式磁选机_粉体除铁器-潍坊国铭矿山设备有限公司 | 生态板-实木生态板-生态板厂家-源木原作生态板品牌-深圳市方舟木业有限公司 | 今日娱乐圈——影视剧集_八卦娱乐_明星八卦_最新娱乐八卦新闻 | 临海涌泉蜜桔官网|涌泉蜜桔微商批发代理|涌泉蜜桔供应链|涌泉蜜桔一件代发 | 医疗仪器模块 健康一体机 多参数监护仪 智慧医疗仪器方案定制 血氧监护 心电监护 -朗锐慧康 | 广州展台特装搭建商|特装展位设计搭建|展会特装搭建|特装展台制作设计|展览特装公司 | 首页|专注深圳注册公司,代理记账报税,注册商标代理,工商变更,企业400电话等企业一站式服务-慧用心 | 重庆钣金加工厂家首页-专业定做监控电视墙_操作台 | 亮点云建站-网站建设制作平台 | 电脑知识|软件|系统|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网 | 混合气体腐蚀试验箱_盐雾/硫化氢/气体腐蚀试验箱厂家-北京中科博达 | 软启动器-上海能曼电气有限公司 真空搅拌机-行星搅拌机-双行星动力混合机-广州市番禺区源创化工设备厂 | 山东太阳能路灯厂家-庭院灯生产厂家-济南晟启灯饰有限公司 | 球盟会·(中国)官方网站 | 玻纤土工格栅_钢塑格栅_PP焊接_单双向塑料土工格栅_复合防裂布厂家_山东大庚工程材料科技有限公司 | 威实软件_软件定制开发_OA_OA办公系统_OA系统_办公自动化软件 | 广东燎了网络科技有限公司官网-网站建设-珠海网络推广-高端营销型外贸网站建设-珠海专业h5建站公司「了了网」 | 小区健身器材_户外健身器材_室外健身器材_公园健身路径-沧州浩然体育器材有限公司 | 深圳标识制作公司-标识标牌厂家-深圳广告标识制作-玟璟广告-深圳市玟璟广告有限公司 | 杭州顺源过滤机械有限公司官网-压滤机_板框压滤机_厢式隔膜压滤机厂家 | 英语词典_成语词典_日语词典_法语词典_在线词典网 | 防火阀、排烟防火阀、电动防火阀产品生产销售商-德州凯亿空调设备有限公司 | 吸污车_吸粪车_抽粪车_电动三轮吸粪车_真空吸污车_高压清洗吸污车-远大汽车制造有限公司 | 不锈钢/气体/液体玻璃转子流量计(防腐,选型,规格)-常州天晟热工仪表有限公司【官网】 | 高清视频编码器,4K音视频编解码器,直播编码器,流媒体服务器,深圳海威视讯技术有限公司 | 低气压试验箱_高低温低气压试验箱_低气压实验箱 |林频试验设备品牌 | 塑料熔指仪-塑料熔融指数仪-熔体流动速率试验机-广东宏拓仪器科技有限公司 | 灌装封尾机_胶水灌装机_软管灌装封尾机_无锡和博自动化机械制造有限公司 | 预制舱-电力集装箱预制舱-模块化预制舱生产厂家-腾达电器设备 | 成都软件开发_OA|ERP|CRM|管理系统定制开发_成都码邻蜀科技 | 超声骨密度仪-动脉硬化检测仪器-人体成分分析仪厂家/品牌/价格_南京科力悦 | 校服厂家,英伦校服定做工厂,园服生产定制厂商-东莞市艾咪天使校服 | 英思科GTD-3000EX(美国英思科气体检测仪MX4MX6)百科-北京嘉华众信科技有限公司 | 电动百叶窗,开窗器,电动遮阳百叶,电动开窗机生产厂家-徐州鑫友工控科技发展有限公司 | 挨踢网-大家的导航!| 电缆隧道在线监测-智慧配电站房-升压站在线监测-江苏久创电气科技有限公司 | 葡萄酒灌装机-食用油灌装机-液体肥灌装设备厂家_青州惠联灌装机械 |