TMT观察网_独特视角观察TMT行业

低資源神經機器翻譯MetaNMT :來自MAML與NLP的溫柔救贖互聯網+

腦極體 2019-03-01 14:15
分享到:
導讀

如果技術不去往那些真正的荒蕪之地,又有什么意義?

如果技術不去往那些真正的荒蕪之地,又有什么意義? 過去十年,隨著Attention模型、LSTM、記憶Memory等等方法的出現,尤其是在神經網絡的加持下,機器翻譯的水平取得了長足的進步。
在英法、中英這樣的大語種(Rich Language)翻譯任務上,機器的表現幾乎可以媲美人類的水平,甚至已經開始登堂入室,承接了不少國際大會的翻譯業務,讓人類翻譯感受到了深深的失業焦慮。
然而,神經機器翻譯(NMT)的成功往往依賴于大量高質量的雙語語料作為訓練數據。如果是蒙古語、印度語這些小語種,無法提供足夠多的雙語數據,更極端的現實情況是,有些語言幾乎沒有任何雙語預料,這種情況下NMT就無能為力了。
標注數據資源的貧乏問題,一直沒有什么好的解決辦法。因此,來自香港大學、紐約大學的研究人員Jiatao Gu、Yong Wang等人所提出的新神經機器翻譯方法MetaNMT,論文一經發表,就憑借在低資源神經機器翻譯(NMT)上的優異性能表現驚艷了學界,成為2018年最具影響力的NLP創新之一。
論文不僅被NLP領域領先的會議EMNLP收錄,還拿下了Facebook的低資源神經機器翻譯獎。今天,我們就來看看MetaNMT方法究竟有何過人之處?
什么是MetaNMT算法?
簡單來說,MetaNMT算法就是將元學習算法(MAML),用于低資源神經機器翻譯(NMT)中,將翻譯問題建構為元學習問題,從而解決低資源語言語料匱乏的難題。
研究人員先使用許多高資源語言(比如英語和法語),訓練出了一個表現極佳的初始參數,然后使構建一個所有語言的詞匯表。再以初始參數/模型為基礎,訓練低資源語言的翻譯(比如英語VS希伯來語,法語VS希伯來語)。在此基礎上進行進一步優化初始模型,最終得到的模型就可以很好地提升小語種翻譯模型的性能。
具體到實驗中,研究人員使用十八種歐洲語言所訓練的元學習策略,被應用在以五種小語種語言(Ro,Lv,Fi,Tr和Ko)為目標的任務中。結果證明,通過16000個翻譯單詞(約600個并行句子),羅馬尼亞語-英語WMT'16上實現高達22.04 BLEU。
數據顯示,MetaNMT訓練出的系統,表現要明顯優于基于多語言遷移學習。這意味著只需要一小部分的訓練樣例,我們就能訓練出效果更好的NMT系統,很多語料庫非常小的語言,機器翻譯時也不會再一籌莫展或者胡言亂語了。
NLP的神助攻:元學習強在何處?
MetaNMT之所以取得如此良好的效果,核心就在于引入的MAML(Model Agnostic Meta Learning),即與模型無關的元學習方法。
簡單來說,元學習就是要讓智能體利用以往的知識經驗“學會如何學習”(Learning to learn),然后更高效地完成新任務。
傳統NLP任務中常用的遷移學習(transfer leaning)或多任務學習(Multi-Task Learning),輸入端訓練得到的編碼器(Encoder)會直接轉化為對應的向量表示序列,直指目標任務。而MetaNMT則是通過高資源語言系統的訓練得到一個獨立于原任務的通用策略方法,再讓極低資源的語言系統根據這種學習方法,并反復地模擬訓練。
過去,元學習一直被用來進行小樣本學習、通用機器人等訓練中,MetaNMT的提出,也是MAML第一次在NLP領域成功應用。那么,未來隨著元學習的加入,NLP領域會產生哪些可能的變化呢?
首先,降低NLP任務的研究門檻。
深度增強學習需要的訓練數據量規模越來越大,游戲等動態任務環境所涉及的獎勵機制也日趨復雜。在StyleGAN、BERT等“巨無霸”模型的爭奪下,GPU/TPU計算時長變得極其昂貴,NLP儼然快要成為土豪大公司才有資格玩的游戲了。
與之相比,通過少量樣本資源就能學會新概念的元學習方法,可以只使用少量的梯度迭代步來解決新的學習任務,就顯得平易近人很多。
其次,提升NLP任務的學習效率。
傳統的數據集更新周期長,往往需要根據新任務進行改造和再編輯。而元學習就改變了這一現狀。先讓系統接觸大量的任務進行訓練,再從中學會完成新任務的方法,可以快速(只需少量步驟)高效(只使用幾個例子)地應用于廣泛的NLP任務中。
尤其是在特定領域對話系統、客服系統、多輪問答系統等任務中,在用戶的使用過程中就可以收集豐富的信息,讓系統在動態學習中構建越來越強大的性能。
除此之外,元學習還能幫助NLP實現個性化、智能化進階。
特定用戶可以根據已有的知識經驗和認知結構與元學習系統之間建立聯系,通過不同個體的動態交互與信息反饋等,元學習系統可以不斷豐富和修正自身的知識網絡和輸出效果,最終使得構建個性化產品變得更加方便快捷,高智能交互也因此成為可能。
總而言之,Few-Shot(低資源)、Fast Adaptation(高適應性)、Reusability(重用性)等特點,使得元學習的價值前所未有地清晰起來,某種程度上也代表了NLP接下來的研究方向。
道阻且長:NLP的進化之路
既然元學習之于NLP領域意義重大,為什么直到現在才出現了一個成功案例呢?這恐怕還要從低資源型語言的研究現狀說起。
前面提到,驗證元學習系統性能最好的方式,就是將其放到低資源任務中,看看是否和大規模任務一樣出色。但這么做有個前提,就是能夠建立起對應的數據集。然而這對稀缺資源的小語種來說,也不是件容易的事。
以MetaNMT為例,就為各個語言建立了詞匯表。其中的低資源型目標任務,土耳其語、拉脫維亞語、羅馬尼亞語、芬蘭語等等,就是通過16000個翻譯單詞(約600個并行句子)完成的,這已經是目前神經機器翻譯的極限了。 然而全世界6000多種語言中,80%人口講的都是主要的83種語言,剩下的有30%都處在語料資源極度匱乏的狀態,而且絕大多數沒有任何文字記載,有的甚至使用者不足十人。缺乏相關的數據集,往往只有少量文本可供使用,成為阻礙小語種機器翻譯最大的攔路虎。即使有元學習這樣的神兵利器,也沒有用武之地。
而近年來,情況正在發生一些積極的變化。
一方面越來越多的人開始重視瀕危語言保護問題,出現了公益化的語料收集項目和相關數據庫,大大降低了小語種的研究難度。比如南非數字語言資源中心(SADiLaR),已經能夠提供許多南非的語言資源;
另外,NLP研究的發展,也激發了更多的人創建并開放出極低資源語料數據集,為跨語言模型開發、低資源語言訓練等提供了可能性。
比如FAIR 和紐約大學的研究者合作開發的一個自然語言推斷語料庫 XNLI,將 MultiNLI 的測試集和開發集擴展到 15 種語言,里面就包含了斯瓦西里語和烏爾都語等低資源語言。
目前看來,MetaNMT之所以備受褒獎,并不是因為它一出手就取得了什么炸裂至極的效果。它的價值,更多的是作為一種靈感和理念,去傳達技術的本質,引領更具價值的理想化的創造。
NLP的進步,不應來自于堆砌資源和規模,不應只停留在本就飽和的領域,而是構建出真正無障礙的語言系統。讓說著匱乏型語言的人們,也能夠閱讀非母語的新聞,或者在遇到問題時求助于可靠的專家系統。
如果技術不去往那些真正的荒蕪之地,又有什么意義?
學習 語言 資源 任務 NLP
分享到:

1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。


主站蜘蛛池模板: 山东风淋室_201/304不锈钢风淋室净化设备厂家-盛之源风淋室厂家 翻斗式矿车|固定式矿车|曲轨侧卸式矿车|梭式矿车|矿车配件-山东卓力矿车生产厂家 | 模温机-油温机-电加热导热油炉-工业冷水机「欧诺智能」 | 高防护蠕动泵-多通道灌装系统-高防护蠕动泵-www.bjhuiyufluid.com慧宇伟业(北京)流体设备有限公司 | 百度网站优化,关键词排名,SEO优化-搜索引擎营销推广 | 恒压供水控制柜|无负压|一体化泵站控制柜|PLC远程调试|MCGS触摸屏|自动控制方案-联致自控设备 | 自恢复保险丝_贴片保险丝_力特保险丝_Littelfuse_可恢复保险丝供应商-秦晋电子 | 杭州中央空调维修_冷却塔/新风机柜/热水器/锅炉除垢清洗_除垢剂_风机盘管_冷凝器清洗-杭州亿诺能源有限公司 | TwistDx恒温扩增-RAA等温-Jackson抗体-默瑞(上海)生物科技有限公司 | 深圳成考网-深圳成人高考报名网 深圳工程师职称评定条件及流程_深圳职称评审_职称评审-职称网 | 反渗透水处理设备|工业零排放|水厂设备|软化水设备|海南净水设备--海南水处理设备厂家 | 砖机托板价格|免烧砖托板|空心砖托板厂家_山东宏升砖机托板厂 | 亳州网络公司 - 亳州网站制作 - 亳州网站建设 - 亳州易天科技 | WTB5光栅尺-JIE WILL磁栅尺-B60数显表-常州中崴机电科技有限公司 | 布袋式除尘器|木工除尘器|螺旋输送机|斗式提升机|刮板输送机|除尘器配件-泊头市德佳环保设备 | 合同书格式和范文_合同书样本模板_电子版合同,找范文吧 | 钢骨架轻型板_膨石轻型板_钢骨架轻型板价格_恒道新材料 | 柔软云母板-硬质-水位计云母片组件-首页-武汉长丰云母绝缘材料有限公司 | 铣刨料沥青破碎机-沥青再生料设备-RAP热再生混合料破碎筛分设备 -江苏锡宝重工 | 胀套-锁紧盘-风电锁紧盘-蛇形联轴器「厂家」-瑞安市宝德隆机械配件有限公司 | 检验科改造施工_DSA手术室净化_导管室装修_成都特殊科室建设厂家_医疗净化工程公司_四川华锐 | 深圳天际源广告-形象堆头,企业文化墙,喷绘,门头招牌设计制作专家 | 济南冷库安装-山东冷库设计|建造|冷库维修-山东齐雪制冷设备有限公司 | 上海小程序开发-上海小程序制作公司-上海网站建设-公众号开发运营-软件外包公司-咏熠科技 | 立式矫直机_卧式矫直机-无锡金矫机械制造有限公司 | 陶瓷砂磨机,盘式砂磨机,棒销式砂磨机-无锡市少宏粉体科技有限公司 | 对照品_中药对照品_标准品_对照药材_「格利普」高纯中药标准品厂家-成都格利普生物科技有限公司 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库 | 早报网| 全自动包装秤_全自动上袋机_全自动套袋机_高位码垛机_全自动包装码垛系统生产线-三维汉界机器(山东)股份有限公司 | 电主轴-高速精密电主轴-高速电机厂家-瑞德沃斯品牌有限公司 | 智慧钢琴-电钢琴-便携钢琴-数码钢琴-深圳市特伦斯乐器有限公司 | 环球电气之家-中国专业电气电子产品行业服务网站! | 南京雕塑制作厂家-不锈钢雕塑制作-玻璃钢雕塑制作-先登雕塑厂 | 一体化净水器_一体化净水设备_一体化水处理设备-江苏旭浩鑫环保科技有限公司 | 六维力传感器_六分量力传感器_模腔压力传感器-南京数智微传感科技有限公司 | 折弯机-刨槽机-数控折弯机-数控刨槽机-数控折弯机厂家-深圳豐科机械有限公司 | YAGEO国巨电容|贴片电阻|电容价格|三星代理商-深圳市巨优电子有限公司 | 废水处理-废气处理-工业废水处理-工业废气处理工程-深圳丰绿环保废气处理公司 | 氢氧化钙设备, 氢氧化钙生产线-淄博惠琛工贸有限公司 | 安徽净化工程设计_无尘净化车间工程_合肥净化实验室_安徽创世环境科技有限公司 | PAS糖原染色-CBA流式多因子-明胶酶谱MMP-上海研谨生物科技有限公司 | 大立教育官网-一级建造师培训-二级建造师培训-造价工程师-安全工程师-监理工程师考试培训 |