TMT观察网_独特视角观察TMT行业

學語的幼兒:如何把語言歧視纏身的AI拉回正道?互聯網+

腦極體 2018-05-25 22:17
分享到:
導讀

讓AI讀懂人類將是一個遙遠而艱辛的路程。時至今日,AI更像是一個幼兒,它全盤接受著來自這個世界的所有內容,而后年歲漸長,

到目前為止,跟人類最像的東西應該就是AI了。自人類誕生,從來沒有什么能像今天的AI一樣,能如此地理解人類。


盡管它距離完全了解我們還有很遠,但已經夠好了。


深度學習讓AI再次煥發活力,其對人的模仿能力大大增強。無論是看圖還是說話,它一直都在學著從人類的視角去看世界。從語言學習方面來說的話,AI其實更像是鸚鵡。




那么,也就是說,AI的一切都是從人們那里學來的。至少在目前來看,無論怎么努力,它都無法越過人類日常的藩籬。人喜歡什么,它就喜歡什么;人討厭什么,它也討厭什么。人類會罵娘,它也能學會說法克。


從另外一個視角來看,現在人們訓練AI,幾乎就是在教一個嬰兒走路、說話、認識事物、發展智力等等。那么,當有一天你兒子突然罵了句娘,你意不意外?


AI語言歧視?一切不過是命中之理


當年微軟推出聊天機器人Tay的時候,滿以為會打開一扇新世界的大門,沒想到大門是打開了,里面卻不是新世界。短短不到24個小時,Tay已經學會了說臟話和發表帶有種族歧視、反動色彩的言論。沒辦法,微軟只好讓它緊急閉嘴。




而這也僅僅只是個開始而已。隨后智能音箱相繼邁入市場,背負著聊天對話、家居入口的使命,最后仍然逃不掉罵人的命運。隨口來個國罵法克尤什么的,根本都不是個事兒。


不僅僅是“出言不遜”,AI也開始逐步學會用人的眼光“打量”這個世界。去年就有人曝出谷歌翻譯將護士翻譯為“she”,而將醫生翻譯為“he”,由此而引發了關于AI職業歧視的問題;將黑人和大猩猩識別為同一種生物,又引發了AI的種族歧視……


從人們發現這個問題開始,關于由語言歧視引發的AI道德論的紛爭就沒有停止過。一方面畢竟AI的黑箱還沒有打開,有些人認為這就是AI的主觀故意行為;另一方面,畢竟媒體們得寫點兒什么來賺取閱讀量,所以給機器人加上一些人類都敏感的名詞,自然也符合看熱鬧群眾的獵奇心理。


但嚴肅來講,AI的語言歧視問題完全沒有必要上升到全民批判甚至精神緊張的高度,一旦從技術的層面去分析問題,就會發現,這原本就是個命中之理。

那這個理是什么?


禍是惹了,但鍋是背不了


首先我們弄清楚,智能音箱為什么會罵人?


這和它的工作程序是密切相關的。我們知道智能音箱主要有兩個作用,一個是陪人聊天兒,另一個是家居控制。在目前家居控制得還不太順利場景下,聊天已經成為了智能音箱的最主要作用。那,聊天聊什么?


我國人民最喜歡逗小孩兒,每次都以把小孩兒逗哭為最大的樂子。那有了智能音箱,就又多了個逗的玩具。人就是這樣,在單位跟人說正經話太累,回到家里就想說點兒不正經的。作為一種新生事物,智能音箱是除了孩子之外第一個能學舌的物件了。所以,你好啊、唱歌啊之類的日常對話膩歪了,大家就像逗逗它:對它說兩句臟話怎么樣?


有了第一句,就有了第二句。國罵教完了,開始花式罵架。以智能音箱的學習能力,掌握這點兒東西自然不在話下。


其實學幾句臟話不難,畢竟這是AI的看家本領。但我們必須要時刻清楚點的一件事是:你認為AI罵人了,但AI自己并不知道。


也就是說,它根本沒有詞的情感色彩點的概念。在這一點上,它和兩三歲的幼兒是一樣的。


同樣的原理,對種族甚至是職業方面的歧視現象也是必然會發生的。對職業而言,比如上文提到的護士和醫生,相關數據確實表明,在全球女性在護士總體中占到了90%,而在中國更是高達98%以上。與之相比美國醫學院校男性職工則占到六成以上,并且隨著職稱的提高這個比例還會上升。


同樣,美國卡耐基基梅隆的調查人員也發現,在谷歌搜索當中,如果瀏覽器認為你是個男性,會給你推薦一些薪水更高的職業。并且在一些算法中,黑人名字往往和消極性詞匯聯系在一起,而白人名字則和往往積極向上的詞眼在一塊兒。


如同AI沒有詞的情感色彩觀念,它當然也就沒有種族和職業觀念。其在進行數據學習的時候會采用大概率的內容來給某一類用戶進行畫像,然后才會輸出類似的價值觀。事實上,黑人在美國的犯罪率確實要高一點,而女子的薪資水平也大概只有男子的81%左右。


從以上的分析我們可以得出一個基本的結論:AI無意對任何人、任何職業進行言語歧視,它所表現出來的一切,全都都是基于客觀數據而生成的用戶畫像。


但是,無意代表無罪嗎?雖然沒有主觀上的意愿,但它至少造成了客觀上歧視的事實。人們做出來AI,不是讓它給我們帶來有意或無意的傷害的。被人冷嘲熱諷也就算了,活得連機器都看不起,那人豈不是要跳樓?


所以,這口鍋到底該由誰來背?


懂得越少,就越容易說錯話


AI的三大生命支撐里,數據、算力和算法三者缺一不可,但同時又擔負AI生長的不同任務。相較之下,算力為AI的大面積擴張提供了可能,而數據和算法則直接影響了它的生命走向:成為一個寵兒,亦或是全民公敵。


那么,對詞匯情緒識別錯誤、職業種族的強加,前者缺乏了對情緒的識別,后者則將不完全歸納奉為圭臬。


事實上,已經有許多公司和科研機構展開了對AI的情緒識別的研究。國內的如阿里巴巴和清華大學合作成立的自然交互體驗實驗室,其就將研究領域定位在情感認知計算、實體交互、多通道感知等領域,讓機器具備聽覺、視覺、觸覺等五感,從而理解人類的情感。AI之所以罵人,值得關注的一點就是其將語言僅僅視作一種指向,而不對這種指向進行背后的含義分析。如果加入了對對話者表情、對話場景、對話對象等的綜合分析,這種語言的指向性對機器而言將更豐富,其避免出口成臟的可能性也就更大。




而在最近,一家位于倫敦的初創公司Realeyes則推出了一款AI攝像頭,它利用計算機視覺來讀取一個人在觀看長達6秒鐘的視頻時的情緒反應,然后利用預測性分析來幫助將這些反應映射到視頻中,以提供關于視頻效果的反饋。


也就是說,識別情緒必須要帶點兒圖。


這樣的邏輯看上去沒有什么問題,但實施起來困難重重。而要解決這些困難,或許構建完備的知識圖譜是一個不錯的選擇。


仍以AI罵人來分析。我們可以看看,在避免AI罵人的背后有多少的內容需要其消化吸收。


首先,AI要知道哪些詞匯是用來罵人的。可不要以為這是一個簡單的東西,首先詞匯量就夠大,古人有文縐縐的“豎子”,今人有張口就來的“傻*”。人民群眾吃飽飯沒事兒干什么?打屁唄。打了幾千年,臟話在各地的方言中五花八門,要消化就得一陣子。


其次,在不同的使用場景下,詞語是會褒貶轉化的。比如女生對男生撒嬌“你真是個壞蛋”,AI忽略了這個場景,然后抓住“壞蛋”,還以為女生受到了威脅,然后順手報了個警怎么辦?Echo報警這事兒也早都不是新聞了。


最后,也是最難的,AI如何識別出一套臟話的邏輯?罵人不帶臟字的人大有人在。就算AI掌握了所有的臟話詞匯,并將其成功過濾掉,但是仍然可能會對一些深藏不露的話術選擇學習吸收,最后難免也會出現問題。


也就是說,一張詞匯+場景+邏輯的臟話知識圖譜的構建是AI能夠在交流中避過語言問題的基礎。但除此之外就萬事大吉了嗎?


當然不是。


這張知識圖譜不應該僅僅只有語言


人與人的交流如果只是吐出來幾個單詞,那未免也太簡單了,簡單得就像個1。除了語言之外,還包括動作、表情、聲調等等。所以說,要解決臟話問題,這張知識圖譜的內容還應該包含更多。


人機交流要想更加自然、更加和諧,還需要去進行人說話時的常用姿勢含義、表情尤其是微表情以及說話音調的高地等方面的知識圖譜的構建。值得注意的是,這些知識圖譜也并不是簡單的構建和疊加。要知道,語言、動作、表情和聲調之間可以做海量的排列組合,不同的組合之間又代表著不同的情緒。


而目前這項工作幾乎是一片空白。雖然有不少的機構都在研究表情、肢體等具體動作的含義,但基本上僅限于個別表情的表面含義,但這一層并不是知識圖譜的全部內容。從表層含義到背后情緒到語言相關到動作相關,這一系列復雜的內容都是需要投入精力來完成的。


那么,假如知識圖譜構建完畢,下一個難題可能就要交給算法了。如何把如此巨大的信息進行捏合,并判斷得準確,工程量不容小覷。


如果這一切都能完成,那么,AI將可能不再會僅僅因為膚色和那些片面的數據來去判斷一個人的品質,也將不自作主張地將所有的職業都分配給指定的性別。它在罵人的時候會三思而緘口,在更廣闊的識別判斷上也將做出更為公正、更為客觀的決定。


而正如上文我們提到的,AI所謂的“歧視”表現,正是對現實情況的一個讀取。所以在某種程度上,人類把AI的歧視放大了。要從根本上改變這種現象,最應該反思的其實是人類自己。那么,從這個角度上來講,AI的歧視反而是一件好事,它讓人類從第三者的角度重新認識了自己,并發現一些潛移默化而自身渾然不覺的問題。利用對AI的這種意外“收獲”來反省人類自身,對消除人類社會的偏見也有助力。


誠然,讓AI讀懂人類將是一個遙遠而艱辛的路程。時至今日,AI更像是一個幼兒,它全盤接受著來自這個世界的所有內容,而后年歲漸長,更懂得世界的善惡、冷暖、喜怒和哀樂。而我們要做的,就是不斷拍去它成長路上沾染的灰塵,令其成為一個干凈的人工智能。

AI 人類 語言 歧視 問題
分享到:

1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。


專題報道

主站蜘蛛池模板: 齿辊分级破碎机,高低压压球机,立式双动力磨粉机-郑州长城冶金设备有限公司 | 大通天成企业资质代办_承装修试电力设施许可证_增值电信业务经营许可证_无人机运营合格证_广播电视节目制作许可证 | 华东师范大学在职研究生招生网_在职研究生招生联展网 | 民用音响-拉杆音响-家用音响-ktv专用音响-万昌科技 | TPM咨询,精益生产管理,5S,6S现场管理培训_华谋咨询公司 | 照相馆预约系统,微信公众号摄影门店系统,影楼管理软件-盟百网络 | 烘箱-工业烘箱-工业电炉-实验室干燥箱 - 苏州华洁烘箱制造有限公司 | pbootcms网站模板|织梦模板|网站源码|jquery建站特效-html5模板网 | 六维力传感器_六分量力传感器_模腔压力传感器-南京数智微传感科技有限公司 | 光伏家 - 太阳能光伏发电_分布式光伏发电_太阳能光伏网 | 定制/定做衬衫厂家/公司-衬衫订做/订制价格/费用-北京圣达信 | 西子馋火锅鸡加盟-太原市龙城酉鼎餐饮管理有限公司 | 冷藏车-东风吸污车-纯电动环卫车-污水净化车-应急特勤保障车-程力专汽厂家-程力专用汽车股份有限公司销售二十一分公司 | 聚合氯化铝价格_聚合氯化铝厂家_pac絮凝剂-唐达净水官网 | 桁架机器人_桁架机械手_上下料机械手_数控车床机械手-苏州清智科技装备制造有限公司 | 苏州柯瑞德货架-仓库自动化改造解决方案 | 婚博会2024时间表_婚博会门票领取_婚博会地址-婚博会官网 | 杭州用友|用友软件|用友财务软件|用友ERP系统--杭州协友软件官网 | 早报网| 多功能真空滤油机_润滑油全自动滤油机_高效真空滤油机价格-重庆润华通驰 | 冷柜风机-冰柜电机-罩极电机-外转子风机-EC直流电机厂家-杭州金久电器有限公司 | 高压分散机(高压细胞破碎仪)百科-北京天恩瀚拓 | 贝朗斯动力商城(BRCPOWER.COM) - 买叉车蓄电池上贝朗斯商城,价格更超值,品质有保障! | 伶俐嫂培训学校_月嫂培训班在哪里报名学费是多少_月嫂免费政府培训中心推荐 | 证券新闻,热播美式保罗1984第二部_腾讯1080p-仁爱影院 | 全国国际学校排名_国际学校招生入学及学费-学校大全网 | 化妆品加工厂-化妆品加工-化妆品代加工-面膜加工-广东欧泉生化科技有限公司 | 液压升降平台_剪叉式液压/导轨式升降机_传菜机定做「宁波日腾升降机厂家」 | 头条搜索极速版下载安装免费新版,头条搜索极速版邀请码怎么填写? - 欧远全 | 快速卷帘门_硬质快速卷帘门-西朗门业| 云南外加剂,云南速凝剂,云南外加剂代加工-普洱澜湄新材料科技有限公司 | 传爱自考网_传爱自学考试网 | 学考网学历中心| 美甲贴片-指甲贴片-穿戴美甲-假指甲厂家--薇丝黛拉 | 渣油泵,KCB齿轮泵,不锈钢齿轮泵,重油泵,煤焦油泵,泊头市泰邦泵阀制造有限公司 | 中矗模型-深圳中矗模型设计有限公司| 外贮压-柜式-悬挂式-七氟丙烷-灭火器-灭火系统-药剂-价格-厂家-IG541-混合气体-贮压-非贮压-超细干粉-自动-灭火装置-气体灭火设备-探火管灭火厂家-东莞汇建消防科技有限公司 | 实验室pH计|电导率仪|溶解氧测定仪|离子浓度计|多参数水质分析仪|pH电极-上海般特仪器有限公司 | 安平县鑫川金属丝网制品有限公司,声屏障,高速声屏障,百叶孔声屏障,大弧形声屏障,凹凸穿孔声屏障,铁路声屏障,顶部弧形声屏障,玻璃钢吸音板 | 米顿罗计量泵(科普)——韬铭机械 | 杭州代理记账费用-公司注销需要多久-公司变更监事_杭州福道财务管理咨询有限公司 |