TMT观察网_独特视角观察TMT行业

聲音鑒黃師飽受摧殘,AI聲音鑒黃師為何沒幫上忙?互聯(lián)網(wǎng)+

智能相對論 2018-09-26 13:15
分享到:
導(dǎo)讀

聲音鑒黃之殤,AI難以克服雞尾酒效應(yīng)

文|雷宇|智能相對論(aixdlun)


人民對性的態(tài)度向來很奇怪,父母和長輩期待子女能無師自通,教育者三緘其口,最后少男少女通過其他渠道實現(xiàn)了對性的初級摸索,當(dāng)然這個摸索過程就很曲折了,文字,圖片,視頻和音頻遍地開花,“學(xué)習(xí)資料”越來越方便傳播。


食也性也,但傳播色情內(nèi)容卻有極大的負(fù)外部效應(yīng),懵懂少男少女極易受其蠱惑,鑒黃師的重要性可想而知。在蘋果商店的社交App中,有超過1/10的應(yīng)用主打聲音社交功能,由此催生出了一個新興職業(yè)——聲音鑒黃師。聲音鑒黃師是一個讓身心飽受摧殘的職業(yè),一位女性聲音鑒黃師稱,“一個人平均一天需要鑒定4000條信息,24小時輪班監(jiān)控,各種葷段子、曖昧語音,有時(聽到)惡心想吐。”


圖片1.png

聲音鑒黃師是一份不足以為外人道也的工作


由于這份工作實在是太過于枯燥,很多男生都受不了,因此聲音鑒黃師多為女性且離職率高。一般枯燥且重復(fù)率高的工作都是AI的拿手好戲,那么AI有沒有辦法實現(xiàn)聲音鑒黃呢?


聲音鑒黃之殤,AI難以克服雞尾酒效應(yīng)


視頻,圖片和語音是色情內(nèi)容常見的三種形式,多數(shù)公司的鑒黃都是立足于視頻和圖片,比如阿里的阿里綠網(wǎng)、騰訊的萬象優(yōu)圖等等。有人可能會疑問,這幾年科大訊飛、百度、騰訊等公司先后對外公布語音識別準(zhǔn)確率均達(dá)到“97%”,那為什么在AI語音鑒黃上那么難?


這是因為社交平臺的語音環(huán)境十分復(fù)雜,機器很難從龐大雜亂的語音中揪出涉黃涉暴人員,而這就不得不提雞尾酒效應(yīng)了。所謂雞尾酒效應(yīng)是指,在雞尾酒會嘈雜的人群中,盡管周圍噪聲很大,兩人可以順利交談,你們似乎聽不到談話內(nèi)容以外的各種噪音。這是因為我們的大腦對聲音都進(jìn)行了某種程度的預(yù)判,然后才決定聽或不聽。


用特瑞斯曼的注意衰減理論來解釋就是,當(dāng)人的聽覺注意集中于某一事物時,意識將一些無關(guān)聲音刺激排除在外,而無意識卻監(jiān)察外界的刺激,一旦一些特殊的刺激與己有關(guān),就能立即引起注意的現(xiàn)象。


但是機器卻不具備這樣意識和無意識,因此難以實現(xiàn)在嘈雜環(huán)境下的語音識別,這樣看來AI語音鑒黃貌似已經(jīng)走進(jìn)了死胡同。


實際上,已有公司在解決雞尾酒效應(yīng)上做出了努力。今年4 月,Google曾在博客上發(fā)文稱,谷歌研究人員開發(fā)出了一種深度學(xué)習(xí)系統(tǒng),可識別和分離出嘈雜環(huán)境中的個體聲音。


圖片2.png

圖片來自網(wǎng)易科技


研究人員從YouTube上10萬段“講座和談話”視頻中提取了近2000小時的視頻片段,然后混合音頻與人工背景噪聲,創(chuàng)造“雞尾酒派對”。訓(xùn)練技術(shù)人員將混合音頻進(jìn)行拆分,谷歌的系統(tǒng)能夠分辨出哪個音頻源在給定的時間內(nèi)屬于哪張人臉,并為每個揚聲器創(chuàng)建單獨的語音軌跡。


但Google的技術(shù)集中在視頻處理上,主要是對數(shù)段聲音的分離,而人工聲音鑒黃僅僅依靠聲音,有所不同。前不久,阿里AI語音反垃圾服務(wù)上線公測,它可以通過聲紋識別技術(shù),識別語音中存在的涉黃、廣告等違規(guī)信息,不管是中日英俄等語言,還是東北,四川,廣東的方言,甚至連無意義的呻吟聲都可以輕松判別。


具體辦法是,對那些有語義的內(nèi)容,系統(tǒng)先將語音識別轉(zhuǎn)成文字,然后再將這些文字跟文本反垃圾模型或關(guān)鍵詞庫比對,判斷是否涉黃,對那些無語義的聲音,通過聲紋也能識別出來。但有一點值得注意的是,在語音識別的過程中,識別是哪種語言比內(nèi)容更難,機器翻譯也存在這樣的問題,因此還需要大量數(shù)據(jù)來進(jìn)行訓(xùn)練學(xué)習(xí)。


做好嘈雜環(huán)境的語音識別,難點是如何將雜音與人聲分離。但對于聲音鑒黃而言,一開始并不知道哪一個音源涉黃,很難說誰是噪音,這需要機器具有全局觀。而上面提到的技術(shù),聲音分離或者將語音識別轉(zhuǎn)成文字都只是基本,由于尚未在語音復(fù)雜的環(huán)境下試驗過,因此這個結(jié)果嘛……退一萬步講,社交黑話也并不是那么好破譯的。


社交黑話難解,語音識別障礙重重


時代要拋棄你,它只會讓你看不懂,而我們也不能指望人工智能聽懂。


就像你爹媽當(dāng)初看不懂你的那句簽名:”ァ亊實證明,鱤綪桱淂起fеηɡ雨,卻桱囨起平啖;伖綪桱淂起平啖,卻桱囨起fеηɡ雨。ヤ”(沒亂碼),新一代社交黑話崛起一般人也很難看懂,比如XSWL(笑死我了,相當(dāng)于一連串哈哈哈),NSS(暖說說,指幫點贊評論轉(zhuǎn)發(fā)說說,增進(jìn)感情),CQY(處Q友的縮寫,想在QQ上找朋友的意思)。


圖片3.png


當(dāng)然這也還算好的,無非就是縮寫。除了縮寫,還有一些只能強記的詞語。比如養(yǎng)火(互發(fā)消息三天出現(xiàn)小火花,互發(fā)消息超過三十天出現(xiàn)大火花,養(yǎng)火就是經(jīng)常聯(lián)系的意思),歐洲(想要什么就得到什么的人)……


估計研究人員在錄入數(shù)據(jù)時就陣亡了,畢竟這玩意看上去也不算有章可循。值得注意的是,當(dāng)人們在說話的時候,如果省略一兩個字不說,懂得的人自然也懂,但機器不一定能識別人們甚至為了混淆視聽,會多語夾雜,這就給機器識別增添了難度。


這種輸入標(biāo)準(zhǔn)的不統(tǒng)一,是導(dǎo)致語音識別錯誤率高的首要原因。我們常用的鼠標(biāo)和鍵盤雖然看似簡單,但它具備統(tǒng)一的輸入標(biāo)準(zhǔn)和精準(zhǔn)的視覺反饋這兩點,而這正是語音識別技術(shù)不具備的,也是困擾現(xiàn)階段AI鑒黃的一大挑戰(zhàn)。


毫不意外,現(xiàn)階段的聲音鑒黃師依然是以人為主。早在互聯(lián)網(wǎng)發(fā)展早期,黃色內(nèi)容主要是圖片和文字,靠人工就可以凈化網(wǎng)絡(luò)環(huán)境的目的,但是隨著互聯(lián)網(wǎng)帶來的數(shù)據(jù)爆炸,人工已經(jīng)遠(yuǎn)遠(yuǎn)不能勝任。


雖然聲音鑒黃以人為本,但這并不意味著AI鑒黃師沒有價值。它能在特定的場景實現(xiàn)鑒定也無疑算是一種進(jìn)步,而現(xiàn)階段它所呈現(xiàn)的問題,也無疑是技術(shù)發(fā)展過程中難以避免的陣痛。


全球經(jīng)濟(jì)學(xué)家和咨詢公司的主流研究課題,總少不了人工智能會引發(fā)的失業(yè)規(guī)模,但是中國的互聯(lián)網(wǎng)已經(jīng)跑出了一條獨特的路線,因此針對中國的研究少之又少。聲音鑒黃師作為互聯(lián)網(wǎng)發(fā)展過程中的獨特產(chǎn)物,顯然會存在相當(dāng)長一段時間,而現(xiàn)行的人工智能鑒黃也多為輔助人。


一句正確但無用的話是,可以想見未來AI鑒黃會占據(jù)主流,但這個未來應(yīng)該以哪個時間節(jié)點為基準(zhǔn),誰也無法預(yù)料。


智能相對論(微信id:aixdlun):深挖人工智能這口井,評出咸淡,講出黑白,道出vb深淺。重點關(guān)注領(lǐng)域:AI+醫(yī)療、機器人、智能駕駛、AI+硬件、物聯(lián)網(wǎng)、AI+金融、AI+安全、AR/VR、開發(fā)者以及背后的芯片、算法、人機交互等。


聲音 語音 識別 AI 內(nèi)容
分享到:

1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補充。


主站蜘蛛池模板: 德州网站开发定制-小程序开发制作-APP软件开发-「两山开发」 | 同学聚会纪念册制作_毕业相册制作-成都顺时针宣传画册设计公司 | 上海租奔驰_上海租商务车_上海租车网-矢昂汽车服务公司 | 河南橡胶接头厂家,河南波纹补偿器厂家,河南可曲挠橡胶软连接,河南套筒补偿器厂家-河南正大阀门 | 激光内雕_led玻璃_发光玻璃_内雕玻璃_导光玻璃-石家庄明晨三维科技有限公司 激光内雕-内雕玻璃-发光玻璃 | 苏商学院官网 - 江苏地区唯一一家企业家自办的前瞻型、实操型商学院 | 车间除尘设备,VOCs废气处理,工业涂装流水线,伸缩式喷漆房,自动喷砂房,沸石转轮浓缩吸附,机器人喷粉线-山东创杰智慧 | 火锅底料批发-串串香技术培训[川禾川调官网] | 物和码官网,物和码,免费一物一码数字化营销SaaS平台 | 铝箔袋,铝箔袋厂家,东莞铝箔袋,防静电铝箔袋,防静电屏蔽袋,防静电真空袋,真空袋-东莞铭晋让您的产品与众不同 | 进口便携式天平,外校_十万分之一分析天平,奥豪斯工业台秤,V2000防水秤-重庆珂偌德科技有限公司(www.crdkj.com) | 净化工程_无尘车间_无尘车间装修-广州科凌净化工程有限公司 | 赛尔特智能移动阳光房-阳光房厂家-赛尔特建筑科技(广东)有限公司 | 空气能暖气片,暖气片厂家,山东暖气片,临沂暖气片-临沂永超暖通设备有限公司 | 贵州科比特-防雷公司厂家提供贵州防雷工程,防雷检测,防雷接地,防雷设备价格,防雷产品报价服务-贵州防雷检测公司 | 越南专线物流_东莞国际物流_东南亚专线物流_行通物流 | 镀锌钢格栅_热镀锌格栅板_钢格栅板_热镀锌钢格板-安平县昊泽丝网制品有限公司 | 陕西鹏展科技有限公司| 烘箱-工业烘箱-工业电炉-实验室干燥箱 - 苏州华洁烘箱制造有限公司 | crm客户关系管理系统,销售管理系统,crm系统,在线crm,移动crm系统 - 爱客crm | 氨水-液氨-工业氨水-氨水生产厂家-辽宁顺程化工 | 移动机器人产业联盟官网 | 上海佳武自动化科技有限公司 | PAS糖原染色-CBA流式多因子-明胶酶谱MMP-上海研谨生物科技有限公司 | 数控车床-立式加工中心-多功能机床-小型车床-山东临沂金星机床有限公司 | 甲级防雷检测仪-乙级防雷检测仪厂家-上海胜绪电气有限公司 | 亚克力制品定制,上海嘉定有机玻璃加工制作生产厂家—官网 | 金联宇电缆|广东金联宇电缆厂家_广东金联宇电缆实业有限公司 | 洛阳防爆合格证办理-洛阳防爆认证机构-洛阳申请国家防爆合格证-洛阳本安防爆认证代办-洛阳沪南抚防爆电气技术服务有限公司 | 诺冠气动元件,诺冠电磁阀,海隆防爆阀,norgren气缸-山东锦隆自动化科技有限公司 | 低浓度恒温恒湿称量系统,强光光照培养箱-上海三腾仪器有限公司 | Magnescale探规,Magnescale磁栅尺,Magnescale传感器,Magnescale测厚仪,Mitutoyo光栅尺,笔式位移传感器-苏州连达精密量仪有限公司 | 清水混凝土修复_混凝土色差修复剂_混凝土色差调整剂_清水混凝土色差修复_河南天工 | 航空障碍灯_高中低光强航空障碍灯_民航许可认证航空警示灯厂家-东莞市天翔航天科技有限公司 | 韦伯电梯有限公司 | 螺旋叶片_螺旋叶片成型机_绞龙叶片_莱州源泽机械制造有限公司 | 进口便携式天平,外校_十万分之一分析天平,奥豪斯工业台秤,V2000防水秤-重庆珂偌德科技有限公司(www.crdkj.com) | 鄂泉泵业官网|(杭州、上海、全国畅销)大流量防汛排涝泵-LW立式排污泵 | 高清视频编码器,4K音视频编解码器,直播编码器,流媒体服务器,深圳海威视讯技术有限公司 | 卡诺亚轻高定官网_卧室系统_整家定制_定制家居_高端定制_全屋定制加盟_定制家具加盟_定制衣柜加盟 | 缠绕机|缠绕膜包装机|缠绕包装机-上海晏陵智能设备有限公司 |