TMT观察网_独特视角观察TMT行业

百度大腦出了個(gè)AI虛擬主持人 我扒了扒這位新青年的“前世今互聯(lián)網(wǎng)+

吳俊宇 2019-05-05 17:33
分享到:
導(dǎo)讀

我在百度大腦AI開放平臺找到了百度大腦AI開放平臺語音合成技術(shù)的體驗(yàn)區(qū),百度大腦這個(gè)AI主持人,央視和百度再攜手五四晚會百度大腦AI虛擬主持人。

文|吳俊宇

昨天是五四青年節(jié),提及青年節(jié),就不得不說“德先生”和“賽先生”。

100年前的五四運(yùn)動中,響徹著“只有德先生、賽先生可以救中國”的口號。

“德先生”,即“Democracy”,德莫克拉西(音譯)——意指先進(jìn)的思想。

“賽先生”,即“Science”,賽因斯(音譯)——意為,“科學(xué)”,所謂“科學(xué)”是指近代自然科學(xué)法則和科學(xué)精神。

今年央視五四晚會的主持人包括“賽先生”——春晚紅包之后,央視和百度再攜手五四晚會百度大腦AI虛擬主持人“小靈”。

這個(gè)虛擬主持人和主持人王俊凱、尼格買提同臺競技,絲毫不落下風(fēng)。

“小靈”背后的技術(shù)提供就是百度大腦,其中糅合了百度視覺、語音、大數(shù)據(jù)以及AR能力,打通了大小屏,讓每個(gè)電視機(jī)前的觀眾不僅可以看到晚會中的虛擬主持人,還能直接與它進(jìn)行互動體驗(yàn)。

當(dāng)年五四運(yùn)動的“總司令”陳獨(dú)秀如果見到“小靈”,恐怕也會驚嘆今天中國技術(shù)之強(qiáng)大。

技術(shù)秀在哪兒

在五四晚會中,主持人“小靈”邀請旁邊的真人主持人用人臉識別測測自己是祖國的什么花。女主持人和“小靈”的互動非常自然流暢。

很多觀眾有個(gè)非常強(qiáng)烈的感受——這個(gè)AI主持人似乎遠(yuǎn)比市面上其他AI主持人更細(xì)膩。

其他AI主持人似乎都是機(jī)器人腔,而且發(fā)聲時(shí)嘴巴只是一張一合,明顯對不上號。百度大腦這個(gè)AI主持人,怎么看怎么覺得舒服。

要做到“舒服”可不容易,這需要語音、表情、唇動這些技術(shù)都擬合在一起。

1、語音音色要自然

一般AI語音背后都有個(gè)語音庫。我在谷歌AI博客上找了下AI語音合成的技術(shù)模型圖。

大概翻譯一些這個(gè)圖的意思:AI語音庫制作的步驟大概是三步。

第一步是將文本變成音頻,先確定音色、風(fēng)格、使用領(lǐng)域、產(chǎn)品特性、角色要求。

第二步找到配音員試音,根據(jù)需求設(shè)計(jì)試音文本,收集錄音。

第三步是確投入音庫生產(chǎn)線,錄音腳本設(shè)計(jì)、錄音資源訓(xùn)練、效果優(yōu)化、豐富音色。

百度大腦為此準(zhǔn)備了幾十個(gè)音庫,找播音主持專業(yè)的學(xué)生專業(yè)錄制了各式各樣的聲音,具備非常豐富的音色矩陣。

每個(gè)音庫只要用戶喜歡,都可以做成一個(gè)虛擬主播、虛擬人物的形象。這背后的技術(shù)其實(shí)基于業(yè)界領(lǐng)先的深度神經(jīng)網(wǎng)絡(luò)技術(shù),提供高度擬人、流暢自然的語音合成服務(wù),可以讓應(yīng)用、設(shè)備開口說話,更具個(gè)性。

我在百度大腦AI開放平臺找到了百度大腦AI開放平臺語音合成技術(shù)的體驗(yàn)區(qū)。以度逍遙這個(gè)情感男聲為例測試了一句話:今年是五四運(yùn)動一百周年。

這個(gè)男聲有著非常明顯的特點(diǎn),非常舒服渾厚的京腔,不知道的人還以為是一個(gè)播音主持人在和自己說話。

可以說,百度機(jī)器學(xué)習(xí)模型的研究上取得了突破性成果,其生成的仿人類語音更加逼真自然,將仿人類語音與真實(shí)人類聲音之間的差異大大減小了。

2、表情唇動要豐富

人的表情,其實(shí)是由面部肌肉以及唇動共同組成的,不同人有不同肌肉動作。

以下面這張圖為例,人可能有千百種表情,不同人在表達(dá)喜悅、恐懼、得意、焦慮的時(shí)候,表情都不一樣。

真的把表情交到人類面前時(shí),我們都不一定可以把不同表情做準(zhǔn)確歸類。

但是機(jī)器可以做到啊。基于大量的面部特征的數(shù)據(jù)學(xué)習(xí)去做提取,機(jī)器可以把面部肌肉、唇部動作最細(xì)膩的表現(xiàn)都展開學(xué)習(xí)、歸納,然后從中總結(jié),學(xué)習(xí)人類的表情特征。

在需要輸出的時(shí)候,再用深度學(xué)習(xí)做表情驅(qū)動,使得表情更加豐富,甚至連發(fā)色、年齡都可以自動生成。

百度大腦的技術(shù)邏輯和這個(gè)其實(shí)也基本大同小異。

百度大腦AI開放平臺上提到,百度大腦在檢測出人臉后,可對人臉進(jìn)行分析,獲得眼、口、鼻輪廓等150個(gè)關(guān)鍵點(diǎn)定位,準(zhǔn)確識別多種人臉屬性,如性別,年齡,表情等信息。這個(gè)技術(shù)還可適應(yīng)大角度側(cè)臉,遮擋,模糊,表情變化等各種實(shí)際環(huán)境。

百度大腦把聲音、表情、嘴唇的這些素材經(jīng)過了數(shù)據(jù)采集、特征分析、模型訓(xùn)練,用深度學(xué)習(xí)的一些核心算法和思想做了唇動技術(shù),讓唇動、表情和語音更好的用不同的特征表示聯(lián)系在一起。

過去其他的AI主持人只是有一個(gè)語音庫,表情和唇動非常初級,百度等于是把三項(xiàng)技術(shù)全部都擬合在一起了,而且再通過AR技術(shù)輸出出來,比別的廠商想得更多、更細(xì)。

產(chǎn)品用在哪兒

你以為百度大腦的AI主持人只能用于這種晚會主持?

當(dāng)然不止于此。它背后涉及的技術(shù)包括面部識別、語音合成、AR輸出等等。這些AI技術(shù)可以組合成不同的產(chǎn)品,開放給其他客戶使用,幫助行業(yè)客戶改善服務(wù)、提升效率。

事實(shí)上,依托于百度大腦的百度AR Lab(百度增強(qiáng)現(xiàn)實(shí)實(shí)驗(yàn)室),就在提供AR技術(shù)、產(chǎn)品、服務(wù)一站式智能交互解決方案,業(yè)務(wù)已廣泛覆蓋營銷、娛樂、教育、文化等各個(gè)領(lǐng)域。

1、教育和閱讀類產(chǎn)品:讓課程和講解變得更生動

通過閱讀類APP閱讀小說或新聞時(shí),如果使用語音合成技術(shù)為用戶提供多種發(fā)音人的朗讀功能,釋放雙手和雙眼,獲得更極致的閱讀體驗(yàn)。

實(shí)際上,熊貓看書、快聽小說已經(jīng)在使用百度大腦這項(xiàng)技術(shù)。用戶可以直接用語音播放電子書中的內(nèi)容。

教育類的客戶同樣可以引入這樣的AI主持人,在一些兒童故事機(jī)、智能機(jī)器人這類教育類設(shè)備或課程之中定制屬于自家產(chǎn)品的形象、聲音,讓課程變得更親切。

深圳一家名為AiMouse的智能鼠標(biāo)廠商以及Kido兒童手表品牌都使用了百度這項(xiàng)技術(shù)。Kido通過運(yùn)用百度語音識別和語音合成技術(shù),優(yōu)化了機(jī)器人的語音交互體驗(yàn),讓兒童手表實(shí)現(xiàn)語音交互。這款手表的日活躍量也達(dá)到了百萬級別。

2、生活和服務(wù)類產(chǎn)品:讓服務(wù)交互效率得以提升

語音合成還可應(yīng)用于打車軟件、餐飲叫號、排隊(duì)軟件等場景,通過語音合成進(jìn)行訂單播報(bào),讓用戶便捷獲得通知信息。面部識別則是可以展開顧客識別、訂單校對。

不管是語音合成還是面部識別,都天然適合服務(wù)業(yè)場景。一些酒店、飯店等服務(wù)業(yè)可以定制一些屬于自己的機(jī)器人,幫助顧客做客服。在訂單校驗(yàn)的過程中則是可以用顧客的面部特征為基礎(chǔ)展開服務(wù)。

嘀嗒出行出租車業(yè)務(wù)的“聽單”以及順風(fēng)車業(yè)務(wù)的“聽單功能+派單服務(wù)”中都用到了百度的語音合成技術(shù)。

從2017年10月開始接入百度語音合成SDK。隨著嘀嗒業(yè)務(wù)的增長,調(diào)用量每日都在攀升,日調(diào)用超過千萬次以上,而錯(cuò)誤率幾乎為零。百度語音合成技術(shù)保證了核心派單功能的穩(wěn)定服務(wù)。

3、影視文娛產(chǎn)業(yè):節(jié)省動漫動畫行業(yè)的人力

影視、動漫行業(yè)未來效率也能因百度大腦這套AI技術(shù)得到很大提升。

過去動漫、影視劇行業(yè)為了給動畫人物唇形、表情,必須手動一點(diǎn)點(diǎn)調(diào)整,而且很看動畫師主觀的思考。

百度這一套技術(shù)輸出給動漫行業(yè)的話,直接機(jī)器生成就OK,動畫師后期修改也很方便。程序驅(qū)動以后,動畫人物語言的唇動連續(xù)性也是完全一樣的。不會出現(xiàn)在說同一個(gè)詞匯時(shí)出現(xiàn)不同唇動的現(xiàn)象。

影視劇、動漫產(chǎn)業(yè)的動畫師未來可以把更多精力放在更多有價(jià)值的工作上,這樣不僅可以節(jié)省人工成本,還縮短了工作時(shí)間。

當(dāng)然,文中列舉的這些案例完全不能概括面部識別、語音合成、AR這些技術(shù)融合帶來的應(yīng)用場景。

我列舉這些案例的意思是,你只有非常努力,才能看起來毫不費(fèi)勁。

百度領(lǐng)軍“賽先生”

央視五四晚會上這個(gè)AI主持人表面上看起來只是在主持一檔晚會。實(shí)際上它所需要用到的AI技術(shù)底蘊(yùn)深厚,放到各行各業(yè)可以有更大的實(shí)際效益。

這也正如美國軟件技術(shù)專家艾德·伯內(nèi)特說過的一句話:

現(xiàn)在天上有三十一顆衛(wèi)星在地球上空環(huán)繞,不為別的,就為了告訴你便利店怎么走。

如果你只看到了手機(jī)地圖上的便利店要怎么走,你顯然低估了很多事情。

因?yàn)樘焐夏侨活w衛(wèi)星不僅僅在服務(wù)你,更在服務(wù)各行各業(yè)——那才是你沒看到的東西。

英國學(xué)者李約瑟(Joseph Needham)在編著的《中國科學(xué)技術(shù)史》中提出此問題:

盡管中國古代對人類科技發(fā)展做出重要貢獻(xiàn),但為什么科學(xué)和工業(yè)革命沒有在近代中國發(fā)生?

作為享譽(yù)世界的文明古國,在技術(shù)上有過那么多自豪成就。明明自己發(fā)明了火藥,卻被八國聯(lián)軍炸掉了封建牌坊;明明發(fā)明了指南針,卻被英國的戰(zhàn)列艦找上門來。

100年前的五四運(yùn)動就是探尋這個(gè)答案的過程。五四青年們因?yàn)閲曳e貧積弱,走上呼喚“德先生”和“賽先生”的道路。

可以說,德先生和賽先生,是推動中國社會前進(jìn)的兩個(gè)車輪。

在今天,全世界范圍內(nèi)同樣在展開一場圍繞著“賽先生”的競爭——未來20年,是AI的時(shí)代,AI就是當(dāng)代“賽先生”。

百度為代表中國企業(yè)在AI領(lǐng)域已經(jīng)不遑多讓,多年以前呼吁的“賽先生”已經(jīng)不是短板。“賽先生”甚至正在成為今天中國走到世界技術(shù)之巔的重要基石。

以AI為代表的“賽先生”讓萬事萬物都處于精確計(jì)算之中,正如當(dāng)代哲學(xué)家西閃《國家的計(jì)算》所說的:

在現(xiàn)實(shí)世界的“賭局”中,帕斯卡的上帝已經(jīng)隱退,取而代之的,是作為信仰的“未來”。它像一個(gè)永恒的獎(jiǎng)杯,在時(shí)間的盡頭閃閃發(fā)光。計(jì)算則取代了程式化的行為訓(xùn)練,演變成為一種新的思維習(xí)慣。“理性的計(jì)算”已經(jīng)成了是近現(xiàn)代的過程最主要的特征。

五四運(yùn)動的倡導(dǎo)者陳獨(dú)秀如果看到中國科技企業(yè)把“賽先生”搞得這么強(qiáng),怕是也要說一句,“你真秀!”


百度
分享到:

1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。


主站蜘蛛池模板: 软文发布-新闻发布推广平台-代写文章-网络广告营销-自助发稿公司媒介星 | 科昊仪器超纯水机系统-可成气相液氮罐-美菱超低温冰箱-西安昊兴生物科技有限公司 | 超声骨密度仪-动脉硬化检测仪器-人体成分分析仪厂家/品牌/价格_南京科力悦 | 生物制药洁净车间-GMP车间净化工程-食品净化厂房-杭州波涛净化设备工程有限公司 | 锥形螺带干燥机(新型耙式干燥机)百科-常州丰能干燥工程 | 无压烧结银_有压烧结银_导电银胶_导电油墨_导电胶-善仁(浙江)新材料 | 菏泽知彼网络科技有限公司 | 校园气象站_超声波气象站_农业气象站_雨量监测站_风途科技 | 耐高温风管_耐高温软管_食品级软管_吸尘管_钢丝软管_卫生级软管_塑料波纹管-东莞市鑫翔宇软管有限公司 | 机制砂选粉机_砂石选粉机厂家-盐城市助成粉磨科技有限公司 | 儿童语言障碍训练-武汉优佳加感统文化发展有限公司 | 岸电电源-60HZ变频电源-大功率变频电源-济南诚雅电子科技有限公司 | 广州企亚 - 数码直喷、白墨印花、源头厂家、透气无手感方案服务商! | 依维柯自动挡房车,自行式国产改装房车,小型房车价格,中国十大房车品牌_南京拓锐斯特房车 - 南京拓锐斯特房车 | 江西自考网| 展厅设计-展馆设计-专业企业展厅展馆设计公司-昆明华文创意 | 净气型药品柜-试剂柜-无管道净气型通风柜-苏州毕恩思 | 公交驾校-北京公交驾校欢迎您! 工作心得_读书心得_学习心得_找心得体会范文就上学道文库 | 空气净化器租赁,空气净化器出租,全国直租_奥司汀净化器租赁 | 破碎机_上海破碎机_破碎机设备_破碎机厂家-上海山卓重工机械有限公司 | 安全,主动,被动,柔性,山体滑坡,sns,钢丝绳,边坡,防护网,护栏网,围栏,栏杆,栅栏,厂家 - 护栏网防护网生产厂家 | 应急灯_消防应急灯_应急照明灯_应急灯厂家-大成智慧官网 | 仓储笼_金属箱租赁_循环包装_铁网箱_蝴蝶笼租赁_酷龙仓储笼租赁 测试治具|过炉治具|过锡炉治具|工装夹具|测试夹具|允睿自动化设备 | 北京网站建设|北京网站开发|北京网站设计|高端做网站公司 | HYDAC过滤器,HYDAC滤芯,现货ATOS油泵,ATOS比例阀-东莞市广联自动化科技有限公司 | 衬塑管道_衬四氟管道厂家-淄博恒固化工设备有限公司 | 压缩空气检测_气体_水质找上海京工-服务专业、价格合理 | 米顿罗计量泵(科普)——韬铭机械 | 阿里巴巴诚信通温州、台州、宁波、嘉兴授权渠道商-浙江联欣科技提供阿里会员办理 | 北京模型公司-工业模型-地产模型-施工模型-北京渝峰时代沙盘模型制作公司 | 武汉高低温试验箱_恒温恒湿试验箱厂家-武汉蓝锐环境科技有限公司 | IP检测-检测您的IP质量| 杭州ROHS检测仪-XRF测试仪价格-百科| 地磅-电子地磅维修-电子吊秤-汽车衡-无人值守系统-公路治超-鹰牌衡器 | 代办建筑资质升级-建筑资质延期就找上海国信启航 | 北京亦庄厂房出租_经开区产业园招商信息平台 | 脑钠肽-白介素4|白介素8试剂盒-研域(上海)化学试剂有限公司 | 东莞精密模具加工,精密连接器模具零件,自動機零件,冶工具加工-益久精密 | 儿童乐园|游乐场|淘气堡招商加盟|室内儿童游乐园配套设备|生产厂家|开心哈乐儿童乐园 | ERP企业管理系统永久免费版_在线ERP系统_OA办公_云版软件官网 | HDPE土工膜,复合土工膜,防渗膜价格,土工膜厂家-山东新路通工程材料有限公司 |