智能音箱大戰(zhàn):中國會(huì)否誕生亞馬遜Echo?通信
智能音箱匯集了亞馬遜、谷歌、蘋果、微軟、三星等國際巨頭,阿里、京東、小米、聯(lián)想等國內(nèi)企業(yè)也紛紛入局。
7月5日,阿里推出了自己的首款消費(fèi)級AI產(chǎn)品天貓精靈X1,同日百度也宣布了DuerOS開放平臺,可以支持基于語音和圖像識別的智能產(chǎn)品開發(fā)。
細(xì)數(shù)當(dāng)前的智能音箱領(lǐng)域的玩家,既匯集了亞馬遜、谷歌、蘋果、微軟、三星等國際巨頭,阿里、京東、小米、聯(lián)想等國內(nèi)企業(yè)也紛紛入局。
Strategy Analytics今年6月下旬發(fā)布的研究報(bào)告顯示,全球基于Wi-Fi的無線音箱出貨量在2016年增長62%達(dá)到1400萬臺,其中,亞馬遜在增量中占有77%的份額。
一位不愿具名的行業(yè)人士向21世紀(jì)經(jīng)濟(jì)報(bào)道記者分析認(rèn)為,亞馬遜Echo以語音為入口接入家庭智能,整個(gè)處理在云端進(jìn)行,背后是軟件、硬件以及開發(fā)者的完整生態(tài)。由于一些國外的云服務(wù)和內(nèi)容在國內(nèi)不能使用,未來中國肯定會(huì)有像亞馬遜一樣做平臺生態(tài)的公司出現(xiàn),開放硬件接口給廠商,這也給本土企業(yè)帶來新機(jī)遇。
語音交互落地
“從90年代末IBM推出了第一款商品化的語音識別系統(tǒng)ViaVoice,到比爾?蓋茨倡導(dǎo)下一代語音交互界面,做了十幾年還沒有成功案例。Echo真正教育了用戶和市場,給行業(yè)樹立很好的標(biāo)桿。”在7月7日-7月9日舉辦的CCF-GAIR全球人工智能與機(jī)器人峰會(huì)上,元趣信息技術(shù)CEO吳義堅(jiān)說。
亞馬遜于2014年發(fā)布的智能音箱Echo能夠依靠語音助手Alexa實(shí)現(xiàn)音樂播放、新聞搜索、網(wǎng)購下單、Uber叫車、外賣預(yù)定等服務(wù),被認(rèn)為打開了物聯(lián)網(wǎng)的一個(gè)重要入口,以此成為行業(yè)標(biāo)桿。據(jù)不完全統(tǒng)計(jì),截至目前,Echo在全球已經(jīng)賣出超過一千萬臺。
“Echo的成功,讓更多人相信未來物聯(lián)網(wǎng)的入口應(yīng)該是智能語音識別器,這是Synaptics把語音納入人機(jī)界面的一個(gè)重要原因。”人機(jī)界面交互解決方案設(shè)計(jì)制造公司Synaptics于6月宣布收購了語音音頻處理方案商Conexant(科勝訊系統(tǒng)),其副總裁兼中國區(qū)總經(jīng)理盧兵此前向21世紀(jì)經(jīng)濟(jì)報(bào)道記者介紹,“我們一致認(rèn)為,語音已經(jīng)到了一個(gè)時(shí)間點(diǎn),會(huì)成為下一代人機(jī)界面的主要功能。”
目前來看,近場語音的識別率已經(jīng)達(dá)到了相當(dāng)高的程度,科大訊飛、搜狗等語音輸入可以達(dá)到95%以上的準(zhǔn)確率,但實(shí)際的使用場景中還有很多障礙需要跨越。“從遠(yuǎn)距離、噪音環(huán)境的處理,口音、方言的支持,智能化場景對聯(lián)動(dòng)、控制、兼容性的要求等方面存在各種各樣的問題。我們覺得大規(guī)模商用過程中,目前我們的技術(shù)和產(chǎn)品還沒有那么成熟。”門羅機(jī)器人創(chuàng)始人楊興義認(rèn)為,語音語義在用戶體驗(yàn)的角度還處在比較早期的階段。
超多維創(chuàng)始人兼董事長戈張日前向21世紀(jì)經(jīng)濟(jì)報(bào)道記者分析認(rèn)為,未來的產(chǎn)品發(fā)展在外觀、硬件、服務(wù)、設(shè)計(jì)上會(huì)越來越綜合化,產(chǎn)品并不只是一款硬件,還包含軟件平臺、算法、內(nèi)容等,是個(gè)系統(tǒng)工程。Echo的優(yōu)勢一方面在于它的控制能力,另一方面是它的服務(wù)能力。要做成一款成功的智能語音產(chǎn)品,并商業(yè)落地,不是一件容易的事。
中國會(huì)否出現(xiàn)Echo?
從早期的京東叮咚音箱到近期的喜馬拉雅小雅AI音箱、阿里天貓精靈,中國市場已經(jīng)有著眾多搭載智能語音技術(shù)的硬件產(chǎn)品,但遺憾的是,并沒有一款像亞馬遜Echo這樣深入大眾后流行起來。
從事語義理解的驀然認(rèn)知CEO戴帥湘表示并不看好音箱品類。“要成為一個(gè)爆款,需要有存量市場,產(chǎn)品有延續(xù)性。推一個(gè)新品類需要強(qiáng)大的說服用戶的能力,這是有難度的。”
他解釋稱,中美客廳文化存在差異,音箱在國內(nèi)家庭并沒有足夠的使用習(xí)慣,市場沒那么大。但他也認(rèn)為入局者眾至少可以教育民眾,對整個(gè)交互產(chǎn)業(yè)鏈都是好事。驀然認(rèn)知目前主要打造的交互場景是家居和車載,這被戴帥湘認(rèn)為“前景廣闊”。
在吳義堅(jiān)看來,中國已經(jīng)具備誕生Echo的土壤,其中阿里是有可能做成Echo生態(tài)的――在人工智能語音上,阿里最近幾年從全球范圍內(nèi)籠絡(luò)到很多資深人才加入,有很強(qiáng)的技術(shù)積累;它也有大量音樂、內(nèi)容、電商等方面的服務(wù),具備商業(yè)化的條件。
據(jù)悉,一個(gè)語音產(chǎn)品方案由三部分組成,硬件前端包括麥克風(fēng)陣列、降噪算法、芯片、硬件平臺等,云端包括語音識別和語義理解、語音數(shù)據(jù),內(nèi)容合作有音樂、天氣、短信、通話等應(yīng)用工具。如果未來消費(fèi)電子都支持語音交互,這也將帶來從元器件到內(nèi)容服務(wù)全產(chǎn)業(yè)鏈的重構(gòu)。
從國內(nèi)的產(chǎn)業(yè)鏈上看,聲智科技CEO陳孝良指出,首先麥克風(fēng)要在性能、低功耗上做很大的改進(jìn),“整個(gè)全球市場上中國的麥克風(fēng)產(chǎn)業(yè)占的比重很小,核心技術(shù)不在國內(nèi)。而且我們現(xiàn)在做的麥克風(fēng)是標(biāo)量麥克風(fēng),只能取一個(gè)物理量,下一步要解決很復(fù)雜的聲學(xué)問題,需要矢量麥克風(fēng)。我們國內(nèi)相對會(huì)落后一點(diǎn)。”此外,芯片、算法上的原創(chuàng)性技術(shù),以及商業(yè)化方面也都面臨挑戰(zhàn)。“國內(nèi)的內(nèi)容和服務(wù)相對比較割裂,但亞馬遜就把很多優(yōu)勢集中在一起。”
他同時(shí)指出,遠(yuǎn)場語音交互開始是智能音響,但是將來絕對不僅僅是智能音響,技術(shù)還會(huì)擴(kuò)展到很多其他的產(chǎn)品。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。