語音輸入法成大勢所趨,百度、訊飛或將靠技術逆襲通信

即手機輸入法技術與人工智能語音技術的深度結合,用戶也終于可以親身體驗到智能語音技術,百度語音輸入法可以根據用戶說話時的語氣輕重、內容等識別出用戶情緒。
烏鎮互聯網大會剛剛落幕,李彥宏的“移動互聯網已死”,人工智能將成為下一幕,成為了熱門話題。而巧的是,百度于22日啟動了語音開放平臺三周年發布會,而科大訊飛也于23日舉辦了語音發布會,推出多款人工智能產品。
從中不難看出,發展人工智能卡位未來,確實已經成為當前業界的公式,而語音技術更是首當其沖。
發展語音技術已成共識
科大訊飛與百度你追我趕的態勢,其實預示出了語音輸入的大趨勢,即手機輸入法技術與人工智能語音技術的深度結合。
在22日百度語音開放平臺三周年慶典上,其正式向公眾介紹了與百度語音技術聯姻的百度手機輸入法V7.2版本。該智能語音輸入版本不僅具有語言轉文字功能、語音調取聯系人信息功能,更能結合人工智能自動匹配表情,此外還新增快捷搜索功能。
科大訊飛這邊,在今年10月18日錘子2016新品發布會上,老羅的一番狂夸加上實戰操作,訊飛語音輸入法的超高準確率讓錘粉們一片驚嘆。實際上早在錘子發布會之前,各大手機廠商就已經極為重視輸入法技術,并且也已達到了相當高的水平,蘋果、三星、華為等手機廠商系統自帶輸入法都能實現將語音轉成文字。
總的來說,發展語音技術已經成為業內共識。
語音輸入價值凸顯,百度科大訊飛技術見長
人工智能時代的到來,硬件設備可以實現計算智能、感知智能,語音技術有了更多用武之地,語音也迅速成為人機交互的新入口,語音輸入的價值開始凸顯,風口之下,眾多技術公司紛紛發力語音技術。
其中,百度作為全球范圍內領先的人工智能技術公司,在語音技術方面也頗具實力,此前百度的深度語音技術Deep speech 2被《麻省理工評論》評選為與納米技術、航天技術、生物技術并列的十大突破性技術之一,而百度也是唯一一家入選的公司,而隨著此次百度手機輸入法V7.2上線,用戶也終于可以親身體驗到智能語音技術,不得不讓人充滿期待。
科大訊飛這邊也不甘示弱,其在2013年推出BN-ivec技術,2016年將注意力模型神經網絡應用于認知智能,用卷積神經網絡“看”語音,正確率大幅提高。在空間上描述語言概念,計算詞語、句子在各個層面上的連接和計算距離,從而進行深層分析,同樣有著極為強悍的技術能力。
用戶體驗是關鍵,百度、科大訊飛從不同角度切入
作為兩家語音巨頭,兩家公司在產品的迭代上保持著高強度的節奏,而這一切正是為了提升語音輸入體驗, 因為這也是用戶選擇的關鍵,二者都在各自發力。
百度輸入法V7.2版本有著如下特色功能
1)識別意圖,百度語音輸入法可以根據用戶語義語境,根據海量大數據,為用戶匹配出無法識別的相關詞匯、句子等等,從識別“語音”到識別“語言”。
2)識別情緒,創造人性化體驗,百度語音輸入法可以根據用戶說話時的語氣輕重、內容等識別出用戶情緒,自動為用戶匹配符合情緒的趣味表情,很好地彌補了因語音輸入文字時對語意表達的缺失,更好地還原了語音中所表達的情感。
3)識別搜索意圖,完成人工智能助理功能,用戶可以在聊天場景中向百度語音說“給我一張憤怒的圖片”、“給我一首傷感的音樂”、“告訴我劉德華是誰”,百度輸入法就會為用戶提供對應的圖片、音樂、網頁等等,極為高效的解決了用戶在實際使用中的需求。
科大訊飛在語音輸入之外走了另外一條路
1)語音識別精準修改,在23號的發布會上,科大訊飛演示了萬物互聯輸入法,在語音輸入轉化為文字后,可以直接使用語音實現文本的修改和調整,對于修改內容再次輸入時已具備糾錯和自我學習能力。
2)支持多種方言識別輸入,訊飛語音輸入法加入客家語、四川話、河南話、東北話等19種方言識別,對于用戶降低了使用門檻。
3)語音合成體驗,在現場,科大訊飛還演示了語音合成技術,將一段話通過虛擬合成羅永浩的聲音進行朗讀,十分有趣,而科大訊飛還可以合成跟其他明星、名人的產品。而關于名人語音合成這點,實際上百度地圖等軟件上也早已有所應用。
通過對比后發現,盡管二者在技術能力上不相上下,但是在生態上搭建上百度擁有更大的想象力,百度有著圖片、音樂、網頁等諸多內容,可以為用戶提供更大程度上的便攜使用體驗,用戶僅僅在語音中向百度請求,還可以實現連接一切的語音服務。
移動互聯網落幕,語音智能將最終無處不在
李彥宏在烏鎮互聯網大會上表示“移動互聯網已經落幕”,而實際上確實如此,大的獨角獸機會已經消失,人工智能的下一幕正在開啟,未來的智能將無處不在。而在未來萬物聯網的智能世界中,語音也將變得無處不在,用戶可以對一堵墻發號施令給自己家人打電話,也可以對一盞水壺、一盞臺燈、一張桌子發號同樣的命令,實現電話接通的需求。
而輸入法中的智能語音提前揭示了這種人工智能無處不在的狀態,將來的用戶會越來越感受到語音智能的無孔不入,會越來越習慣在一個小小的語音輸入法中通過說話的方式來實現自身的需求。例如給某某打電話(已實現)、打車、點外賣、定電影票等等。事實上,百度在2015年世界大會上推出的人工智能小秘書“度秘”已經做到了這點。依托于“百度大腦”的人工智能,再加上更多的商業生態支撐,以及百度輸入法自身擁有30%的市場,上億的年輕用戶都在逐漸習慣于語音輸入這一新的手機輸入模式,其未來的勢能不容小覷。
作者微信公眾號:“首席發言者”
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。