云知聲CEO黃偉:AI的浮躁時代已經過去 2018年將出現“分水嶺”互聯網+
第一款面向IoT人機交互場景的AI芯片 至于云知聲芯片的定位,而做終端AI芯片最重要的是由應用場景來定義整個芯片的產品形態和邏輯,我們這款芯片可以說是第一款面向IoT人機交互場景的AI芯片。
六年的時間發生了很多事,時間不停地洗刷著每個行業。
成立于二零一二年的云知聲更像是一支向著目的地挺進的長征隊伍,任務明確,投入兵力,按照既定作戰方案穩步推進。
這是創始人黃偉自信的來源,資料顯示,云知聲的合作伙伴數量超過2萬家,覆蓋用戶超過2億,云平臺日調用量3.3億次,覆蓋的城市超過647個。
黃偉畢業于中國科學技術大學并獲得博士學位,畢業后任職摩托羅拉中國研究中心資深研究員,期間開發出了世界第一款手機聲紋認證系統。后出任盛大創新院核心高管,并創建了語音分院;隨后于2012年創立云知聲。
他曾連續三年參與美國國家標準技術署(NIST)說話人識別評測(SRE)項目,獲主任務第一名,是目前為止唯一一位在NIST評測中連續兩年做Keynote Speaker的華人。
“金字塔”式的研發規劃修煉好內功才能厚積薄發
在他看來,云知聲的“金字塔”式的研發規劃,保證了他們在過去六年始終保持在行業一線,同時,未來六年依舊如此,因為他們的“基礎建設”非常完善。
那么,何為“金字塔”式的研發?金字塔的底層是DeepFlow集群,這個異構化硬件服務器集群,可以向上提供密集的計算和存儲能力,保證研發團隊充足算力的支持,黃偉稱,在2018年計劃拓展到1000GPU以上的規模。
而中間層是Atlas超算平臺,這是分布式機器學習并行計算平臺,內部協同共享AI底層研發技術成果,可以遷移復用到各個領域的應用。
“我們在2012年就把深度學習做出來了,這個是我們確定的大數據方向,全面深度學習化,我可以負責任的說,那時中國95%的高校教授,都沒有聽說過深度學習”黃偉告訴網易智能。
而“金字塔”的頂層,則是應用層技術,比如有ASR、TTS、NLU等應用層技術的輸出,黃偉稱,可以理解為云知聲建立了一個核心能力,這個核心能力是AI,然后AI通過一種云端芯的產品架構體系,把它生產出來,然后應用到不同的應用場景。
談到應用,2018年被稱為人工智能落地元年,落地將變得至關重要,黃偉的關注重點是IoT和醫療等領域,“我們要把積累的勢能釋放出來,毫無疑問,今年我們在智能家居、機器人方面會大規模的出貨”。
由應用場景來推導AI芯片研發,是AI創業公司的最佳路徑
目前,人工智能芯片大行其道,無論是傳統的芯片巨頭英偉達、英特爾、高通,還是手機廠商發布的AI芯片蘋果AI1、海思麒麟970、高通驍龍845、三星Exynos 9810、聯發科曦力P60,以及創業公司地平線的征程芯片等等。
我們逐漸嗅到紅海的味道,究其原因,芯片是人工智能非常重要的計算載體,以及感知載體,它承載著人工智能非常重要的環節,必不可少。
但黃偉認為,大家都做芯片,但芯片其實包括幾大類,大家有重疊但都有各自的市場和發力點,比如英偉達的GPU是用來支撐特別高的計算量,這方面毫無疑問是巨頭們的戰場;還有一種是云端芯片,這類芯片主要用來做一些云端的認知決策,比如Google的TPU等等;還有一種則是云知聲、地平線們做的事情,這類芯片是終端芯片。
而做終端AI芯片最重要的是由應用場景來定義整個芯片的產品形態和邏輯。
黃偉指出,在芯片產品形態方面,云知聲已經過很長時間的探索。從市場著手,云知聲在智能家居、智能音箱、兒童教育機器人等市場方面已經基于IVM(通用芯片方案)的產品形態,驗證了市場、產品、用戶場景的合理性。而伴隨合作客戶在更多產品種類和形態上對成本、穩定性、集成度等方面的呼聲愈高,進而推出自研AI芯片就成為一件水到渠成的事情。
黃偉表示,早在2015年云知聲就組建了芯片團隊,2016年公司開始就市場、產品、技術路線以及芯片下游合作方的評估。2017年啟動芯片產品定義、IP選型、算法優化、工具準備,以及詳細產品定義和技術模塊評估工作。目前,云知聲AI芯片UniOne已經流片,即將對外發布。
“在芯片這件事兒上面,我們至少領先三年的時間節點。可能出來的時間點正好趕上了AI芯片大熱的時間點,不過這也算是對我們前期投入的一個獎勵吧,”黃偉告訴網易智能。
第一款面向IoT人機交互場景的AI芯片
至于云知聲芯片的定位,黃偉表示,在IoT的人機交互的大背景下,AI算法對設備端芯片的并行計算能力和存儲器帶寬提出了更高的要求,傳統的芯片架構在這兩個方面卻捉襟見肘;另一方面,盡管基于GPU能夠在終端實現推理算法,但其功耗大、性價比低的弊端卻不容忽視,而IoT設備與手機不同,形態千變萬化,需求碎片化比較嚴重,因此很難跨設備形態的問題。因此,只有從IoT的應用場景出發,設計定制化的芯片架構,才能在大幅提升性能的同時,降低功耗和成本,同時滿足AI算力以及跨設備形態的需求。
“同時,無論是大的產品還是小的產品,有屏幕還是無屏幕的,人機交互相關的共性東西,應該把它提取出來,并且固化下來,從這個意義上講,芯片是最恰當的方式。我們這款芯片可以說是第一款面向IoT人機交互場景的AI芯片”。黃偉說到,從商業的角度看,目前市面上所有的芯片,并不是針對人工智能來設計的,它很難把算法的威力發揮出來。
此外,大家采用的模組組裝的模式,好處是能夠快速出貨,但因為受限于成本,很多時候只能選擇市面上計算能力比較差的芯片,而東拼西湊之后會出現良品率低等問題。
所以,云知聲的做法是,從算法公司的角度出發做終端芯片,它并不需要有特別高的計算能力,打造出一個夠用的芯片,他們認為做得再多的話,成本、功耗等各方面都是浪費。而且他們的芯片選擇對計算進行加速,對算法加速意味著你對它的能力做了限制的,而對計算加速就是“練內功”。
黃偉強調,最重要的是芯片的定位,而不是跟風。想清楚未來的生態是什么?客戶在哪里?因為芯片是高投入、高風險的行業。
AI的浮躁時代已經過去 2018年將出現“分水嶺”
黃偉在朋友圈談到,“年紀大了,最近經常半夜醒來”,面對記者,他坦言也有創業維艱的原因,作為創業者需要面對來自投資人、客戶、員工、市場等等方面的責任,時不我待,他不能止步不前。
智能硬件行業經歷了,過去兩年的浮躁期,開始回歸理性,黃偉認為,2018年將是行業的“分水嶺”,大家開始關注落地,有能力的公司開始釋放勢能,而對于沒有先發優勢的公司來說,如果你沒有顛覆性的東西,就很難再獲得投資人和市場的關注了,因為時間窗口已經過去,而在人工智能行業的幾個主流賽道里面,都誕生了獨角獸,所以的資源都將向頭部公司傾斜。
“通俗的講,過去幾年你還可以靠吹牛拿投資,但今年開始就沒那么簡單了,”黃偉說到。
對于人工智能行業以及人機交互如何發展的問題,他談到,人類的交互主要依靠耳朵和嘴巴,視覺可以讓我們看到更多的展示內容,語音可以讓我們主動表達,二者缺一不可,互為補充,所以,語音和圖像一定是未來的主要交互方式,鍵盤輸入或者鼠標輸入,本質上是違反人性的,未來手機不見得是我們的必需品。
根據調研機構GfK的數據,2015年中國智能音箱零售量只有1萬臺,2016年增至6萬臺,2017年1--8月共累計銷售超10萬臺,而隨著2017第三季度眾多新品的推出,僅在2017年8月,智能音箱市場就達到了同比178%的增長率。
交互革命已然來臨。
當然,公眾對于人工智能還存在質疑的聲音,最近優步自動駕駛致行人死亡事件鬧的紛紛揚揚,引發大家的恐慌心理,AI威脅論再次被大家熱議,對此,黃偉提醒,技術應該安全第一,在科技進步和人類生命安全之間,毫無疑問后者更為重要。(完)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。