TMT观察网_独特视角观察TMT行业

李開復:30年后AI的土壤終于肥沃金融

李開復 2017-08-16 10:54
分享到:
導讀

那一刻,我的感動無以倫比。因為對一個教授來說,學生要用自己的方法作出一個與他唱反調的研究。教授不但沒有動怒,還給予充分的支持,這在很多地方是不可想象的。

1

今天跟大家講個故事。

1983-1988年,我正在卡內基·梅隆大學讀計算機博士。

我正忙著暑期教書,秋天投身奧賽羅人機博弈(黑白棋游戲,那是機器第一次真正意義上打敗人類冠軍的比賽)。

我的導師瑞迪教授(Raj Reddy,圖靈獎得主、卡內基梅隆大學計算機系終身教授、美國工程院院士)從美國國防部得到了300萬美元的經費,用來做不指定語者、大詞庫、連續性的語音識別。

也就是說,他希望機器能聽懂任何人的聲音,而且可以懂上千個詞匯,懂人們自然連續說出的每一句話。

這三個問題都是當時無解的問題。

而瑞迪教授大膽地拿下項目,希望同時解決這三個問題。他在全美招聘了30多位教授、研究員、語音學家、學生、程序員,以啟動這個有史以來最大的語音項目。

我也在這30人名單之內。

當時的科研背景是,業界已經有類似今天深度學習的算法,但一直沒有實現數據標準化,數據量也不足夠大。

美國幾大語音識別實驗室(如MIT、 CMU、 SRI、 IBM、貝爾實驗室)都是各用各的數據庫,測試數據不同,訓練數據不同,使用的語言模型不同,測試的詞匯量也不同。所以都各稱業界第一,大家莫衷一是。

而每個大公司都有自己的商業需求,比如說在語音識別方面,當年做打字機的IBM想做語音打字機,壟斷美國電信的AT&T要求貝爾實驗室識別電話號碼,所以大公司并沒有動力來幫助小公司或學校。而小公司和學校,往往只有資源做些較小的數據集,結果通常也不如大公司的好。

不僅如此,數據不標準對AI研究而言是致命的,最后導致很多問題,包括:

1、因為測試語料庫不同,最后識別結果,大家無法復制,也無法驗證。彼此不認可,而且因為數據沒有打通,算法就更不可能打通了。

2、因為每家做的領域不同,最后的結果都不可比。有些領域詞匯量小,比較容易,但是做出結果也可能不能通用。有些領域詞匯量大,但是約束很多,所以能說的內容不多,導致比較容易識別,也不能通用。

3、因為每家訓練集不一樣大,而訓練集越大,一般結果越好。所以,有可能結果做的好,被認為并不是靠算法,而是靠數據量大。

4、對于學術單位來說,最大的問題來自于沒有足夠的資源(也沒有興趣)收集、清洗、標注大量的語料。對于小公司來說,語料和計算力都是問題。

最后,瑞迪教授計劃采用“專家系統”來完成項目,因為這個方法需要的數據有限。

專家系統是早期人工智能的一個重要分支,你可以把它看作是一類具有專門知識和經驗的計算機智能程序系統,一般采用人工智能中的知識表示和知識推理技術來模擬通常由領域專家才能解決的復雜問題。

但我不認同。

2

之前參加過的奧賽羅的人機博弈,讓我對統計概念有了充分的理解,我對瑞迪教授的研究方法產生動搖。

我相信建立大型的數據庫,然后對大的語音數據庫進行分類,有可能解決專家系統不能解決的問題。

另外,在1985年,美國標準局 (NationalInstitute of Standards and Technology)也意識到數據不標準會影響科研進步。所以在語音識別問題上,標準局設定了標準的語音和語言的訓練集、測試集。要求每個學校的每個團隊都用同樣的訓練集來訓練模型,可以自己調好系統參數,比賽最后一天大家拿到數據,有一天時間跑出結果,大家評比。

我從這個標準數據集和測試看到機會。

再三思考后,我決定鼓足勇氣,向瑞迪教授直接表達我的想法。我對瑞迪說:“我希望轉投統計學,用統計學來解決這個‘不特定語者、大詞匯、連續性語音識別’。”

李開復:從1983到2017,我的幸運與遺憾;30年后AI的土壤終于肥沃

我以為瑞迪會有些失望,沒想到他一點都沒有生氣,他輕輕地問:“那統計方法如何解決這三大問題呢?”

瑞迪教授耐心地聽完我激情的回答后,用他那永遠溫和的聲音告訴我:“開復,你對專家系統和統計的觀點,我是不同意的,但是我可以支持你用統計的方法去做,因為我相信科學沒有絕對的對錯,我們都是平等的。而且,我更相信一個有激情的人是可能找到更好的解決方案的。”

那一刻,我的感動無以倫比。因為對一個教授來說,學生要用自己的方法作出一個與他唱反調的研究。教授不但沒有動怒,還給予充分的支持,這在很多地方是不可想象的。

統計學需要大數據庫,我們如何才能建立起大的數據庫呢?

瑞迪教授看到我愁眉不展的樣子,再一次給了我支持。他說,“開復,雖然說我還是對你的研究方法有所保留,但是,在科學的領域里,其實也無所謂老師和學生的區別,我們都是面臨這一個難題的攻克者,所以,如果你真的需要數據庫,那么,讓我去說服政府幫你建立一個大的數據庫吧!”

瑞迪教授后來說服了美國政府部門和美國標準局收集并提供了大量數據。我用美國標準局提供的標準大數據,跟多家拿國家錢的機構數據,后來一些不拿國家錢的單位(如:IBM,AT&T)也參與進來,我可使用的數據越滾越大。

除了大數據,統計學的方法還需要非常快的機器,瑞迪教授又幫我購買了最新的Sun 4機器。此后每次有新的機器,他都會說:“先問問開復要不要。” 做論文的兩年多,我至少花了他幾十萬美元的經費。

瑞迪教授的寬容再次讓我感覺到一種偉大的力量,這是一種自由和信任的力量。

3

在導師的支持下,我開始了瘋狂的科研工作。

當時,我帶著另一位學生一起用統計的方法做語音識別。同時,其他30多人用專家系統做同樣的問題。從方法上來說,我們在競爭,但是在瑞迪教授的領導下,我們分享一切,我們用同樣的樣本訓練和測試。

在1986年底,我的統計系統和他們的專家系統達到了大約一樣的水平,40%的辨認率。這雖然還是完全不能用的系統,但畢竟是學術界第一次嘗試這么難的問題,大家還是比較欣喜和樂觀的。

1987年5月,我們大幅度地提升了訓練的數據庫,采用了新的建模方法,不但能夠用統計學的方法學習每一個音,而且可以用統計學的方法學習每兩個音之間的轉折。針對有些音的樣本不夠,我又想出了一種方法(generalized triphones)來合并其他的音。這三項工作居然把機器的語音識別率從原來的40%提高到了80%!后來又提高到96%。

統計學的方法用于語音識別初步被驗證是正確的方向。

大家都相信了我用的機器學習方法和隱馬可夫模型算法,并且拋棄了不可行的專家系統(專家系統只達到60%的識別率)。在我的博士論文基礎上,后來的Nuance,微軟、蘋果等公司做出了業界最領先的產品。

1988年4月,我受邀到紐約參加一年一度的世界語音學術會議,發表學術論文。

這個成果撼動了整個學術領域。這是當時計算機領域里最頂尖的科學成果。

語音識別率大幅度提高,讓全世界語音研究領域閃爍出一道希望的光芒,從此,所有以專家系統研究語音識別的人全部轉向了統計方法。

會后,《紐約時報》派記者JohnMarkoff來到匹茲堡對我作了采訪,文章發表于1988年7月6日,占了科技版首頁的整個半版。在這篇文章里,馬可奧夫大力報道了我的論文的突破。當時,我只覺得在和一個和藹可親的記者聊天,事后,我才知道這是一名才華橫溢的著名記者,三次提名普利策獎,并在斯坦福兼教。

這是1988年,《紐約時報》對我博士論文的報道

是1988年,《紐約時報》對我博士論文的報道

后來,《商業周刊》把我的發明選為1988年最重要的科學發明。年僅26歲初出茅廬的我,第一次亮相就獲得這樣的成功,讓我感到很幸運,也讓我有了繼續向科技高峰攀爬的動力。

而我也因此拿到了卡內基·梅隆大學的計算機博士學位,這離我1983年入學只有4年半的時間。在卡內基·梅隆大學的計算機學院,同學們平均6年以上才能

拿到博士學位,我用這么短的時間拿到博士學位,是一項新的紀錄。

我也因此破格留校,成為一名26歲的助理教授。

4

遺憾的是,雖然我找到了方向和基本方法,但以當時的數據量級和計算水平,語音AI研究很難有商業化機會。我最終還是離開科研界,進入商界,用產品改變世界。

李開復:從1983到2017,我的幸運與遺憾;30年后AI的土壤終于肥沃

30年過了,AI發展的土壤終于肥沃起來。

伴隨互聯網和移動互聯網而來的大數據、高效的計算機運算能力等條件都齊備了。科研人員需要的數據集不再那么難以觸碰,只是需要有人牽頭讓更多的公司參與進來。這在30多年前,我還是一個AI科研人員的時代,能接觸到真實世界里如此海量的數據,是個遙不可及的夢想。

我當年受惠于瑞迪教授的幫助和指導,今天也非常希望能給更多和我一樣的年輕人,創造研究機會和條件。

所以,昨天創新工場、搜狗、今日頭條聯合發起“AI Challenger 全球AI挑戰賽”。三家公司分別投入大量資金、也拿出千萬量級高質量開放數據集與寶貴GPU資源。

李開復:從1983到2017,我的幸運與遺憾;30年后AI的土壤終于肥沃李開復:從1983到2017,我的幸運與遺憾;30年后AI的土壤終于肥沃李開復:從1983到2017,我的幸運與遺憾;30年后AI的土壤終于肥沃李開復:從1983到2017,我的幸運與遺憾;30年后AI的土壤終于肥沃李開復:從1983到2017,我的幸運與遺憾;30年后AI的土壤終于肥沃

同時,我也倡導商界和科研界能采用大量的數據和標準的測試方法,也歡迎更多的數據公司能夠參與到這個平臺里。

希望我們推出的Challenger.ai,可以幫助到中國AI人才成長。

在我看來,這次AIChallenger絕對不只是一個活動,也絕對不只是一個獎金200萬、年底就結束的競賽,這是推進中國AI人才成長的重大催化劑。

希望3年或5年后,我們再來回顧這一段時光,我們發現中美AI人才之間沒有落差了,還能想到AI Challenger在這樣重大過程中扮演了一個小小角,我就感到這一切都有價值。

歡迎大家登錄大賽官網Challenger.ai,獲取信息并報名。關于這場大賽的具體信息可點擊文末的鏈接了解(要在電腦頁面上才能報名哦)。

你們可能無法想象,我有多么羨慕你們,生活在數據爆炸的時代,有人提供數據和獎金池,讓有才華的人一展拳腳。

來源:新浪創事記

數據 教授 語音 方法 識別
分享到:

1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。


觀點約架

主站蜘蛛池模板: 量子管通环-自清洗过滤器-全自动反冲洗过滤器-北京罗伦过滤技术集团有限公司 | 净水器代理,净水器招商,净水器加盟-FineSky德国法兹全屋净水 | 儋州在线-儋州招聘找工作、找房子、找对象,儋州综合生活信息门户! | 通风天窗,通风气楼,屋顶通风天窗,屋顶通风天窗公司 | 刘秘书_你身边专业的工作范文写作小秘书 | 辊道窑炉,辊道窑炉厂家-山东艾希尔| 珠光砂保温板-一体化保温板-有釉面发泡陶瓷保温板-杭州一体化建筑材料 | 医院专用门厂家报价-医用病房门尺寸大全-抗菌木门品牌推荐 | 河南中专学校|职高|技校招生-河南中职中专网 | 苏州注册公司_苏州代理记账_苏州工商注册_苏州代办公司-恒佳财税 | 爱科技iMobile-专业的科技资讯信息分享网站| ?水马注水围挡_塑料注水围挡_防撞桶-常州瑞轩水马注水围挡有限公司 | 游泳池设备安装工程_恒温泳池设备_儿童游泳池设备厂家_游泳池水处理设备-东莞市君达泳池设备有限公司 | 不锈钢发酵罐_水果酒发酵罐_谷物发酵罐_山东誉诚不锈钢制品有限公司 | 双效节能浓缩器-热回流提取浓缩机组-温州市利宏机械 | 天津热油泵_管道泵_天津高温热油泵-天津市金丰泰机械泵业有限公司【官方网站】 | 福建成考网-福建成人高考网| EPDM密封胶条-EPDM密封垫片-EPDM生产厂家 | 防爆正压柜厂家_防爆配电箱_防爆控制箱_防爆空调_-盛通防爆 | 贵州科比特-防雷公司厂家提供贵州防雷工程,防雷检测,防雷接地,防雷设备价格,防雷产品报价服务-贵州防雷检测公司 | 济南拼接屏_山东液晶拼接屏_济南LED显示屏—维康国际官网 | 南汇8424西瓜_南汇玉菇甜瓜-南汇水蜜桃价格 | 考勤系统_人事考勤管理系统_本地部署BS考勤系统_考勤软件_天时考勤管理专家 | 【德信自动化】点胶机_全自动点胶机_自动点胶机厂家_塑料热压机_自动螺丝机-深圳市德信自动化设备有限公司 | 纯化水设备-纯水设备-超纯水设备-[大鹏水处理]纯水设备一站式服务商-东莞市大鹏水处理科技有限公司 | 郑州墨香品牌设计公司|品牌全案VI设计公司 | 冷油器-冷油器换管改造-连云港灵动列管式冷油器生产厂家 | 滚珠丝杆升降机_螺旋升降机_丝杠升降机-德迈传动 | 翰香原枣子坊加盟费多少钱-正宗枣核糕配方培训利润高飘香 | 深圳律师咨询_深圳律师事务所_华荣【免费在线法律咨询】网 | 浙江宝泉阀门有限公司 | 电缆接头_防水接头_电缆防水接头 - 乐清市新豪电气有限公司 | 福兰德PVC地板|PVC塑胶地板|PVC运动地板|PVC商用地板-中国弹性地板系统专业解决方案领先供应商! 福建成考网-福建成人高考网 | 中国玩具展_玩具展|幼教用品展|幼教展|幼教装备展 | 三氯异氰尿酸-二氯-三氯-二氯异氰尿酸钠-优氯净-强氯精-消毒片-济南中北_优氯净厂家 | 北京翻译公司-专业合同翻译-医学标书翻译收费标准-慕迪灵 | 全国国际化学校_国际高中招生_一站式升学择校服务-国际学校网 | 全国国际学校排名_国际学校招生入学及学费-学校大全网 | 禹城彩钢厂_钢结构板房_彩钢复合板-禹城泰瑞彩钢复合板加工厂 | 陶瓷砂磨机,盘式砂磨机,棒销式砂磨机-无锡市少宏粉体科技有限公司 | 国际金融网_每日财经新资讯网 |