JDD空間站舉辦首場技術探索日:聚焦語音識別,助力產學研合作金融

日前,由JDD空間站及京東大學聯合主辦的“JDD技術探索日”語音識別專場活動在京舉行。
日前,由JDD空間站及京東大學聯合主辦的“JDD技術探索日”語音識別專場活動在京舉行,來自京東集團、京東金融、獵戶星空、小米和西北工業大學的語音識別技術專家分享了研究成果。在探索日現場,還舉行了“京東金融對話語音識別大賽”頒獎儀式,獲得冠亞季軍的三位選手分享了參賽心得,并與現場觀眾進行了深入的互動交流。JDD空間站是由京東金融打造的距離產業界最近的數據探索者社區,包含大賽、社區和合作伙伴三大板塊,不但為數據探索者打造實現自我價值的平臺,同時也為合作伙伴連接優秀人才與前沿技術,助力企業提升數據和AI能力,讓科技與商業應用快速融合。
京東金融對話語音識別大賽是JDD空間站上線后的首場比賽,是面向廣大語音技術愛好者、高校學生、企業開發者而舉辦的語音識別邀請賽。大賽賽題基于京東金融語音識別團隊的實際業務場景——客服質檢而來。在大賽中,京東金融首次開放了5000小時的京東金融客服語音數據(經嚴格脫敏)及GPU資源,希望和大家一同去探索對話語音識別技術。
在大賽中,來自中國科學院自動化研究所的白燁,來自小米的莊偉基,來自獵戶星空的宋莎莎三位選手在數百名參賽選手中脫穎而出,分獲冠亞季軍。
在分享交流環節,冠軍獲得者白燁無私地分享了參賽過程中的解題思路,并坦言,從初賽的50小時數據到決賽時的5000小時數據,要解決識別方言、口語語法以及排除數據噪音等問題,并在短時間內創建與訓練模型,難度非常之大。但從另一個角度來說,在這樣的壓力下逼迫自己不斷翻閱文獻并調試完善模型,也是一個對自我極限的挑戰過程,收獲非常之大。他特別感謝了京東金融開放對話語音數據的做法,他表示,基于真實應用場景的對話語音數據在行業內非常珍貴,京東金融開放的5000小時對話語音數據對于開發者甚至對于整個行業來說,都有非常大的幫助作用。
在分享交流的過程中,亞軍莊偉基、季軍宋莎莎也高度肯定了JDD空間站開放數據、開放資源的做法。對此,在交流會后的采訪中,西北工業大學計算機學院音頻、語音與語言處理研究組的謝磊教授也給予了高度評價。
謝磊教授是語音識別領域的知名專家,他認為,對話語音識別是語音識別領域難度大且極其具有挑戰性的任務。對話語音的"即興化"和"口語化"的特點,造成語速快、發音隨意、吞音少字、講話不符合語法習慣、語音不流利、說話人語音交疊等現象,再疊加場景的噪聲,給聲學模型和語言模型的建立帶來了不小的挑戰。京東金融這次開放的語音數據是脫敏后的真實客服對話背景,推動了學術界對語音識別方面的研究。
謝磊教授還表示,語音識別的入門門檻較高,涉及的知識方方面面,特別是開源數據比較缺乏,在一定程度上造成了語音人才的缺乏。京東金融的這次活動是一個很好的橋梁,為連接學術界和工業界的技術人才和技術發展起到了積極作用。
謝磊教授指出,校企合作會實現“三贏”。學校在一定程度上缺乏數據和大算力,也難以獲取業界豐富的大數據資源,和工業界的合作可以優勢互補,利用工業界的場景大數據和大算力,做出"更靠譜"的研究結果。工業界可以把一些技術難題和前瞻性的題目放給學校去探索,同時通過校企合作吸引學生合作研究和實習,聯合培養和儲備人才。學生則通過接觸工業界的實際場景和實際問題,獲得"接地氣"的鍛煉,對將來求職和職業成長都很有幫助。
本次京東金融對話語音識別大賽已經畫上圓滿的句號,但JDD空間站才剛剛啟程。京東金融將會依托JDD空間站繼續推動技術開放,和更多的合作伙伴去探索推動語音領域技術發展的方式;會不斷的發布更具挑戰性的賽題,也會嘗試開放更多的資源和數據。另外,今年的JDD大會及大賽還將如期舉行,旨在為科技界、產業界、金融界、學術界搭建起一個全球化的開放平臺,共同探索數字科技創新之道,實體經濟數字化升級之路。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。