2018機器閱讀理解技術競賽報名即將截止 匯集全球高校AI技術人才互聯網+
百度通過開展機器閱讀理解技術競賽、百度之星開發者大賽、PaddlePaddle AI大賽等多個人工智能行業競賽并開放海量優質AI數據資源,百度與CIPS、CCF聯合舉辦2018機器閱讀理解技術競賽并開放數據集,2018機器閱讀理解技術競賽。
由中國中文信息學會(CIPS)、中國計算機學會(CCF)和百度公司聯手舉辦的“2018機器閱讀理解技術競賽”已于2018年3月1日正式啟動,獲勝團隊將分享總額10萬人民幣的獎金,并將在第三屆“語言與智能高峰論壇”上進行技術交流和頒獎。
自開啟報名通道后,大賽已收獲了海內外800多支隊伍的積極響應。目前,大賽仍在火熱報名中。截至3月25日,本屆競賽已有全球824個隊伍和個人注冊報名,其中333支團隊來自海內外149所高校和科研院所、112支團隊來自78家企業。據統計信息,全國211高校中將近一半的高校有研究團隊報名參賽,成為參賽隊伍的主力。參賽的國際隊伍有來自美國、英國、加拿大、新加坡等十余個國家的109個團隊及個人,匯集了全球的AI技術優質人才。
3月31日,大賽報名將會截止,同時對報名者開放全部訓練數據,參賽者可登錄2018機器閱讀理解技術競賽官網下載,并開啟競賽任務。還未報名的個人及團隊,請在規定時間內登錄競賽官網報名參賽,與海內外眾多AI人才一較高下。3月31日報名的隊伍當天即可下載新數據集。
機器閱讀理解的任務就是讓機器閱讀文本,回答和閱讀內容相關的問題,其中涉及到語言理解、知識推理、摘要生成等復雜技術,極具挑戰。在當今互聯網應用中,智能搜索、內容推薦、語音助手與智能客服等領域的發展,都大量依靠于機器閱讀理解閱讀真實問題、真實互聯網材料,給出完整答案的AI能力。從海量真實數據中訓練AI,是自然語言處理和人工智能領域的重要前沿課題。百度與CIPS、CCF聯合舉辦2018機器閱讀理解技術競賽并開放數據集,旨在為研究者提供學術交流平臺,進一步提升機器閱讀理解技術的研究水平,并希望更多研究者能夠利用數據集產出更好更優質的機器閱讀理解模型,推動語言理解和人工智能領域技術研究和應用的發展。
為此,本次競賽中將提供面向真實應用場景的大規模中文閱讀理解數據集。數據集包含來自百度搜索的30萬個真實問題,每個問題對應5個候選文檔文本,以及人工撰寫的優質答案。競賽任務是對于給定問題q及其對應的文本形式的候選文檔集合D=d1, d2, ..., dn,要求參評閱讀理解系統自動對問題及候選文檔進行分析,輸出能夠滿足問題的文本答案a。為了便于參賽選手快速了解競賽任務,競賽還提供了兩個開源的閱讀理解基線系統,并采用ROUGH-L和BLEU作為評價指標。
有數據顯示,中國人工智能人才缺口超過500萬,在自然語言處理技術成為人才競爭核心領域之一的今日,百度通過開展機器閱讀理解技術競賽、百度之星開發者大賽、PaddlePaddle AI大賽等多個人工智能行業競賽并開放海量優質AI數據資源,正是希望攜手并賦能AI行業的優質人才,進一步推動人工智能領域的技術交流和發展,為研究者提供強大的學習驅動力與創造力,培養與成就更多中國人工智能領域的精英技術人才,最終持續推進中國AI產業的發展,讓越來越多的中國面孔亮相于人工智能領域的世界舞臺。
同時,百度誠邀所有對AI有興趣的技術人才了解和關注百度AI數據集,已公開的閱讀理解數據集可以登陸百度AI數據集官網自由下載,并通過平臺提交算法模型,根據測試結果進行系統效果驗證。除了閱讀理解數據集,百度AI公開數據集計劃BROAD(Baidu Research Open-Access Dataset)還發布了視頻和圖像數據集,更多數據集參見百度AI數據集官網。
未來,百度將繼續在AI人才培養中發揮重要作用,助力產學研各方開展研究,提升我國在機器閱讀理解技術領域的影響力,讓人才成為AI領域持續領跑的強力引擎。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。