TMT观察网_独特视角观察TMT行业

讓AI無處不在的云端訓練師互聯網+

腦極體 2019-10-09 11:18
分享到:
導讀

云端訓練讓AI得以在軟硬件雙重通道上得到淬煉,進而以低門檻、可應用的方式真正適配千行萬業的智能化需求

云端訓練讓AI得以在軟硬件雙重通道上得到淬煉,進而以低門檻、可應用的方式真正適配千行萬業的智能化需求 隨著《云之變》系列走向尾聲,想必大家可以清晰地感受到,當前云服務的發展方向,無論是以IaaS、PaaS或SaaS等何種形式交付,其所追尋的產業價值一定離不開一個特質,那就是——“AI as a service”,AI即服務。

在這場大浪潮中,越來越多企業在尋求可以將AI集成到自有業務與產品中的渠道,無數開發者渴望搶先在AI舞臺上釋放創造力,然而面對深度學習為代表的巨型數據集,如果自建數據中心或個人電腦帶不動AI這匹“算力怪獸”,該怎么辦?
作為基礎設施一般存在的云服務商,此時就被賦予了一個新的角色——AI訓練師。
花式AIaaS,離不開“訓練”二字
云計算的普及,讓各種AI能力以“即服務”的形式出現在了各行各業之中。去年,RightScale的云研究報告指出,企業格外關注于AI技術體系中的機器學習。當被問詢未來計劃使用哪種類型的公有云服務時,絕大多數的受訪者選擇了機器學習,12%的受訪者表示他們正在使用這一服務,46%的受訪者則表示他們正在測試或計劃部署機器學習服務。
目前看來,AI主要是以三種形式被“即服務”到產業當中:一種是Chatbot,比如蘋果Siri、微軟Cortana或亞馬遜Alexa這樣的智能語音助理,被業務集成后可以直接打通AI體驗,解放人力;第二種是API。云服務商開發出的AI模型,如NLP、圖片分類、視頻識別等等,以應用程序編程接口(API)的形式集成到自身的平臺上去,避免從零開發。目前廣泛應用的人臉識別、語音翻譯等都是以各種形式被普及的。第三種則是機器學習框架。開發人員利用云訪問機器學習框架構建出模型,再基于自身現有的數據對模型進行訓練,這種方式比起自建型算法模型更加便捷,節省時間。
顯然,這些讓AI全面開花的主流方式,依然依賴于一個環節,那就是訓練。
我們知道,雖然目前絕大多數云服務商都提供多種AI模型來幫助各行各業實現智能化。但云服務商無法深入到產業肌理的每一個細微紋路,想要讓AI落地時精準地匹配現實需求,高度定制化的數據訓練就十分必要了。
即使云服務商有類似的平臺模型可供企業客戶調用,一個良好的模型依然需要具備可擴展、可訓練性,也就是能夠根據實際數據隨時自我更新,不斷提升性能,才能真正成為提質增效的神兵利器。
從這個層面看,面向企業和個人開發者的AI訓練服務,幾乎成了公有云無法繞開的關鍵能力。
上探AI訓練,對公有云意味著什么?
今天,在公有云上進行深度學習訓練可謂是人工智能的重要趨勢,然而有能力向企業和個人開發者輸出云端訓練服務的云服務商可說是鳳毛麟角。
例如亞馬遜推出了AWS深度學習容器,也方便客戶定制AI訓練流程;谷歌和Facebook也推出了適合自身深度學習框架TensorFlow的訓練平臺;在中國,華為、百度、阿里、浪潮、騰訊等也讓定制化AI訓練服務走上了云端,整合到他們的企業服務解決方案中去。
我們知道,深度學習難以離開大數據和規模化訓練的支撐,二者就像緊密結合的輪軸推動著算法向高性能、高精度的方向發展,進而影響整個社會的AI進程。但目前市面上只有少數幾家頭部公有云廠商有類似的服務。為什么云端AI訓練如何“陽春白雪”? 其中很大一部分原因在于,定制化神經網絡的訓練任務,往往需要強大的計算能力,也就是GPU集群來保障。然而今天, AI算力依然是一種昂貴的計算資源,而云端訓練往往會在不訓練時將算力資源釋放出去,實現彈性調配,服務商按照實際計算消耗進行付費,個人開發者與企業則可以省去購買計算單元或是自建數據中心的高昂開支,從而大大降低了AI落地的成本。
不過,目前用戶可以選擇的云端訓練平臺并不多。主要原因是用于神經訓練的GPU芯片幾乎由英偉達一家獨大,云服務商建立訓練平臺的成本很高。后來谷歌、華為分別推出了自己的大規模計算單元,起到了一定了市場制衡作用。但整體而言,訓練環節的云端芯片依然難以滿足廣泛的部署需求。
還有一個顧慮是云巨頭在AI領域的投入與創新,正好具備了輸出基礎算力與應用工具的雙重能力。大多企業想要AI,依然需要花費大量時間與精力、人力去熟悉相應的深度學習框架、標注數據、調教參數、設計容錯等等,在一份Vanson Bourne公司的“企業人工智能狀況”調查報告中,有34%的企業IT決策者表示他們沒有合適的人才來支持技術的成功部署,30%缺乏實施的預算。
舉個例子,大部分中小企業采用公有云來進行超大規模的AI訓練,一個基本出發點就是試錯和驗證AI進入產業的新想法,因此時間成本就非常重要,這需要效率更高、擴展性更好的深度學習框架和專項加速來支撐。因此,想要幫助企業減少定制化訓練的學習門檻與風險成本,只有少數有意愿、有實力的頭部云技術巨頭才能切入。 另外值得注意的是,無論是需要財報好看的企業,還是渴望擁抱AI的開發者,云平臺面臨的訓練任務是五花八門的,接收到的數據資源也很可能放飛自我。不同的程序、業務模式可能對應著不同的訪問模式和存儲結構,因此,如何存儲、處理、分析、最終輸出基于任意類型數據的訓練模型,這就要求云平臺擁有構建和管理數據湖,來處理各種結構化或非結構化的數據,并統統投喂給神經網絡。顯然,想要積累如此龐大且豐滿的全量數據,頭部選手的表現更優且更完備。
總體來看,AI訓練作為智能這座大廈所必備的原材料鍛造過程,迫切需要一個靈活機動的全能選手“隨叫隨到”,就地完成特殊模塊的精雕細琢然后就功成身退,而不是在材料原產地處理完再運往施工現場。
具備這種彈性作戰能力的“工程隊”,顯然具備爭奪市場的關鍵能力。這也是為什么今天幾乎所有頭部云廠商都開始紛紛輸出自身的云端訓練能力,甚至不惜“虧本賺吆喝”。
那么向AI的技術上游切入訓練服務產業鏈,對于公有云廠商來說,究竟意味著什么?是以算法API和應用程序的方式“被連接”?還是提供工具和計算平臺“被集成”?亦或者向更底層的芯片等“硬實力”進發?
如果某一朵云懷抱著的野望,是真正成為智能時代的容器與基礎設施,構建全方位、立體化的AI技術體系,那么集硬件算力、軟件技術、生態開發于一體的AI訓練,雖然是復雜而漫長的冒險,卻是中國AI產業真正進入千行萬業所必要的投入與支撐。
一方面,云服務商需要開放自身的計算資源,為了不掣肘他人,就必須倒逼半導體產業自我升級。尤其時我國的短板,如承擔訓練任務的云端訓練芯片,針對深度學習框架專項加速、提高性能的計算單元,高精度基礎模型的釋放等等,這些AI訓練的必要支撐,伴隨云服務商的產業上探實現系聯動升級,正是當前的趨勢。
另外,云端分布式訓練、終端模型部署相結合,正在成為AI開發流程的全周期模式。企業利用公有云的算力、解決方案所訓練的專有模型,大多需要在端、邊側部署和應用,在“從硬到軟再到硬”的過程中,往往需要云平臺協同綜合考慮,這也讓構建從訓練到應用的產業閉環成為可能。而中國企業和開發者,以及各產業端的關鍵數據、創新應用等都得以在國產云環境中運行,在地域化情緒與環境不穩定的當下,也有著重要的產業安全戰略意義。
由此,我們可以引出一個新的話題:一個好的云端AI訓練平臺,應用具備哪些能力?
讓AI飛入尋常百姓家的云端“魔術手”
AI開始走進大眾視野,是以阿爾法狗所代表的深度學習技術為起點。而云服務商所扮演的角色,就是不斷將實驗室中影影綽綽的技術“實體化”、工具化成一個個道具,運用一雙虛實變幻、軟硬結合的“魔術手”,將AI驚艷地呈現在各行各業、普羅大眾眼前。
通過這雙魔術之手,我們則可以反向去理解,“云端訓練”在AI普惠的過程當中,都需要哪些條件的支持:
1.計算性能的持續升級。算力,是云端訓練的基礎保障,這里涉及兩個基本命題,一是絕對規模,也就是硬件化計算能力,在訓練時,數據會被分派給眾多訓練機器,再通過反饋及標志變量重新組合在一起,從而創建完整的訓練模型,對GPU驅動、底層庫之間的兼容性等硬件提出了不少挑戰。第二需要考慮的則是精度,通過網絡優化和超參組合,云平臺可以利用少量數據就達到出色的訓練效果和高性能的模型,這對于一些中小微開發者來說有著化不可能為可能的現實意義。
2.友好模式的開發態。簡單來說,就是降低開發者的訓練成本、學習門檻。一種方式是提供簡單易上手的開發工具和交互界面。舉個例子,神經網絡訓練的數據集往往達到1PB的數據量,即使用1G帶寬的網絡來傳輸也需要耗費將近4個月,黃花菜都要涼了,對此一些云巨頭借助新的傳輸工具,如谷歌的Transfer Appliance ,就能在25 小時內將 1PB 的數據裝入數據中心。還有一些自動化、可視化的任務管理工具,能夠大大解放開發者的重復勞動,比如訓練任務一站式托管,可以自動跟蹤任務的訓練狀態,提供輸出日志功能,開發者只需實時監控就可以了;
友好的第二種意義,則是云平臺的兼容性。我們知道,目前深度學習框架有許多,開發者需要在不同的框架下完成特定的訓練及推論任務,因此云平臺的兼容并蓄就非常重要了。像是新的AWS容器就能夠支持谷歌的TensorFlow、Apache的MXNet以及臉書的PyTorch等不同的機器學習架構,華為新發布的Atlas智能計算平臺,也志在解決中國企業和開發者對算力與兼容性的難題。這意味著對每一種架構提供針對性的優化和加速,讓特定的模型訓練速度更上一層樓,這也有助于打消企業開發者的上云顧慮。
3.穿透各個場景的降本增效。一方面,成本控制作為云端訓練的核心優勢,在整個開發過程中是不可或缺的。這意味著云平臺需要具備合理的擴展性與靈活度,讓企業輕松獲得自己所需要的AI資源并靈活合理地支付費用,如果試點項目沒有成功,也可以很容易地關閉;而項目成功后,也可以很容易地擴大資源規模。
另外,基于原生場景數據的訓練完成以后,如何將模型快速擴展到企業或產業其他業務部門及軟硬件,這是困擾AI開發生態的落地難題。能夠集中打通數據,讓終端和云端在統一的智能基礎設施上協同完成復雜任務處理的開發生態,將會在未來釋放更具應用價值的能量。
4.云端數據訓練的安全保障。定制化訓練意味著企業和開發者需要將自身的關鍵敏感數據上傳到云端,多個“租戶”任務同時進行,不同訓練任務數據之間的安全隔離就變得至關重要了。否則影響的不僅僅是模型的精度與性能,更可能在遷移、訓練、存儲中面臨數據泄露風險。
云平臺一方面需要確保自身數據的合規性,保證算法不因為地方法規的數據政策限制而失效;同時也需要應對潛在的網絡攻擊,采取數加密等手段來實現完善安全的服務調用。
總體而言,云端訓練讓AI得以在軟硬件雙重通道上得到淬煉,進而以低門檻、可應用的方式真正適配千行萬業的智能化需求。同時我們應該看到的是,云服務想要描繪出賦能無數產業、抵達生活方方面面的AI普惠藍圖,還需要跨越一座座高聳的山峰。而在這一條時代的跑道上,需要的不僅是宣傳口徑上的華麗辭藻,更是浸透了汗水與淚水的砥礪前行。
訓練 AI 數據 需要 企業
分享到:

1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。


主站蜘蛛池模板: UV固化机_UVLED光固化机_UV干燥机生产厂家-上海冠顶公司专业生产UV固化机设备 | 桁架楼承板-钢筋桁架楼承板-江苏众力达钢筋楼承板厂 | 档案密集架_电动密集架_移动密集架_辽宁档案密集架-盛隆柜业厂家现货批发销售价格公道 | 杭州标识标牌|文化墙|展厅|导视|户内外广告|发光字|灯箱|铭阳制作公司 - 杭州标识标牌|文化墙|展厅|导视|户内外广告|发光字|灯箱|铭阳制作公司 | 海外整合营销-独立站营销-社交媒体运营_广州甲壳虫跨境网络服务 焊管生产线_焊管机组_轧辊模具_焊管设备_焊管设备厂家_石家庄翔昱机械 | 水热合成反应釜-防爆高压消解罐-西安常仪仪器设备有限公司 | 高空重型升降平台_高空液压举升平台_高空作业平台_移动式升降机-河南华鹰机械设备有限公司 | 隧道风机_DWEX边墙风机_SDS射流风机-绍兴市上虞科瑞风机有限公司 | 智慧消防-消防物联网系统云平台 智能化的检漏仪_气密性测试仪_流量测试仪_流阻阻力测试仪_呼吸管快速检漏仪_连接器防水测试仪_车载镜头测试仪_奥图自动化科技 | 东莞螺杆空压机_永磁变频空压机_节能空压机_空压机工厂批发_深圳螺杆空压机_广州螺杆空压机_东莞空压机_空压机批发_东莞空压机工厂批发_东莞市文颖设备科技有限公司 | 刮板输送机,粉尘加湿搅拌机,螺旋输送机,布袋除尘器 | 针焰试验仪,灼热丝试验仪,漏电起痕试验仪,水平垂直燃烧试验仪 - 苏州亚诺天下仪器有限公司 | 缠绕机|缠绕膜包装机|缠绕包装机-上海晏陵智能设备有限公司 | 珠光砂保温板-一体化保温板-有釉面发泡陶瓷保温板-杭州一体化建筑材料 | 大学食堂装修设计_公司餐厅效果图_工厂食堂改造_迈普装饰 | 折弯机-刨槽机-数控折弯机-数控刨槽机-数控折弯机厂家-深圳豐科机械有限公司 | CTP磁天平|小电容测量仪|阴阳极极化_双液系沸点测定仪|dsj电渗实验装置-南京桑力电子设备厂 | 不锈钢钢格栅板_热浸锌钢格板_镀锌钢格栅板_钢格栅盖板-格美瑞 | 水性绝缘漆_凡立水_绝缘漆树脂_环保绝缘漆-深圳维特利环保材料有限公司 | 陶瓷加热器,履带式加热器-吴江市兴达电热设备厂 | 临时厕所租赁_玻璃钢厕所租赁_蹲式|坐式厕所出租-北京慧海通 | 密度电子天平-内校-外校电子天平-沈阳龙腾电子有限公司 | 北京中创汇安科贸有限公司| TPE_TPE热塑性弹性体_TPE原料价格_TPE材料厂家-惠州市中塑王塑胶制品公司- 中塑王塑胶制品有限公司 | 地源热泵一体机,地源热泵厂家-淄博汇能环保设备有限公司 | 天津蒸汽/热水锅炉-电锅炉安装维修直销厂家-天津鑫淼暖通设备有限公司 | 液压压力机,液压折弯机,液压剪板机,模锻液压机-鲁南新力机床有限公司 | 鼓风干燥箱_真空烘箱_高温干燥箱_恒温培养箱-上海笃特科学仪器 | elisa试剂盒-PCR试剂盒「上海谷研实业有限公司」 | 全自动在线分板机_铣刀式在线分板机_曲线分板机_PCB分板机-东莞市亿协自动化设备有限公司 | 光栅尺厂家_数显表维修-苏州泽升精密机械 | 宝元数控系统|对刀仪厂家|东莞机器人控制系统|东莞安川伺服-【鑫天驰智能科技】 | 福建成考网-福建成人高考网| 常州翔天实验仪器厂-恒温振荡器-台式恒温振荡器-微量血液离心机 恒温恒湿箱(药品/保健品/食品/半导体/细菌)-兰贝石(北京)科技有限公司 | 泥浆在线密度计厂家-防爆数字压力表-膜盒-远传压力表厂家-江苏大亚自控设备有限公司 | 重庆网站建设,重庆网站设计,重庆网站制作,重庆seo,重庆做网站,重庆seo,重庆公众号运营,重庆小程序开发 | 流程管理|流程管理软件|企业流程管理|微宏科技-AlphaFlow_流程管理系统软件服务商 | 上海律师咨询_上海法律在线咨询免费_找对口律师上策法网-策法网 广东高华家具-公寓床|学生宿舍双层铁床厂家【质保十年】 | 卡诺亚轻高定官网_卧室系统_整家定制_定制家居_高端定制_全屋定制加盟_定制家具加盟_定制衣柜加盟 | 广东佛电电器有限公司|防雷开关|故障电弧断路器|智能量测断路器 广东西屋电气有限公司-广东西屋电气有限公司 | 北京中航时代-耐电压击穿试验仪厂家-电压击穿试验机 |