“萬物智能化”變革,英特爾視頻云解決方案賦能互聯網+
超視頻時代,什么樣的技術會成為底座?
“2個半小時的時間,我緊張得滿身大汗。”李輝欽談起第一次直播帶貨的情景,自己都忍不住笑了。作為第一批到閩寧鎮掛職的專業技術人員,疫情期間重拾幾年沒玩的抖音,開通“李鎮長贊閩寧”,直播帶貨,推介閩寧鎮、推銷寧夏特產。再加上電視劇《山海情》熱播,全國人民自此知道了由福建(閩)與寧夏(寧)對口扶貧建立的這座移民小鎮,李鎮長的粉絲迅速增加,寧夏的枸杞、蘑菇、灘羊肉,也從李鎮長的直播間賣到了全國。
互聯網的普及,信息高速公路的建立,讓小小的手機正成為越來越多農民們的“新農具”,看得見的特產商品,在看不見的數據洪流的牽引下,走向全國、走向世界,“云經濟”成為助力脫貧攻堅、鄉村振興與共同富裕的有力抓手。
作為推動中國高質量發展的新型基礎設施,算力與帶寬的升級,為越來越龐大的音頻、視頻流提供了一條暢通無阻的高速公路,流媒體等數字技術發展下的互聯網+云技術,給產業、社會發展釋放了巨大的潛能與活力,成為企業數字化轉型新基建下的取勝之道。
1.解碼新基建
30多年的互聯網發展給中國帶來了翻天覆地的變化,正成為推動中國經濟發展的重要動力之一。數字經濟持續快速增長,信息技術與實體經濟加速融合,帶來的發展新動能逐漸壯大,已成為中國經濟增長新引擎。在這一過程中,從2013至2020年,我國移動互聯網接入流量由13億GB增長至1656億GB,年均復合增長率高達99.86%。截止至2021年6月,中國移動互聯網接入流量為1033億GB,同比增長38.6%。
谷歌預測,未來互聯網80%的內容呈現形式將是視頻。視覺化的信息代替了繁瑣、冗長、晦澀的文字、數據或符號,能更直觀地反映信息的實質,更直接地促成信息傳授雙方的交流。
中國互聯網信息中心發布的第48次《中國互聯網絡發展狀況統計報告》顯示,截至2021年6月,中國短視頻用戶規模為8.88億,短視頻應用人均單日使用時長已超120分鐘。
QuestMobile數據顯示,2020年中國互聯網廣告規模達到5439.3億,在媒介形態搶占廣告的能力上,視頻信息流增速更快,已經成為主流廣告形式,逐步取代圖文信息流的份額,典型廣告主在短視頻媒介投放預算明顯提高。根據中研普華的預測,短視頻平臺TikTok的廣告收入可能在2022年增加兩倍,達到110億美元以上,超過其競爭對手Twitter與Snapchat兩者之和。
從直播帶貨到短視頻宣傳,再到日益普及的遠程教育和移動辦公,視頻或者是價值挖掘的財富密碼,或者是傳遞價值的高速公路,優質且低成本的視頻提供能力,成為企業的核心競爭力之一,也拉近了人與人之間的距離,人類社會由此進入全新的發展階段。
這背后,是新型網絡基礎設施的鼎力支持。2018年,中央經濟工作會議首次定義了“新型基礎建設”,排在首位的就是信息基礎設施,包括以5G、物聯網、工業互聯網、衛星互聯網為代表的通信網絡基礎設施,以人工智能、云計算、區塊鏈等為代表的新技術基礎設施,以數據中心、智能計算中心為代表的算力基礎設施。
2.構建音視頻能力
在火山引擎聯合IDC發布的《超視頻時代視頻云演進趨勢》白皮書中指出,當今時代已經經歷了長視頻、短視頻與直播應用階段,進入超視頻時代。在這一時代,互聯網用戶對視頻有了更高的需求,對高清化、交互性、沉浸式的體驗有了更多訴求。視頻云也正在加速滲透到傳統行業,在工業、教育、醫療等傳統領域不斷涌現出更多的落地場景,這就對音視頻架構帶來了功能上、性能上和安全層面上的不同挑戰。其中,根據英特爾數據顯示,現在大數據90%以上來自于非結構化數據,以視頻和圖片為主,視頻數量與用戶的快速增長對帶寬和性能帶來巨大壓力,如何進行優化是很大的一個課題。
2022年2月,國家“東數西算”工程全面啟動,啟動建設國家算力樞紐節點,并規劃了10個國家數據中心集群。在應用西部算力資源計算的東部數據中,視頻數據占比不可小覷。這些數據來自眾多異構監控平臺,數量巨大且有著不同的標準。這就要求算力基礎設施,必須能夠支撐海量視頻數據的存儲、分析、索引、檢索、轉碼、應用等,避免分區域分環節的視頻存儲與應用,并能將不同設備、不同平臺、不同標準的視頻資源集中起來,實現有效共享與整合利用。
同時,機器學習、計算機視覺、自然語言處理等AI應用也在興起,這些都意味著頻繁地對存儲器進行訪問與數據傳輸,這就突破了傳統的馮諾依曼計算機體系架構,作為算力基礎設施的數據中心和智能計算中心,需要有針對性的解決方案。
不斷演進的數據中心需要一個全新的智能架構。在英特爾中國云&大數據高級首席工程師程從超看來,這種智能數據中心架構將擁有三類計算單元——用于通用計算的CPU、用于特定應用或特定工作負載加速的XPU以及用于基礎設施加速的IPU——它們將通過可編程網絡相互連接,從而有效利用數據中心資源。尤其是,面對多元化媒體應用中的性能密集型負載,超強的算力和對加解密和轉解碼過程實現加速的能力,可以大幅度提高圖像處理、圖像識別視頻分析等人工智能應用的效率。
如果說X86 CPU鑄就了英特爾輝煌的過去,IPU則成為英特爾打開未來世界的鑰匙。IPU是一種可編程網絡設備,旨在使云和通信服務提供商減少在中央處理器(CPU)方面的開銷,釋放寶貴的CPU內核資源。利用IPU,客戶能夠部署安全穩定且可編程的解決方案,從而更好地利用資源,平衡數據處理與存儲的工作負載,從而大幅提高數據中心收益。GPU則大大提高了應用程序對二維三維圖形和圖象的處理能力。此外,在處理密集型數據和并行數據計算方面,GPU可以提供數十倍乃至于上百倍于CPU的性能,因此在大規模并行計算應用領域,諸如光影處理、金融分析、醫療成像、油氣勘探、地理信息、基因分析和科學計算等等,開始發揮越來越大的作用。更重要的是隨著AI的出現,GPU適合大規模并行的浮點運算、矩陣計算的特點得到充分發揮。
但不管是CPU還是GPU,僅憑單一的架構來實現更高的計算效率顯然并不現實。采用CPU+GPU的異構計算模式(包括CPU+協處理器、加速處理器等),將成為一種趨勢。
3.流量的密碼
在2021年的CVPR上,由AI Benchmark舉辦的「移動AI挑戰賽」引人關注,而在其中「實時移動端檢測場景賽」上獲得冠軍的隊伍,成績相比第二名高出了八倍還多。
這場比賽要求使用移動端深度學習框架TensorFlow Lite CoreML運行實時移動端場景檢測,要求AI算法對攝像頭輸入的圖像實時預測出其場景類別,共有30個場景類別,訓練集卻只有9900張圖片,對于人工智能來說,存在很大的過擬合風險。
來自字節跳動的ByteScene團隊利用遷移學習方法拿出了一個容量僅為8.2Mb的小模型,實現了95%的Top 1識別準確率,平均延遲僅4.4毫秒。
現在,這種實時移動端場景檢測技術在抖音和剪映等產品里已經落地應用。由于操作簡單,使用體驗智能化,這項技術提升了App上的用戶體驗。這也是火山引擎正在對外輸出的技術能力。
火山引擎是字節跳動旗下的云服務平臺,依托云計算、大數據、人工智能等技術能力,為客戶提供技術產品與解決方案,包括基礎架構、云原生、個性化推薦、音視頻處理能力等等在抖音、今日頭條、西瓜視頻等應用上所實現的技術。
隨著視頻云服務進入超視頻時代,互聯網用戶對視頻有了更極致的需求,不再僅僅滿足于清晰流暢的觀看體驗,而是對高清化、交互性、沉浸式的體驗有了更多訴求。同時,視頻云對傳統行業的滲透在不斷加速,在工業、教育、醫療等領域,涌現出更多元的落地場景,而這些場景也對音視頻架構帶來了在功能、性能和安全層面的不同挑戰。
隨著需要處理的數據體量不斷攀升,音視頻應用對計算和存儲架構性能的要求也日益嚴苛。尤其在高吞吐量、大數據量請求的場景下,需要尋求一種可以經濟高效地擴展容量同時又不影響系統性能的方案。
火山引擎在助力企業應用落地的過程中,在架構上探索出了一條創新路徑——通過端云一體的整體架構,從邊緣基礎設施的支撐、計算+網絡的數字基礎服務到視頻云的應用解決方案提供生產、存儲、處理到分發的全棧能力。
正如火山引擎總經理譚待所說:“如果平臺架構不好用,為用戶體驗而生的視頻云服務根本無從實現。在邊緣基礎架構之上,視頻云還需進行大量的編解碼、AI分析等算法處理,如何承載超大規模實時處理需求,這對中心架構帶來了諸多挑戰。”
雖然通過擴充內存的方法,可以實現增強時延和吞吐的性能優勢,但這種解決方案能夠擴展的容量始終有限,而且DRAM內存高昂的價格以及更多機架位占用所帶來的成本,還會大大推高TCO。為此,火山引擎利用英特爾?傲騰?持久內存和英特爾?至強?可擴展處理器對內容信息業務的存儲架構進行了深層次優化,既能突破存儲介質和架構的局限性,還能在保證性能的前提下實現投入產出上的增益。
英特爾?傲騰?持久內存不僅具備接近DRAM內存的性能,還具備SSD的數據持久性,可以很好地彌補DRAM內存和SSD之間的性能缺口;其相對于DRAM內存的大容量、低成本特性,還能助力企業在容量與成本之間取得更好的平衡。
火山引擎在使用英特爾?傲騰?持久內存的App Direct模式下,持久內存通過內存總線直接連接到處理器,應用程序可以繞過操作系統,無需驅動程序、系統調用、中斷和上下文切換就能從用戶空間直接訪問持久內存上的數據,因此,系統幾乎沒有軟件開銷,時延約為100ns-300ns,不僅優于SSD,更是具有接近DRAM內存的性能,可以很好地滿足高峰期間對數據訪問速度的需求。
這種模式還具備數據持久性。不論遇到意外斷電還是計劃中的停機,持久內存中的數據都能得以持久保存,從而能提升存儲可靠性、增加系統的業務彈性、縮短系統重啟時間并提升推薦系統的故障恢復速度。
同時,為實現超高清需求,轉碼性能是關鍵。作為新一代的視頻編解碼標準,H.265/HEVC(HighEfficiencyVideoCoding,高效視頻編碼)在高壓縮比下依然能確保高清晰的視頻質量,受到各大視頻直播平臺的青睞,但因其算法和數據結構的復雜性,使其編解碼的復雜度4倍于上一代H.264編解碼器,因此對執行轉碼工作的處理器的性能要求,就顯得格外突出。
英特爾?至強?可擴展處理器,為包括轉碼在內的視頻直播流程提供性能支撐。同時,英特爾?至強?可擴展處理器內置的英特爾?高級矢量擴展512(英特爾?AVX-512)則進一步強化了它的表現。強大的轉碼性能保證了視頻在H.264、wma、rmvb、avi等格式間快速轉換,并通過靈活、簡潔的播放器,幫助直播運營者通過移動應用、網頁等各種展示方式迅速且全方位地覆蓋觀眾。
4.邁向新紀元
對于應用而言,關鍵的就是體驗。在超視頻時代,更高清、更交互、更沉浸的視頻技術需求日新月異,技術的優化可以讓更多的互動玩法和商業場景成為可能。2021年10月份,美國社交平臺臉書首席執行官馬克·扎克伯格宣布,臉書公司更名為“元”,公司未來將以元宇宙相關業務優先。例如增強現實和虛擬現實等沉浸式體驗,將元宇宙帶入生活,幫助人們建立聯系、發展業務,構建社交技術的下一次發展。
元宇宙的基本特征包括:沉浸式體驗、虛擬化分身、開放式創造。要實現元宇宙,需要一系列IT新技術的綜合運用,包括網絡及運算技術(5G、6G、物聯網、云計算、霧計算及邊緣計算)、管理技術(能耗管理、資源管理、會話管理及時空一致性管理)、虛實對象連接、建模與管理技術(X聯網、身份建模、社會計算、去中心化管理技術)、虛實空間交互與融合技術(拓展現實、電子游戲技術、腦機接口技術)等。
元宇宙、沉浸式體驗,以及大規模的人工智能部署,也對未來圖形處理產品提出了要求,需要實現高度的視覺保真、優化的人工智能和連續的計算。這就為云時代的數據中心帶來強勁的新需求,需要新的架構,實現智能計算、海量數據處理、異構算力融合與加速、多負載應用支撐。
在程從超看來,對于虛擬現實/增強現實,需要底層基礎設施能夠支撐,前端設備能夠播放,網絡能夠傳輸,后臺的數據中心,能夠對VR增強性的渲染批量、實時高效的處理。為此,英特爾已經建立了穩健的加速計算系統和顯卡路線圖,橫跨從客戶端到數據中心的所有產品,助力客戶應對數字時代的不同需求。
對于未來的數據中心,英特爾認為會有四個特點:實現計算與存儲的物理分離和邏輯融合,實現安全特性在芯片內部架構的整合,實現更靈活的硬件、軟件、應用和服務,軟件將以微服務形式呈現,實現無處不在的異構計算。
“無處不在的計算”,正是英特爾CEO帕特·基辛格所提出的“人類數字社會擁有的四種超級技術力量”之一,與無所不在的連接、從云到邊緣的基礎設施以及人工智能,幫助人類持續增長,不斷創新,全面賦能“萬物智能化”的變革。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。