2018年,你的朋友圈有沒有被短視頻刷屏呢?上到白發蒼蒼,下到咿呀學語,短視頻不僅用戶覆蓋了各個階層和年齡段,連創作者也覆蓋了各類人群。行業迎來了全面爆發,意味著關注度、吸金力和研發重視程度都已今非昔比。那么究竟是哪些因素導致了在背后推動了短視頻的全面爆發呢?

CDN如何保障視頻質量

本質上來看,短視頻與直播采用的是一類技術,二者相比傳統視頻都對延遲和秒開有著較高的要求,這一點在移動時代更顯得尤為突出。

是從2015年10月移動端直播出現開始,視頻行業的發展就接入了高速軌道。2016年號稱移動直播元年,2017年又成為了移動直播的下半場。走到今天,不少移動直播的末端企業已經無力回天,流量競爭已經越來越集中在頭部客戶中。這些客戶的競爭主要集中在視頻質量和內容吸引力等方面。評價視頻質量主要包括延遲、秒開、卡頓等三個主要參數。

延遲一般會在三個環節中產生,一是推流;二是CDN傳輸的過程,但這個延遲很小只有幾十毫秒;三則是在播放端會有2到3秒左右的延遲。不過并不是所有的延遲都是不允許出現的,對延遲要求最高的直播行業中,不同直播類型對延遲控制要求不同,游戲類、社交類、秀場類的延遲會控制在3到5秒,這樣才能滿足主播與粉絲之間的文字交互不受影響;對于事件類和賽事類的直播,由于會涉及到一些特殊的因素,一般延遲會更大一些,在播出過程中會要求有15到30秒的延遲,這樣也方便做內容的審核。

秒開方面的實現,在離用戶最近的CDN邊緣節點緩存一部分數據,能讓用戶在幾十毫秒內看到音視頻;而且,短視頻和直播不同,一些熱點短視頻很容易在邊緣網絡中存儲,然后在手機端進行加速,可以進行預加載幫助實現秒開。

再者,傳統網絡和終端的細節也會有所影響,比如DNS和播放器的細節問題進行優化。典型問題就是最后一公里的網絡,即從手機到最近的節點的距離。由于用戶可能會身處戶外或者信號不好的地方,很容易導致延遲產生。

解決這一問題有多種辦法,比如金山云推出了一款雙邊加速產品,幫助解決邊緣網絡難題,提高觀看質量。另外也可以讓碼率在傳輸過程中降低,然后在終端實現增強,這種碼率的自適應方式可以通過算法感知到用戶終端播放過程中網絡問題,動態的切換到適應的碼率上,以保障視頻播放用戶的體驗。

人工智能是短視頻行業的重大利好

視頻質量的保障靠CDN,而另一大競爭點內容吸引力則要靠人和人工智能了。在以往,視頻是一種特殊的內容,只有人才能夠理解、欣賞和應用。在人工智能崛起后,機器在人工智能的幫助下也能夠做到人的部分工作,從本質上使得視頻行業發生了轉變。

視頻吸引力的保障一方面需要優質的視頻作者或主播源源不斷的提供素材,另一方面就要看視頻本身的因素了,這包括了內容的安全和對用戶的傳遞。而且AI能做到的越來越多,包括了軟件檢測、物體檢測、視頻分析、視頻分類、違規視頻檢測等,通過硬件和軟件的提升可以在平臺上將AI的速度和性能兼顧以達到最佳效果。內容安全方面,在內容識別領域可以通過分析找出違規或者不允許的內容,高效而且降低了人力成本;圖像增強方面,AI能夠通過算法將一些不太清晰的視頻細節恢復出來,既節省了傳輸帶寬,又增強了用戶體驗。

AI的出現對于視頻行業意味著什么呢?這可能是一種顛覆。AI模型可以對機器進行訓練,讓機器能夠識別視頻,并且在很多領域實現應用,在安防領域的識別,訓練過的機器一個月幫助公安局多抓500名逃犯;而民用領域,色情、恐暴等內容也會無處遁形。AI對視頻行業帶來的是重大的利好。

對于機器學習,一個優質的訓練平臺可以實現事半功倍的效果。目前英特爾主推的至強可擴展處理器可以很好的進行 influence,英特爾一方面會幫用戶進行測試選型,從不同的 CPU型號中選擇最適合的主頻和核數的 CPU來支撐用戶業務,提供最好的性能和 TCO;另一方面則是提供針對英特爾平臺優化的深度學習軟件框架使至強 CPU性能的得到最大發揮,英特爾工程師也可以根據用戶的具體需求進行有針對性的調優,比如根據拓撲結構等進行特定的算法優化,借助英特爾的平臺提升深度學習的性能。通過提供英特爾優化版 Caffe、TensorFlow、MXNet等機器學習框架,用戶可以最大程度利用英特爾至強可擴展處理器的 AVX-512指令集來達到性能提升,在終端設備上英特爾提供的 Movidius VPU等硬件加速器也可以實現圖像及視頻的分析加速,通過引入英特爾 FPGA等更多的新硬件也能夠在提供高性能的同時進一步降低延遲。