想提升畫質又省頻寬錢?視訊平臺應該這麼選
隨著直播、短視訊等內容形態的全面爆發,視訊行業在度過“風口”期之後,如今已走入穩步發展階段,優質內容和使用者體驗成為了佔領市場高地的關鍵因素。
作為視訊行業的一名觀察者,我在與很多視訊行業的從業者交流的時候,發現他們對技術問題最擔心。視訊行業可以說是個應用最新科技較為快速的一個行業,如何吸引來使用者,靠的就是好的使用者體驗,使用者在你的平臺上觀看視訊時能做到清晰流暢不卡頓,這對一個視訊運營商的成本和運營提出了考驗,這對視訊從業者提出了難題。
這是因為,為使用者創造良好的體驗與頻寬成本的上升有著直接關係。如今,頭部的視訊平臺的頻寬成本基本都在億元級別,比如已在美國上市的虎牙直播,他們2018年第二季度財報就顯示,由於平臺上的平均月活增加和視訊質量提高導致頻寬使用量增加,頻寬成本達人民幣1.61億元。
在視訊服務中,想要有清晰流暢的觀感,就要承受高昂的頻寬成本,為了控制居高不下的頻寬成本,視訊運營商可謂是想了各種辦法,想要在成本和效果上達到平衡,但一直以來效果並不明顯。
這就是我寫這篇文章的原因。我們先請出今天的主角:阿里雲的窄帶高清、騰訊雲的極速高清、金山雲的集智高清。為什麼是這三家?第一,這三家目前在視訊行業上的聲量最大,而且據我瞭解,這三家雲服務商的產品,是視訊平臺首先考慮的物件。第二,除了這三家雲服務商,像華為、網宿也有類似的產品,但是他們基本上沒什麼聲音,而且我也沒有聽說他們的產品在哪家視訊平臺有應用,所以我們今天的盤點,就以三大雲服務商的“高清”類產品為主吧。
阿里雲的窄帶高清、騰訊雲的極速高清、金山雲的集智高清可以說是現在市場上的頂尖產品,他們有著共同的特徵——都號稱能以“黑科技”幫助視訊行業提升視覺效果、大幅節省頻寬,接下來,我們先來一一列舉他們各自的絕活兒,然後再幫大家分析他們的共性和差異,以便幫助視訊從業者選擇最為合適的產品。(PS:心急的可跳過產品介紹,直接看文章的總結部分)
窄帶高清
阿里雲作為國內雲端計算市場的老大哥,其實三年前就提出了窄帶高清的概念,它是一套以人眼的主觀感受最優為基準的視訊編碼技術,研究在頻寬受限情況下,如何追求最佳的視覺感受。2016年時,阿里雲推出了窄帶高清的1.0版本,2017年釋出了2.0版本,這個版本號稱“可用H264達到H265的效果,在720P解析度的情況下,讓視覺感官也能達到常規1080P的標準,這種技術可以將視訊的頻寬成本節省20%以上”。
無論是窄帶高清、極速高清還是集智高清,它們都試圖在成本和體驗之間尋求一種平衡,我們先說窄帶高清在這方面的努力,視訊播放流程包括採集、上傳、片源修復、轉碼引數分析、編碼切片、加密、儲存、分發、播放這九個步驟,那麼對於一個視訊平臺的使用者來說,在觀看視訊內容時,又會受到清晰度、解析度、位元速率、幀率、演算法這些因素的影響,窄帶高清需要從這些角度提高觀看體驗和降低成本。
在編碼前,窄帶高清會先對視訊內容有一個分析,會基於演算法判斷場景,分析內容中的動作、內容、紋理等元素,判斷內容是什麼型別,再根據使用者對此類片源的清晰度預期設定位元速率,選擇最佳解析度,這樣可以保證觀感和位元速率的合理。
舉個具體的例子,窄帶高清在優酷中的一些應用,以視訊網站B上的720P片源為例,優酷用540P的效果可以實現相當的效果,位元速率則節省40%以上。
採用窄帶高清的畫質對比(圖片來源:雲棲社群)
極速高清
騰訊雲的極速高清技術雖然晚於阿里雲的窄帶高清,但表現十分強勁。按照騰訊雲的說法,極速高清技術又可以稱之為“智慧動態編碼技術”,它運用機器深度學習,通過視訊場景智慧分類、編碼引數匹配、前置處理、編碼動態優化、位元速率智慧控制等技術,智慧處理視訊內容,匹配優質編碼引數,以更低的頻寬成本,為使用者提供高清視訊直播流。
首先,極速高清會通過深度學習形成各種視訊場景的模型庫,同時會分析和判斷實時視訊直播流,從而匹配相應的場景模型。接下來,再結合視訊原始碼率、解析度、幀率、紋理和運動變化等,選擇最合適的編碼引數。同時,根據場景分類和使用者對內容的要求,結合畫面紋理和實時運動檢測進行前置處理。
此外,極速高清還支援編碼動態優化,可針對不同視訊類別,同一個視訊內不同視訊段,應用完全不一樣的編碼引數,且支援編碼引數按幀實時更新生效。目前,騰訊雲的極速高清技術在國內視訊、直播等行業已經逐漸開始應用。
舉個例子,下圖是一個遊戲直播場景的對比圖,上圖顯示的是處理前的視訊截圖,大小4M,下圖是極速高清處理後的視訊截圖,大小2M,在騰訊雲的宣傳中,極速高清可在畫質不變的前提下,幫助視訊平臺節省頻寬成本。
遊戲直播視訊,大小4M(圖片來源:騰訊雲官網)
極速高清處理後視訊,大小2M(圖片來源:騰訊雲官網)
集智高清
作為排在阿里雲、騰訊雲之後的雲服務市場的老三,金山雲的集智高清推出的時候雖然晚,但可以說是後起之秀。與窄帶高清和極速高清相比,集智高清看似和前兩者相似,但其實也有著自己的特點。
集智高清通過深度神經網路對視訊畫面內容進行感知,優化主觀體驗和智慧調節編碼,對視訊進行畫質增強,提升視覺效果,適配更高清螢幕,改善視覺感受的同時,幫助視訊平臺節省20%—40%視訊傳輸頻寬,適用於多種視訊場景。
在視訊場景分類上,集智高清通過深度學習方式,形成了十餘大類,幾十種小類視訊場景模型庫。視訊平臺在使用集智高清服務時,可根據不同的視訊場景進行分類實時識別,根據不同場景的識別結果,配置適合此類場景的編碼引數,根據紋理和運動變化幅度等,選擇最合適的編碼模板引數。
在處理視訊時,集智高清可對不同區域進行分層,針對每一層進行處理,保護人眼視覺核心區域,對此區域內的巨集塊編碼進行銳化、亮度增強等技術處理,減少不重要的區域的位元速率,將視域進行精細化處理,加強使用者的視覺體驗。
集智高清所包含的視訊畫質增強技術,則以更小的視訊檔案實現更清晰畫質和更低位元速率。如動態元素較多時,使用更高位元速率,相反則使用更低位元速率,針對視訊影象的靜止部分,分配更低位元速率,動態部分則分配更高位元速率。其中,集智高清主要對人眼關注區域進行畫質增強,相對弱化非重點區域,這樣既可以保證視訊的清晰流暢,又能夠降低位元速率,為視訊平臺節省成本。
在這裡我們列舉綜藝和遊戲兩個具體的例子。首先以熊貓TV出品的綜藝節目《Panda Kill》為例,集智高清針對節目中的燈光和反光點,通過AI建模,將人眼感受不到的燈光和反光消除,將紋理儲存下來,這樣節省了更多頻寬。
《Panda Kill》畫質對比(左為原片,大小5M,右為集智高清處理後視訊,大小3M),在金山雲的宣傳中,集智高清能夠在畫質不變的前提下,幫助視訊平臺節省頻寬
第二,我們以《英雄聯盟》的直播舉例。集智高清運用位元速率智慧控制和編碼動態優化,將AI畫質增強至視訊的細節中,畫質由此得到了提升。另外,集智高清根據人眼關注的內容做視覺感知保護,對佔位元速率的其它區域進行優化,實現畫質增強的同時節省了頻寬。我們從下圖中,集智高清處理前後的對比圖中即可看出。
遊戲直播視訊
集智高清處理後視訊
總結
說了這麼多,我們最後需要總結一下這三大產品的共性和差異。我們先說共性,無論是窄帶高清、極速高清還是集智高清,它們都是在如今視訊內容形態多元化的背景下,視訊行業由於競爭白熱化,平臺為了吸引使用者,紛紛採用技術手段提升觀感,降低成本的產物。
因此,三大產品均基於雲端計算、大資料、AI,通過深度學習建立視訊場景模型庫,基於演算法判斷場景,分析內容和紋理等元素,對視訊內容進行智慧處理以及調節編碼,以達到適配移動終端的高清螢幕,提升視覺效果和降低頻寬成本的目的。從這個角度上說,三個產品都是視訊平臺不錯的選擇。
我們再來說說差異。視訊企業選擇這三個產品的目的相同,但它們又各有千秋。首先,三個產品應用人工智慧技術的時間點不同。阿里雲的窄帶高清起步最早,起到了教育市場的作用,在時間上他們是領先的。但是在人工智慧技術的運用上,窄帶高清卻相對滯後,直到2017年窄帶高清的2.0版本釋出時,才有了諸如“基於智慧演算法來判斷視訊場景”這類帶有人工智慧的特點,而騰訊雲的極速高清和金山雲的集智高清在推出時,就天然包含人工智慧技術。不要忽視這個時間點的作用,這意味著,極速高清和集智高清在推出後,就有了與窄帶高清叫板的底氣。
第二,三個產品的應用場景不同。阿里雲的窄帶高清在優酷上支援高清劇集的例子說明,這個產品在點播上應用得最為廣泛。騰訊雲的極速高清宣傳的一個重點是助力央視網今年的世界盃直播,所以體育賽事類的直播是他們的重頭戲。金山雲的集智高清則集中在遊戲、綜藝和秀場直播上面,這三個場景是他們的“最愛”。
以上就是我的觀點,希望各個視訊平臺在選擇適合自己的產品和服務時,本文能夠帶來一點幫助和啟發。