有沒有在直播間看到過“二次元”的主播形象?
早在國內(nèi)直播誕生之初,一些渴望與觀眾增強互動,但比起真人出鏡更喜歡在數(shù)字世界啟用“二次元”形象的主播,就常常搬出虛擬小人兒代表自己。不過,彼時的虛擬形象往往起不到真正的互動作用:它們可能是根據(jù)攝像頭和粗糙算法打造的動作、表情十分不自然的提線木偶;要不就根本完全是由軟件生成的,只會隨機亂動,與主播真人可是沒一點兒關(guān)系的二次元形象。
究其就里,真正制作一個基于動捕的、精細的二次元形象,對個人主播來說未免成本太高;就算舍得下本兒,在酒店、居家的直播環(huán)境里安排一套動捕設(shè)備,對主播PC算力也提出了很高的要求。
但是,如果平臺來做,情況就不同了。一部分直播平臺,已經(jīng)在考慮為部分主播提供“半官方”的二次元形象及配套技術(shù)。主播欠缺的算力,將由“云”來解決。
而這僅僅是直播上“云”的其中一個方向而已。
直播的4K畫質(zhì)從哪兒來?
今年11月,在虎牙直播觀看LOL S9總決賽的觀眾驚喜地發(fā)現(xiàn),在選擇直播畫面清晰度時,赫然出現(xiàn)了一個極為罕見的“4K”選項。
普通畫質(zhì)與4K畫質(zhì)(下圖)對比
看過爽過之后,我們不免思考,是騰訊電競舍得花錢輸出“高人一檔”的視頻,還是虎牙為了聲勢浩大的S9不惜“深入基層”,手把手帶著主辦方推流,把常見的“藍光8M”抬到4K?
都不是。這兩種方案的成本,對于賽事方和直播平臺而言都太高,雖說清晰度的選擇已不受桎梏,但為了為期僅半個月的賽事花費如此高昂的成本,早已令眾多直播平臺望而卻步。
真正讓畫質(zhì)提升到4K,是AI的功勞。在技術(shù)層面,虎牙擺脫了傳統(tǒng)的重建技術(shù),利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)構(gòu)筑“超分辨率AI”,用以優(yōu)化超分模型以及計算推理能力,以此提高畫質(zhì),滿足4K、60FPS的實時處理需求。簡而言之,S9賽事的4K直播,就是AI通過計算增強畫質(zhì)的結(jié)果。直播畫質(zhì)的提升,還是要靠技術(shù)。
虎牙CTO賴立高表示,有大約10%的觀眾觀看了4K畫質(zhì)的S9比賽,這也讓虎牙在游戲直播領(lǐng)域的口碑達到了一個“小高潮”。
讓觀眾有口皆碑的絕不僅是一個4K。提升后的20M碼率視頻,在分發(fā)上則更需倚賴各家云服務(wù)的分發(fā),以全面提升體驗。實際上,如果我們單純以為無限地提升清晰度就可以滿足觀眾需求,就會陷入重大誤區(qū)。這一誤區(qū)在4G到5G時代的跨越中屢屢出現(xiàn),問題就是:如果帶寬提升了,我們是否還要堅持用老內(nèi)容將新帶寬填滿?比如在直播行業(yè),如果帶寬大了10倍,我們的像素就要多10倍嗎?
很顯然不是的。觀眾對直播畫質(zhì)的要求不是“清晰度”一個詞可以概括的,嚴(yán)格來說,是同時伴隨三個維度的要求:超清、極速、流暢。
超清不必多說。極速指的是,從進入直播間開始,畫面幾秒鐘可以出來,也就是載入速度??蓜e小看這幾秒鐘的差距,同時舉著手機看直播,有的人早已看到得分,但有的人還停留在后場緊逼階段,觀看體驗不可同日而語,以虎牙直播S9賽事為例,相比之下,虎牙可以快3到10秒左右。
而流暢則指的是直播是否會斷斷續(xù)續(xù),觀眾是在看視頻,還是在看幻燈片。在網(wǎng)絡(luò)條件有限時,這一問題也嚴(yán)重困擾著許多用戶。要實現(xiàn)平穩(wěn)的觀看體驗,云計算的分發(fā)方案仍然必不可少。
S9的“4K體驗”告訴我們,有了AI助力,直播輸出不僅可以“與視頻源頭不同”,甚至“比視頻源頭更好”。除了在清晰度、速度和穩(wěn)定性上的提升,云服務(wù)、AI及多種配套解決方案,還能讓直播有更多變化。
新生產(chǎn)、新內(nèi)容、新輸出
直播并非是純粹的“技術(shù)活兒”。以今日直播而言,它本質(zhì)上還是個內(nèi)容行業(yè)。直播平臺起到的作用,不僅是提供渠道,招攬主播人才,吸納PGC內(nèi)容(如網(wǎng)綜、電競等),也應(yīng)該為內(nèi)容的生產(chǎn)、加工負責(zé)。
讓我們回到文章開頭:雖然也有一些主播不在意自身是否出鏡,但更多主播仍然樂意以真人、或者以二次元形象“露臉”, 這一方面是“網(wǎng)絡(luò)原住民”一代二次元精神的體現(xiàn),另一方面是直播產(chǎn)業(yè)、直播產(chǎn)品本身的規(guī)律。
簡而言之,主播出鏡的意義并非是為了“露臉”,而是為了提升觀眾的體驗,增強他們的參與感?!白畲蟮男枨笫羌拍辈サ谋举|(zhì)是陪伴”,單純將內(nèi)容“塞”給觀眾的直播,即便內(nèi)容再妙、再美、再清晰,也可能乏人問津。
這種全方位的參與和互動體驗,是直播與視頻的最大差異;在這個角度上,直播與游戲反而比較相似??紤]到內(nèi)容都在云上,游戲直播其實在用戶體驗上與“云游戲”有類似的追求。如今,直播平臺也紛紛意識到了這一點,只不過,該怎么讓用戶有更多的參與和互動成為了各大廠商的考量。
其實現(xiàn)在的游戲直播也或多或少能夠做到“互動”。主播會回應(yīng)彈幕的要求進行相關(guān)操作,實際結(jié)果是用戶自己的“自娛自樂”。發(fā)出彈幕、看到彈幕、理解彈幕、執(zhí)行彈幕,這個鏈條太長,考慮到網(wǎng)絡(luò)延遲,很多時候會有幾秒到幾十秒的“延遲”。用戶對游戲直播怎樣提升互動,關(guān)鍵就在這個“延遲”上。
未來,我們完全可以想象:
1. 如果游戲直播與彈幕互動的延遲縮小到幾毫秒、幾微秒,看直播發(fā)彈幕就會“即時生效”;
2. 如果直播畫質(zhì)可以提升到當(dāng)今乃至次世代大作的水平(比如4K),看直播的體驗與玩游戲就會非常相似;
3. 如果在此之上可以撇開單一內(nèi)容而輸出“千人千面”的差異結(jié)果,那么,云游戲會讓游戲直播產(chǎn)生全新的內(nèi)容形態(tài)和互動體驗。
不用多說,對延遲、清晰度的追求,還要依靠云計算以及云上的AI;而輸出“千人千面”內(nèi)容,自然也只可能是AI的工作。
實際上,AI已經(jīng)開始了對主播“二次元”形象的改造。2019年11月的虎牙LiveTech大會上,虎牙推出了行業(yè)首個直播數(shù)字人,是一種更高層次可成長的虛擬主播,將直播更大程度地變成一種“創(chuàng)造”。畢竟,比起依靠自家PC算力,依靠整個云計算強大的算力構(gòu)建時效更強、互動性更高的虛擬數(shù)字形象顯然更有利于降低成本。
虎牙CTO賴立高提到,虎牙今后會將數(shù)字化主播視為直播內(nèi)容生產(chǎn)的一部分,為主播提供相應(yīng)的生產(chǎn)工具。對于已經(jīng)知名大主播,結(jié)合云+邊緣計算、AI及官方提供的動捕設(shè)備,他們將有能力輸出“數(shù)字人”形態(tài)的直播。而對于廣泛分布的小主播,由于有云計算的幫助,他們也可以輸出遠超個人PC算力所能覆蓋的,高清晰、低延遲、強互動的二次元形象。
多方位解決方案
近日,虎牙與華為簽署了戰(zhàn)略合作協(xié)議。雖然虎牙直播早在此之前便與華為云搭橋,但這次的戰(zhàn)略合作意義非凡。華為云帶來的并不只是“中規(guī)中矩”的標(biāo)準(zhǔn)云服務(wù)而已。以整體服務(wù)和細節(jié)把控,為每位使用虎牙直播的用戶帶來最完善的觀看體驗。
在虎牙逐步上云的過程中,華為云能協(xié)助虎牙解決問題,尋求高效方案,并不斷開拓新的機會。真正意義上做到“以細節(jié)做大事”。
此次戰(zhàn)略合作協(xié)議涉及到很多新時代的“解決方案”,比如:在生產(chǎn)和分發(fā)層面,基于高性價比的華為云“鯤鵬+昇騰”計算池,高效虛機+裸機混合資源管理,提供直播轉(zhuǎn)碼、彈幕功能下沉到邊緣功能,打造個性化美顏、同城同場景、云游戲、AR\VR等新體驗。在成本層面,虎牙本身擁有深厚的技術(shù)積累,利用其回源轉(zhuǎn)碼架構(gòu),可以靈活使用云廠商的轉(zhuǎn)碼能力。如此一來,華為提供麒麟GPU進行轉(zhuǎn)碼加速,對比同類GPU方案能進一步節(jié)省成本。關(guān)注新技術(shù)。抓緊5G+AI時代熱點,依賴AI進行虛實結(jié)合、智能推薦、千人千面、AI 彈幕、情緒識別、實時字幕等業(yè)務(wù)場景創(chuàng)新。關(guān)注新媒介。在Cloud VR視頻業(yè)務(wù)及Cloud VR強交互業(yè)務(wù)(如游戲)上,利用華為自研渲染芯片等方面優(yōu)勢,合作進行VR內(nèi)容實時生產(chǎn)能力提升和成本降低等方面探索。
如果不關(guān)注“彈幕”、“美顏”這幾個細節(jié),我們甚至很難意識到這些“方案”會與直播平臺,尤其游戲直播有關(guān)。云計算結(jié)合定制化硬件芯片的能力,給直播帶來的改變,就是這樣全面且深刻的。
本篇文章轉(zhuǎn)載自公眾號【虎嗅APP】,作者錢德虎