美譽(yù)度品牌管理
近年來,視頻化正呈現(xiàn)出從互聯(lián)網(wǎng)向全行業(yè)滲透的趨勢(shì)。視頻已從一項(xiàng)單純的功能,發(fā)展為企業(yè)推動(dòng)用戶增長(zhǎng)、提升業(yè)務(wù)效率和增加商業(yè)變現(xiàn)的關(guān)鍵手段,并重塑營銷、知識(shí)、商業(yè)和空間的交互體驗(yàn)。
我們的生產(chǎn)生活越來越離不開視頻,視頻云也被賦予了重要的使命。
顧名思義,視頻云是一項(xiàng)覆蓋了從視頻生產(chǎn)、處理、分析到消費(fèi)的全鏈路技術(shù)能力,這一產(chǎn)業(yè)自移動(dòng)互聯(lián)網(wǎng)發(fā)展以來持續(xù)壯大,是云計(jì)算領(lǐng)域的一條主賽道。
當(dāng)下,隨著AI、VR/AR等技術(shù)帶來新的生產(chǎn)力變革,云計(jì)算公司開始把這些新技術(shù)與視頻云充分融合,形成驅(qū)動(dòng)體驗(yàn)創(chuàng)新的新基石。
8月22日,字節(jié)跳動(dòng)旗下的火山引擎舉辦了一場(chǎng)視頻云&AIGC技術(shù)大會(huì),首次公布其視頻云產(chǎn)品與爆火的AIGC(生成式AI)領(lǐng)域的重磅成果,覆蓋芯片、框架及方案各個(gè)方面,面向全行業(yè)視頻化時(shí)代交出一份“新答卷”。
視頻化時(shí)代面臨什么樣的機(jī)遇和挑戰(zhàn)?AI與VR/XR等技術(shù)如何影響視頻云技術(shù)走勢(shì)?行業(yè)滲透與視頻化應(yīng)用融合,火山引擎視頻云又有哪些布局?
對(duì)話火山引擎視頻云負(fù)責(zé)人Yongyuan,我們對(duì)此進(jìn)行了深入探討。
一、從傳統(tǒng)到AI,視頻云要飛躍三道技術(shù)新邊界
進(jìn)入全行業(yè)視頻化時(shí)代,算力、體驗(yàn)和交互層都面臨“新邊界”。Yongyuan談到他的洞察:
第一是算力邊界。視頻數(shù)據(jù)體量激增,分辨率和清晰度持續(xù)提升,算力瓶頸是當(dāng)前視頻行業(yè)面臨的最大挑戰(zhàn)。
第二是體驗(yàn)邊界。用戶持續(xù)追求更清晰、更流暢的極致體驗(yàn),處理的算法和流程要跳出現(xiàn)有框架探索體驗(yàn)邊界。
第三是交互邊界。沉浸式媒體方向在持續(xù)加溫,蘋果發(fā)布的Vision Pro帶來了新憧憬,2D畫面的邊界向3D畫面突破。
為了探索這三個(gè)邊界,火山引擎已經(jīng)采取了一系列探索和實(shí)踐。
1、探索算力邊界,火山引擎推出兩“芯”
首先來看一組數(shù)據(jù),Yongyuan告訴美譽(yù)度,視頻所消耗的算力要比圖片大上百倍,比文字大上萬倍,對(duì)算力需求極大。為了應(yīng)對(duì)這些挑戰(zhàn),火山引擎自研了一系列底層硬件技術(shù)。
8月22日,火山引擎自研視頻編解碼芯片、自研ARM陣列服務(wù)器等技術(shù)首次公開,揭開了火山引擎視頻云的底座基石。基于抖音的大規(guī)模應(yīng)用實(shí)踐和打磨,火山引擎實(shí)現(xiàn)了從通用計(jì)算到異構(gòu)計(jì)算的躍進(jìn),沉淀了可為不同視頻場(chǎng)景提供專用且適用的算力支持。
據(jù)稱其自研視頻編解碼芯片相對(duì)主流硬件編碼器能提升超30%的壓縮效率,一臺(tái)芯片服務(wù)器的轉(zhuǎn)碼能力,相當(dāng)于百臺(tái)CPU服務(wù)器的算力,可用于視頻點(diǎn)播、視頻直播、VR點(diǎn)/直播、圖片轉(zhuǎn)碼等多個(gè)場(chǎng)景。
▲自研視頻編解碼芯片成果
Yongyuan說,這一芯片集成了整個(gè)字節(jié)貼合業(yè)務(wù)的優(yōu)質(zhì)編解碼和前處理算法,從而實(shí)現(xiàn)效果和效率的大大提升。
同時(shí),火山引擎視頻云還自研了ARM陣列服務(wù)器。據(jù)稱,其在轉(zhuǎn)碼場(chǎng)景相比x86資源可以實(shí)現(xiàn)成本節(jié)省超40%,在云游戲場(chǎng)景對(duì)比同類服務(wù)器有非常高的性價(jià)比。同時(shí),通過云原生技術(shù)對(duì)ARM異構(gòu)陣列服務(wù)器進(jìn)行管理和調(diào)度,其實(shí)現(xiàn)了存儲(chǔ)和計(jì)算分離,保障用戶數(shù)據(jù)安全。
2、探索體驗(yàn)邊界,火山引擎全面布局AIGC
AIGC正卷入視頻業(yè),全方位地改變音視頻行業(yè)的玩法。Yongyuan告訴美譽(yù)度:“AIGC技術(shù)作為一種新的視頻內(nèi)容生產(chǎn)方式,包括內(nèi)容生產(chǎn)效率、豐富度、個(gè)性化程度都會(huì)大大提升?!?/p>
可以看到,在抖音等短視頻平臺(tái)上,很多人已經(jīng)習(xí)慣了使用各種智能特效進(jìn)行創(chuàng)作,也更頻繁地看到虛擬數(shù)字人直播賣貨等內(nèi)容,AI已經(jīng)融入到了人們的視頻體驗(yàn)中。而為了讓更多人能用上這些前沿技術(shù),字節(jié)正通過火山引擎為外部提供技術(shù)服務(wù)。火山引擎此前推出的智能創(chuàng)作云,就支持了更多企業(yè)進(jìn)行智能化內(nèi)容創(chuàng)作。
簡(jiǎn)單來說,火山引擎智能創(chuàng)作云是一個(gè)智能內(nèi)容生產(chǎn)平臺(tái),為企業(yè)提供各類AI賦能的創(chuàng)作工具、編輯技術(shù)、正版素材和流程管理。目前,火山引擎智能創(chuàng)作云已經(jīng)探索推出AIGC腳本撰寫、文生圖、批量海報(bào)制作、數(shù)字人分身等多項(xiàng)能力。
不同于個(gè)人創(chuàng)作,企業(yè)視頻創(chuàng)作面臨創(chuàng)意缺乏、工具難用、協(xié)作困難、難以持續(xù)等更復(fù)雜的挑戰(zhàn),智能創(chuàng)作云則從創(chuàng)意策劃、視頻制作、內(nèi)容發(fā)布到數(shù)據(jù)回饋,從每一個(gè)環(huán)節(jié)降低內(nèi)容創(chuàng)作者的創(chuàng)作門檻。比如,國內(nèi)知名房屋租賃服務(wù)公司自如就借助火山引擎智能創(chuàng)作云,通過“剪同款”API能力,批量制作房源介紹視頻,引導(dǎo)用戶點(diǎn)擊VR看房,從而增加了房源曝光率。
AI能力不僅改變了視頻內(nèi)容生產(chǎn)的方式,還為視頻處理提供了更多可能。AI影片修復(fù)是一個(gè)典型代表場(chǎng)景。就在8月16日,火山引擎、抖音聯(lián)合中國電影資料館宣布將對(duì)100部香港經(jīng)典老電影進(jìn)行4K修復(fù)。這是其首次將AIGC視覺大模型應(yīng)用于老片修復(fù)中,在觀影活動(dòng)中得到了一致好評(píng)。
▲修復(fù)前(左),修復(fù)后(右)
追溯其背后技術(shù),本次修復(fù)師基于AIGC大模型完成,這相比傳統(tǒng)的影片修復(fù)有什么不同?
Yongyuan告訴美譽(yù)度,相比于傳統(tǒng)的去噪、插幀等算法以及先前的AI技術(shù),火山引擎采用的AIGC視覺模型是關(guān)鍵差異點(diǎn)。借助其強(qiáng)大的生成能力和豐富的先驗(yàn)知識(shí),實(shí)現(xiàn)修復(fù)效果在清晰度、色彩、流暢度和瑕疵消除等方面的全方位提升。針對(duì)老片修復(fù)場(chǎng)景,火山引擎對(duì)AIGC視覺大模型進(jìn)行了生成質(zhì)量、視頻任務(wù)和效率方面的算法優(yōu)化,讓視覺大模型能夠在視頻場(chǎng)景下更加穩(wěn)定、優(yōu)質(zhì)、高效地輸出內(nèi)容。
實(shí)際上,火山引擎視頻云的很多產(chǎn)品能力都有AI技術(shù)的加持,例如“智能轉(zhuǎn)檔”使用了AI重采樣方案,滿足了高質(zhì)量多碼率分發(fā)需求,支持直播、點(diǎn)播多檔位畫質(zhì)提升。 “極智超清”是基于人眼的主觀感受最優(yōu)為基準(zhǔn)的AI前處理方案,該方案不僅可以提升主觀畫質(zhì),還可以進(jìn)一步實(shí)現(xiàn)整體帶寬降低15-35%。
3、探索交互邊界,基于PICO打造VR直播等應(yīng)用
在探索交互邊界方面,火山引擎視頻云基于在字節(jié)跳動(dòng)旗下VR品牌PICO 上的實(shí)踐和探索,沉淀了很多優(yōu)質(zhì)的能力。
比如,火山引擎的VR 360°全景圖像技術(shù)在今年CVPR Workshop舉辦的一項(xiàng)比賽中,雙目超分雙三次插值保真賽道和360°全景圖像超分賽道上,榮獲了雙料冠軍,技術(shù)能力達(dá)到行業(yè)領(lǐng)先水平。本次火山引擎還推出了8K 360度 VR直播云制播解決方案,據(jù)稱能大大降低VR內(nèi)容的開發(fā)和消費(fèi)門檻。
可以看到,從通用算力到異構(gòu)算力、從傳統(tǒng)到AI、從二維到三維,視頻行業(yè)已被新技術(shù)掀起陣陣新浪潮,而火山引擎已經(jīng)加速布局。
二、從互聯(lián)網(wǎng)到傳統(tǒng)行業(yè),讓視頻成為企業(yè)的增長(zhǎng)引擎
技術(shù)的價(jià)值體現(xiàn)在實(shí)戰(zhàn)落地應(yīng)用。面向視頻化全行業(yè)滲透的趨勢(shì),火山引擎已經(jīng)將其視頻云從游戲、電商、社交等消費(fèi)互聯(lián)網(wǎng)領(lǐng)域向醫(yī)療、金融、教育、汽車等行業(yè)互聯(lián)網(wǎng)延伸。
本次,火山引擎重磅推出了一系列行業(yè)解決方案,覆蓋互動(dòng)娛樂、在線教育、金融合規(guī)、智能駕駛等場(chǎng)景。
首先,這些方案大多將技術(shù)與場(chǎng)景深入結(jié)合,帶來了更有沉浸感、交互感的視頻體驗(yàn)。
以互動(dòng)娛樂行業(yè)為例,在與抖音多人合唱項(xiàng)目合作中,火山引擎視頻云行業(yè)首發(fā)「多人視頻一起唱方案」,把合唱互動(dòng)方案從雙人升級(jí)到多人,現(xiàn)在已經(jīng)可以達(dá)到九人合唱;并實(shí)現(xiàn)了36ms超低延時(shí)合拍,支持48kHZ采樣率,滿足K歌場(chǎng)景的聽感盛宴;同時(shí)集成25W+高品質(zhì)曲庫,助力用戶實(shí)現(xiàn)了隨時(shí)隨地與朋友一起想唱就唱,感受最鮮活多樣的音樂魅力。
此外,火山引擎還推出了彈幕互動(dòng)方案,這是一種直播平臺(tái)興起的彈幕互動(dòng)玩法,允許觀眾通過發(fā)送點(diǎn)贊、彈幕和禮物來參與并影響互動(dòng)內(nèi)容?;鹕揭嬉曨l云行業(yè)首推云游戲+RTC(實(shí)時(shí)音視頻)彈幕互動(dòng)方案,融合云游戲服務(wù)的強(qiáng)大底層算力以及 RTC 先進(jìn)架構(gòu)設(shè)計(jì)和音視頻能力,獨(dú)家支持RTC+云游戲云端合流功能,能解決多源音視頻流管理和同步問題。
▲彈幕互動(dòng)應(yīng)用界面
同時(shí),火山引擎的AIGC能力也被嵌入這些方案之中,為企業(yè)帶來全新的視頻生產(chǎn)體驗(yàn)。
比如面向金融領(lǐng)域,在火山引擎與國信證券聯(lián)合落地的金融直播解決方案中,國信證券上線了AI虛擬數(shù)字主播,并結(jié)合數(shù)字人使用AI短視頻模板自動(dòng)化生成實(shí)時(shí)短視頻。金融行業(yè)智能直播面臨合規(guī)性挑戰(zhàn),AI生成內(nèi)容需要逐幀做合規(guī)審核,國信證券正探索通過AIGC做初審再采用人工復(fù)審,從而提升內(nèi)容創(chuàng)作和審核效率。
此外值得一提的是,從2D到3D視覺的交互升級(jí),在這些行業(yè)方案中亦有多處體現(xiàn)。
火山引擎行業(yè)首推的VR云制播方案,從內(nèi)容生產(chǎn)到傳輸分發(fā)降低VR內(nèi)容的開發(fā)和消費(fèi)門檻。比如在其與央視打造身臨其境的虛擬演播平臺(tái)案例中,央視通過火山引擎視頻云和云創(chuàng)智媒的能力,輕量化地用一臺(tái)筆記本實(shí)現(xiàn)VR視頻的制作,而不再需要一個(gè)演播室和一堆硬件系統(tǒng)。
可見,除了在抖音熟悉的互聯(lián)網(wǎng)領(lǐng)域,火山引擎在金融、傳媒、汽車等領(lǐng)域不斷探索并且推出相應(yīng)方案,探索視頻云“三道技術(shù)邊界”并不是說說而已,而是已經(jīng)有了深入實(shí)戰(zhàn)經(jīng)驗(yàn)。
三、三年商業(yè)化深耕,火山引擎視頻云“破繭”
火山引擎自2020年正式對(duì)外商業(yè)化,但視頻技術(shù)服務(wù)可追溯到2013年。
Yongyuan回顧,自2013年今日頭條平臺(tái)的短視頻內(nèi)容誕生,團(tuán)隊(duì)就開始做視頻方面積累。2016年抖音的孵化,則促使團(tuán)隊(duì)進(jìn)一步以視頻中臺(tái)的方式輸出更多音視頻技術(shù)支持。隨著2017~2020年抖音規(guī)模不斷變大,更多音視頻的標(biāo)準(zhǔn)化工具出現(xiàn),逐步具備了對(duì)外服務(wù)的條件。
2021年6月,字節(jié)正式推出火山引擎云服務(wù)業(yè)務(wù)板塊;12月,火山引擎發(fā)布了包括了視頻云在內(nèi)的五大類共78項(xiàng)云服務(wù),確立“IaaS+PaaS+SaaS”完整云服務(wù)體系。2022年7月,火山引擎推出音視頻云端一體解決方案veVOS,進(jìn)一步助力企業(yè)客戶的業(yè)務(wù)敏捷創(chuàng)新。
2023年,隨著火山引擎的商業(yè)化落地進(jìn)入規(guī)模化階段,其底層技術(shù)也加速迭代,這些自研芯片及服務(wù)器等技術(shù)并不對(duì)外銷售,而是通過視頻云的方式服務(wù)企業(yè)?!拔覀兊暮诵募夹g(shù)都會(huì)沉淀在火山引擎,以‘對(duì)內(nèi)對(duì)外統(tǒng)一’的方式提供,這是火山引擎做云的一個(gè)出發(fā)點(diǎn)?!盰ongyuan說。
隨著技術(shù)和商業(yè)地圖的進(jìn)一步完善,火山引擎正大步駛向視頻云領(lǐng)域的新藍(lán)海。
結(jié)語:全行業(yè)視頻化浪潮下,視頻云成企業(yè)增長(zhǎng)新引擎
知名調(diào)查機(jī)構(gòu)IDC預(yù)測(cè),到2025年,超80%全球數(shù)據(jù)將是音視頻等非結(jié)構(gòu)化數(shù)據(jù),這樣的超視頻化成為數(shù)字時(shí)代的重要特征。同時(shí),AIGC、VR等技術(shù)的爆發(fā),帶來視頻生產(chǎn)的成本不斷降低,可能將視頻行業(yè)市場(chǎng)撐大十倍都不止。
本次,火山引擎推出了一系列底層硬件及產(chǎn)品和行業(yè)解決方案,在視頻云領(lǐng)域的布局進(jìn)一步加深。從傳統(tǒng)到AI,從2D到3D,從泛互聯(lián)網(wǎng)到行業(yè),火山引擎在拓寬自身云業(yè)務(wù)發(fā)展邊界的同時(shí),也為企業(yè)提供了通過視頻及AI技術(shù)實(shí)現(xiàn)數(shù)字化升級(jí)的新選擇。