從“吉祥物”走向“實(shí)力派”,是過去兩年數(shù)智人行業(yè)明顯一大趨勢(shì)。數(shù)智人的落地,逐漸脫下了“高價(jià)”、“噱頭”、“流量”等標(biāo)簽,開始走向更務(wù)實(shí)的生產(chǎn)場(chǎng)景。
這帶來了巨大的藍(lán)海市場(chǎng),IDC報(bào)告顯示,中國(guó)AI數(shù)字人市場(chǎng)規(guī)模呈現(xiàn)高速增長(zhǎng)趨勢(shì),預(yù)計(jì)到2026年將達(dá)102.4億元人民幣。
作為多項(xiàng)AI技術(shù)應(yīng)用的載體,數(shù)智人是如何擺脫高價(jià)標(biāo)簽,從大企業(yè)走向小商戶,成為小微企業(yè)經(jīng)營(yíng)的“可選項(xiàng)”,甚至成為個(gè)人創(chuàng)作者的創(chuàng)作工具?
在今年的世界人工智能大會(huì)中,一項(xiàng)數(shù)字人定制現(xiàn)場(chǎng)體驗(yàn)成為本屆大會(huì)最具亮點(diǎn)的環(huán)節(jié)之一,吸引了不少人參與。
從現(xiàn)場(chǎng)體驗(yàn)來看,這項(xiàng)復(fù)刻專屬的數(shù)智人分身過程非常簡(jiǎn)單,只需在一個(gè)小型影棚內(nèi),閱讀一段3分鐘左右的文本,并對(duì)畫面和音頻進(jìn)行收錄,生成視頻素材并在后臺(tái)提交,即可在24小時(shí)內(nèi)快速生成與真人無異的數(shù)字分身。
據(jù)展臺(tái)工作人員介紹,這項(xiàng)體驗(yàn)基于今年騰訊云推出的小樣本數(shù)智人工廠實(shí)現(xiàn),僅需3分鐘視頻、24小時(shí)內(nèi)即可復(fù)刻2D數(shù)字分身,讓數(shù)智人應(yīng)用的服務(wù)成本大大降低。
而生成好的數(shù)智人,使用起來也非常方便,只要提供所需文字內(nèi)容,數(shù)字分身即可自動(dòng)生成語氣自然、表情生動(dòng)的真人形象出鏡視頻,助力使用者在營(yíng)銷數(shù)字分身、數(shù)字主播、口播知識(shí)生產(chǎn)等場(chǎng)景中提升創(chuàng)作效率。
▲大會(huì)現(xiàn)場(chǎng)觀眾體驗(yàn)3分鐘素材生成小樣本數(shù)智人
一、小樣本數(shù)智人降低數(shù)字人應(yīng)用成本
“現(xiàn)在辦個(gè)產(chǎn)品發(fā)布會(huì)、晚會(huì),沒有幾個(gè)數(shù)智人都好像都落伍了?!辈簧偈袌?chǎng)營(yíng)銷人員感嘆道。前不久各大電視臺(tái)的跨年晚會(huì)上,浙江衛(wèi)視的“谷小雨”、東方衛(wèi)視“東方嬡”、四川衛(wèi)視的“三星堆搖滾天團(tuán)”等數(shù)智人紛紛登臺(tái)表演,十分吸睛。不少科技產(chǎn)品發(fā)布會(huì)上,數(shù)智人還會(huì)成為主持人,介紹最新產(chǎn)品信息,甚至還能講幾個(gè)冷笑話串場(chǎng)。
▲中國(guó)國(guó)家博物館虛擬數(shù)智人艾雯雯
隨著越來越多的企業(yè)關(guān)注到數(shù)智人的落地進(jìn)展,騰訊、百度、阿里、網(wǎng)易等巨頭紛紛推出自家的數(shù)智人產(chǎn)品方案,同時(shí),世優(yōu)科技、次世文化等創(chuàng)企涌入該賽道。大量新玩家的涌入,為數(shù)智人賽道帶來了一定的“虛熱”,但想讓數(shù)智人走向產(chǎn)業(yè)深處,仍有不少待解決的難題。
比如說,大部分?jǐn)?shù)智人都是以視頻、海報(bào)等品牌宣傳形式出街為主,與業(yè)務(wù)場(chǎng)景結(jié)合并不夠清晰。再比如說,過往復(fù)雜的訓(xùn)練樣本數(shù)據(jù)采集,導(dǎo)致數(shù)字人定制過程長(zhǎng)、成本高,一定程度上限制了數(shù)字人的快速應(yīng)用落地。
對(duì)此,騰訊云智能數(shù)智人產(chǎn)品總經(jīng)理陳磊分析道:“在今年,數(shù)智人的實(shí)現(xiàn)路徑和實(shí)現(xiàn)效率認(rèn)知已經(jīng)有了大幅提升,現(xiàn)階段數(shù)智人不僅能在營(yíng)銷傳播上帶來一定關(guān)注度,在企業(yè)中也能成為真正有用、能為企業(yè)帶來價(jià)值的“數(shù)智員工”。
在2023世界人工智能大會(huì)上,騰訊云公布了一系列數(shù)智人領(lǐng)域的進(jìn)展。在數(shù)智人領(lǐng)域,今年騰訊云推出了小樣本數(shù)智人工廠,僅需少量數(shù)據(jù)、24小時(shí)內(nèi)即可復(fù)刻2D數(shù)字分身,讓企業(yè)應(yīng)用數(shù)智人服務(wù)成本大大降低。依托AI生成算法,數(shù)智人3D形象的復(fù)刻速度也將得到大幅提升,通過生成式動(dòng)作驅(qū)動(dòng),結(jié)合行業(yè)大模型能力,可讓企業(yè)獲得更“個(gè)性化、專業(yè)、自然逼真”的數(shù)智員工,讓“面對(duì)面”專業(yè)服務(wù)成為可能。
數(shù)字經(jīng)濟(jì)學(xué)者劉興亮在過去半年,已經(jīng)在日常規(guī)?;褂脤佟皵?shù)智人”制作其真人出鏡的短視頻“亮三點(diǎn)”。劉興亮分享稱:“這個(gè)形象近似真人,表情、唇型匹配自然,包括我的特色口音也模擬得惟妙惟俏的數(shù)智人,正是騰訊云智能小樣本數(shù)智人。未來,不需要搭建拍攝場(chǎng)地,也不用提前化妝彩排,不受空間、時(shí)間限制,數(shù)智人可以隨時(shí)隨地幫我生成口播視頻,解放我的生產(chǎn)力?!?/p>
▲數(shù)字經(jīng)濟(jì)學(xué)者劉興亮用小樣本數(shù)智人生產(chǎn)視頻
而在今年的展臺(tái)現(xiàn)場(chǎng),央視總臺(tái)記者也進(jìn)行了現(xiàn)場(chǎng)體驗(yàn),與自己的數(shù)字分身進(jìn)行“對(duì)話”。就像《西游記》中“真假美猴王”的故事,隨著數(shù)字人技術(shù)的發(fā)展,記者也在現(xiàn)實(shí)世界中遇到了另外一個(gè)自己。
▲央視總臺(tái)記者在體驗(yàn)現(xiàn)場(chǎng)與數(shù)字分身“對(duì)話”
二、落地金融、汽車等領(lǐng)域,數(shù)字人加速步入產(chǎn)業(yè)
盡管尋找合適的落地場(chǎng)景是數(shù)智人玩家打通產(chǎn)業(yè)中不可或缺的一步,但是如何打造客戶滿意的數(shù)智人,如何進(jìn)一步降低使用門檻,如何讓數(shù)智人和更多生產(chǎn)環(huán)節(jié)打通,則是玩家們脫穎而出的關(guān)鍵。
例如,數(shù)字人雖然越來越受企業(yè)和廣告主的歡迎,但高昂的制作和運(yùn)營(yíng)成本問題一直有待解決。復(fù)雜的訓(xùn)練樣本數(shù)據(jù)采集,導(dǎo)致數(shù)字人定制過程長(zhǎng)、成本高,一定程度上也限制了數(shù)字人的快速應(yīng)用落地。
今年4月,騰訊云首次對(duì)外公布小樣本數(shù)智人生產(chǎn)平臺(tái),該平臺(tái)具有訓(xùn)練樣本小、生產(chǎn)效率高、自動(dòng)化生產(chǎn)等特性,可以實(shí)現(xiàn)低成本“自助式”數(shù)智人生產(chǎn)制作。依托騰訊自研AI能力和技術(shù)經(jīng)驗(yàn),只需要3分鐘真人口播視頻、100句語音素材,平臺(tái)便可通過音頻、文本多模態(tài)數(shù)據(jù)輸入,實(shí)時(shí)建模并生成高清人像,在24小時(shí)內(nèi)制作出與真人近似的“數(shù)智人”。
又例如,如何讓數(shù)字人和更多經(jīng)營(yíng)、運(yùn)營(yíng)環(huán)節(jié)打通,實(shí)現(xiàn)降本增效,發(fā)揮生產(chǎn)力效用。
比如說,早期的虛擬代言人、虛擬偶像多數(shù)為擁有虛擬形象的主播和動(dòng)捕演員甚至是CG動(dòng)畫,場(chǎng)景也多局限于文娛領(lǐng)域,呈單向傳播、且后期運(yùn)營(yíng)無力。不少虛擬代言人都“曇花一現(xiàn)”,生存周期較短。但隨著AI大模型在數(shù)智人的語言、理解等方向不斷升級(jí)、加入玩家增多,技術(shù)成本降低,都在促使數(shù)智人廠商更深入地走向產(chǎn)業(yè),打開更多數(shù)智人應(yīng)用場(chǎng)景,進(jìn)入金融、傳媒、出行、文旅等行業(yè)。
像網(wǎng)上開戶業(yè)務(wù)本是券商的高頻業(yè)務(wù)場(chǎng)景,是機(jī)構(gòu)獲得客戶的關(guān)鍵渠道,也與人工服務(wù)息息相關(guān)。傳統(tǒng)的真人提供的人工客服服務(wù)存在一定的局限性,比如說,真人客服只能在同一時(shí)間接待1個(gè)客戶,這就對(duì)客服團(tuán)隊(duì)的人員數(shù)量有較高要求。并且,真人客服也很難24小時(shí)提供服務(wù),容易造成客源流失。
但有了“數(shù)智員工”,這些問題都能迎刃而解。中信建投證券聯(lián)合騰訊云智能打造了業(yè)內(nèi)首個(gè)可交互“數(shù)智員工”,通過真人形象信息采集,動(dòng)作捕捉、二維建模等技術(shù)高度還原員工形象,以實(shí)現(xiàn)更沉浸式的服務(wù)效果。這類數(shù)智人包含AI驅(qū)動(dòng)的技術(shù)內(nèi)核和行業(yè)理解力,能在特定場(chǎng)景中自主完成工作,不依賴人工的運(yùn)營(yíng)支持,真正將員工從重復(fù)、枯燥的工作中解放出來,實(shí)現(xiàn)降本增效。
▲中信建投證劵“數(shù)智員工”
“數(shù)智人不但能支持開戶環(huán)節(jié)的相關(guān)工作,還可以指導(dǎo)客戶了解操作流程、注意事項(xiàng)等,甚至能更加有針對(duì)性的解決客戶在業(yè)務(wù)辦理過程中遇到的問題?!?中信建投項(xiàng)目負(fù)責(zé)人分享稱,目前中信建投證券95%以上的新客開戶都會(huì)使用到該系統(tǒng)。中信建投表示,騰訊云智能數(shù)智人在開戶場(chǎng)景上線以來,在提高見證效率、優(yōu)化客戶體驗(yàn)等方面起到了良好的示范作用。他們希望數(shù)智人可以在智能客服等場(chǎng)景中得到更好的應(yīng)用。
這一場(chǎng)景不僅出現(xiàn)在金融行業(yè),同樣也在汽車等多個(gè)行業(yè)上演。例如,一汽大眾的數(shù)智人Ida,是首個(gè)全旅程陪伴式“數(shù)智導(dǎo)購(gòu)”,從看車到選車、聊車、購(gòu)車,Ida都將全程陪伴在用戶身邊。
據(jù)陳磊介紹,基于首個(gè)汽車行業(yè)語料驅(qū)動(dòng),她可以通過豐富的講解介紹,將用戶在線瀏覽時(shí)長(zhǎng)提升至10分鐘以上,遠(yuǎn)超業(yè)內(nèi)一般水平。并且,用戶還極大的縮短了用戶在認(rèn)識(shí)新車-理解-好感-購(gòu)買的購(gòu)車鏈路,其云展廳的用戶留資率遠(yuǎn)高于其他線上板塊,超過13%。
從中信建投證券和一汽大眾的“數(shù)智員工”的案例中,我們可以看到,越來越多的數(shù)字人開始進(jìn)入產(chǎn)業(yè)。并且,隨著案例的不斷積累,走出“試用期”的數(shù)字人將會(huì)為用戶提供更自然的交互體驗(yàn)。
三、距離數(shù)智人步入千行百業(yè),還有多遠(yuǎn)?
事實(shí)上,除了金融、汽車行業(yè),數(shù)智人的應(yīng)用前景,遠(yuǎn)比人們認(rèn)知的還要更為廣闊,與不同類型企業(yè)的結(jié)合方式也更加多樣。擺脫華美外觀后的數(shù)智人,將會(huì)更強(qiáng)調(diào)功能性。這需要對(duì)數(shù)智人的本質(zhì)有更深的了解,才能更好的挖掘相關(guān)功能。
數(shù)智人本質(zhì)上是語音語義、自然語言處理、計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)等多模態(tài)AI技術(shù)的集合體。騰訊云智能數(shù)智人產(chǎn)品總經(jīng)理陳磊認(rèn)為,數(shù)智人賽道未來繼續(xù)發(fā)展,既需要通過技術(shù)推動(dòng)形象生產(chǎn)效能的提升,也需要更多行業(yè)知識(shí)接入,讓數(shù)智人能做到理解“千行百業(yè)”。
首先,認(rèn)知層面,產(chǎn)業(yè)客戶對(duì)數(shù)智人的業(yè)務(wù)價(jià)值了解不夠全面,存在一定刻板印象。事實(shí)上現(xiàn)在大部分行業(yè)業(yè)務(wù)的前期、中期、后期階段都能接入數(shù)智人的相關(guān)業(yè)務(wù)。“在前期,我們可以通過數(shù)智人來建立品牌形象,通過營(yíng)銷互動(dòng),提高用戶的轉(zhuǎn)換率?!标惱谡f。不僅如此,數(shù)智人還可以承擔(dān)部分業(yè)務(wù)辦理服務(wù),甚至是售后服務(wù)。在有了頗具行業(yè)特色的形象后,數(shù)智人還能和用戶維持一定的情感連接,維系用戶客情?;趯?duì)各行業(yè)理解的不斷加深,騰訊云智能梳理了14個(gè)行業(yè)大類、130+個(gè)數(shù)智員工可上崗的場(chǎng)景,作為落地應(yīng)用的指引,為產(chǎn)業(yè)客戶和數(shù)智人之間搭建合作的橋梁。
▲騰訊云智能數(shù)智人百大應(yīng)用場(chǎng)景
騰訊認(rèn)為文旅、傳媒、政務(wù)、教育、金融將成為數(shù)智人主要落地場(chǎng)景,消費(fèi)電子、出行、醫(yī)療、能源、地產(chǎn)等也將會(huì)逐漸鏈入數(shù)智人相關(guān)業(yè)務(wù)?!拔覀?cè)谶x擇場(chǎng)景時(shí),場(chǎng)景落地可執(zhí)行性和可復(fù)制性將是我們主要考量的要素之一。同時(shí)我們也會(huì)探索一些有社會(huì)價(jià)值的領(lǐng)域?!标惱谡f:“我們會(huì)有幾個(gè)主要場(chǎng)景,但一些大的場(chǎng)景方面會(huì)和產(chǎn)業(yè)伙伴聯(lián)合?!?/p>
其次,不同落地場(chǎng)景對(duì)數(shù)智人的要求也不盡相同,比如說金融領(lǐng)域,數(shù)智人的專業(yè)性要求更高,功能性更強(qiáng),需要迅速響應(yīng)各類服務(wù),而像數(shù)智主播、數(shù)智導(dǎo)游、數(shù)智管家等,騰訊云智能則需要打造行業(yè)語料庫訓(xùn)練相關(guān)語言模型,從而支持不同語境及需求下的表達(dá)交互。
最后,數(shù)智人的形象供給效率也不斷提高。過去打造一款專屬的數(shù)智人形象可能要3個(gè)月左右時(shí)間,涉及拍攝視頻的話,成品等待時(shí)間或長(zhǎng)至半年。為了降低數(shù)智人制作門檻,加速數(shù)智人向千行百業(yè)的普及,騰訊云智能提出了自動(dòng)化的“AI+數(shù)智人工廠”的方向,依靠“產(chǎn)、銷、服”的一站式平臺(tái),實(shí)現(xiàn)“自助式”購(gòu)買、生產(chǎn)和應(yīng)用數(shù)智人,大幅提升數(shù)智人生產(chǎn)效率。借助該平臺(tái),數(shù)字人制作已能實(shí)現(xiàn)數(shù)千元的成本和小時(shí)級(jí)的制作時(shí)長(zhǎng),大幅降低數(shù)字人使用門檻。
針對(duì)數(shù)智人的運(yùn)營(yíng),騰訊還提供了播報(bào)數(shù)智人平臺(tái)和交互數(shù)智人平臺(tái)服務(wù),滿足企業(yè)高效打造數(shù)智員工的訴求。播報(bào)數(shù)智人平臺(tái)支持通過文字、語音輸入快速生成數(shù)智人視頻;交互數(shù)智人平臺(tái)可打造數(shù)智員工,定制專屬問答庫,提供7*24小時(shí)人機(jī)雙向交互服務(wù),還能實(shí)現(xiàn)數(shù)智人直播服務(wù),自由切換真人語音接管,與用戶問答互動(dòng)。
“小樣本數(shù)智人支持半身、全身形象展示,手勢(shì)動(dòng)作會(huì)根據(jù)內(nèi)容靈活調(diào)整,也支持錄制背景任意更換,適用于直播帶貨等更廣泛的商用場(chǎng)景?!?/p>
目前,不少用戶已經(jīng)開始真正從效能角度,考慮數(shù)字人的實(shí)用價(jià)值。而伴隨大模型技術(shù)進(jìn)入行業(yè)落地攻堅(jiān)戰(zhàn),數(shù)字人應(yīng)用也有了更大的想象空間。
例如,作為醫(yī)療行業(yè)數(shù)字技術(shù)的供應(yīng)商,上海醫(yī)微訊就計(jì)劃通過數(shù)智人打通就醫(yī)過程中各環(huán)節(jié)存在的障礙,比如,在就醫(yī)者進(jìn)入門診大廳以后,幫助其快速掛號(hào)、診室指引等。同時(shí),幫助醫(yī)生開展醫(yī)患教育和知識(shí)分享。比如,用數(shù)智人代替醫(yī)生為患者進(jìn)行相關(guān)知識(shí)的科普和培訓(xùn)。
《人機(jī)共生——大模型時(shí)代的AI十大趨勢(shì)報(bào)告》指出,生成式人工智能所展現(xiàn)出來的高靈活度以及強(qiáng)交互性讓人們對(duì)AI技術(shù)有了全新的認(rèn)知。這種全新的AI技術(shù)讓數(shù)字人更像真實(shí)的人,能夠更充分地挖掘和梳理信息、知識(shí),并更貼近人類日常交流和表達(dá)習(xí)慣地處理語句。未來構(gòu)建數(shù)字內(nèi)容的過程中,數(shù)字人將廣泛應(yīng)用于各種場(chǎng)合,提高工作效率并實(shí)現(xiàn)成本降低。