互聯(lián)網(wǎng)大廠跑馬圈地虛擬數(shù)字人,千億市場爆發(fā)至少還要等上5年?

2022-10-18 11:16:43 作者:范佳來 吳雨欣

聽說過洛天依嗎?伴隨虛擬偶像的出圈,虛擬人產(chǎn)業(yè)已經(jīng)成為資本下注的新目標(biāo)。 

公開數(shù)據(jù)顯示,截至今年9月,國內(nèi)虛擬數(shù)字人賽道投融資金額已超過去年,達(dá)到24.9億元。2021年虛擬數(shù)字人相關(guān)企業(yè)投融資金額約為19.71億元,而在2015年這一統(tǒng)計(jì)數(shù)字僅為0.33億元,6年間復(fù)合增長率達(dá)到97.71%。

各大科技巨頭也不約而同選擇在虛擬人領(lǐng)域“秀肌肉”:國外的Meta、微軟,國內(nèi)的騰訊、阿里、百度、快手、網(wǎng)易,均投入重金布局。 

除了虛擬偶像之外,虛擬人目前已在多個(gè)場景有落地應(yīng)用。“虛擬人的價(jià)值不僅僅是‘不塌房’的虛擬偶像。”順為資本副總裁馮錚告訴澎湃新聞?dòng)浾摺?ldquo;虛擬人最大的應(yīng)用場景是虛擬身份和交互界面:前者是虛擬世界中的個(gè)人形象;后者相當(dāng)于虛擬世界中的機(jī)器人,由AI驅(qū)動(dòng),和人類交互。”

元宇宙市場像初創(chuàng)期的門戶網(wǎng)站

用學(xué)術(shù)的解釋來看虛擬人,指的是通過CG、動(dòng)作捕捉、VR等技術(shù),以圖片、視頻、直播等形式存在于非物理世界,具有擬人化特征的虛擬形象,也可稱為數(shù)字人。

Unity中國平臺(tái)技術(shù)總監(jiān)楊棟告訴記者,虛擬人技術(shù)發(fā)展已有較長時(shí)間。之所以在今年備受關(guān)注,一是由于柳夜熙、洛天依等娛樂化虛擬人形象的出圈,二是“元宇宙”概念的興起。定制個(gè)人虛擬形象需求的不斷擴(kuò)大,讓虛擬人產(chǎn)業(yè)逐漸走入大眾視野。 

“虛擬人最初走紅是在2017年,隨后經(jīng)歷了一段時(shí)間的摸索期,在這兩年逐漸走向商業(yè)化。”馮錚告訴澎湃新聞?dòng)浾摺?ldquo;元宇宙概念整體虛無飄渺,其中大家接觸最多和最了解的就是虛擬數(shù)字人,無論是虛擬偶像還是虛擬主播,相對更形象和具體一些,因此受到資本的廣泛關(guān)注。” 

根據(jù)艾媒咨詢預(yù)測,虛擬人帶動(dòng)的國內(nèi)產(chǎn)業(yè)市場規(guī)模將在2025年達(dá)到6402.7億元。 

虛擬人究竟是怎么造出來的?網(wǎng)易伏羲虛擬交互技術(shù)負(fù)責(zé)人齋藤飛向記者透露,制作一個(gè)虛擬人,需要考慮場景、受眾、承載虛擬人的硬件平臺(tái)以及成本投入的上下限,這些限制條件綜合決定虛擬人的畫風(fēng)、美術(shù)品質(zhì)標(biāo)準(zhǔn),并且圈定人設(shè)的基本范圍,在此基礎(chǔ)上再進(jìn)一步確定角色名字、基本設(shè)定、主視覺的設(shè)計(jì)。 

齋藤飛提到,虛擬人制造目前仍是一個(gè)復(fù)雜的技術(shù)體系,需要包括美術(shù)(建模師、綁定師、動(dòng)畫師)、開發(fā)(客戶端開發(fā)、技術(shù)美術(shù)、視效開發(fā))、算法(語音生成、動(dòng)畫驅(qū)動(dòng))等跨學(xué)科、跨領(lǐng)域、跨職能協(xié)同。當(dāng)不同領(lǐng)域圍繞同一目標(biāo)共同前進(jìn)時(shí),如何高效統(tǒng)籌管理也是一項(xiàng)巨大挑戰(zhàn)。

目前,虛擬人分為多個(gè)種類,最為大眾熟知的是娛樂型虛擬人,其中包括柳夜熙、AYAYI、洛天依等虛擬偶像,她們活躍在社交媒體平臺(tái),偶爾會(huì)帶帶貨。 第二類是服務(wù)型數(shù)字人虛擬員工,此外還有一些虛擬數(shù)字人作為客服存在。 第三類則是ID型數(shù)字人,代表虛擬世界中的某個(gè)特定化身,例如虛擬新聞主播等。 

“預(yù)計(jì)虛擬人的商業(yè)價(jià)值最大化要等5至10年。”馮錚表示,需要人人都有下一代硬件設(shè)備,才能像移動(dòng)互聯(lián)網(wǎng)那樣大規(guī)模地影響和改變世界,爆發(fā)出產(chǎn)業(yè)的最大價(jià)值。 

在他看來,其實(shí)目前虛擬人賽道的企業(yè)競爭并不激烈。“可能企業(yè)普遍對于短期內(nèi)掙錢的領(lǐng)域更感興趣,而虛擬人目前的商業(yè)回報(bào)不明顯,更多是長線布局。” 

作為投資方,馮錚坦言,自己對初創(chuàng)企業(yè)的技術(shù)能力和短期內(nèi)切入口最為關(guān)注。“現(xiàn)在的元宇宙很像1998、1999年時(shí),當(dāng)時(shí)四大門戶(網(wǎng)站)、阿里巴巴剛剛創(chuàng)立。今天虛擬世界也有一批有愿景的創(chuàng)業(yè)者開始去嘗試,而且也吸引到了一批早期用戶。在業(yè)態(tài)迭代的過程中,產(chǎn)品會(huì)隨著認(rèn)知、技術(shù)、用戶甚至硬件的變化不斷進(jìn)化,這些都考驗(yàn)企業(yè)的核心技術(shù)能力。” 

大廠“跑馬圈地”,誰能脫穎而出

值得注意的是,虛擬人已成為各大科技巨頭共同押注的賽道。 

文娛產(chǎn)業(yè)分析師張書樂認(rèn)為,虛擬人某種意義上是互聯(lián)網(wǎng)大廠展示肌肉的集中呈現(xiàn)物,即內(nèi)容創(chuàng)造、人工智能、動(dòng)作捕捉和各種與之相關(guān)的技術(shù)的融匯。 

在騰訊智能產(chǎn)品副總裁李學(xué)朝看來,騰訊通過整合ASR(語音識(shí)別技術(shù))、NLP(自然語言處理)、語音交互、自然語言理解、圖像識(shí)別、TTS(語音自動(dòng)合成)、知識(shí)圖譜等AI能力,連接騰訊內(nèi)容和服務(wù)生態(tài),面向使用場景打磨平臺(tái)能力,助力客戶打造出有智能、有形象、可交互的數(shù)字分身。 

“數(shù)字人是互聯(lián)網(wǎng)3.0的重要入口,既是技術(shù)對效率的解放,也將推動(dòng)線上和線下更全面地一體化,進(jìn)入全真互聯(lián)。”李學(xué)朝認(rèn)為。 

“網(wǎng)易伏羲事業(yè)部在2018年就成立虛擬人團(tuán)隊(duì),當(dāng)時(shí)的團(tuán)隊(duì)成員是國內(nèi)最早的虛擬人制造師之一。”網(wǎng)易伏羲AI虛擬人首席專家大丁向記者透露。

如今,虛擬人制造師已經(jīng)成為炙手可熱的工作,不僅涉及AI從業(yè)者,也包括工程平臺(tái)、技術(shù)美術(shù),產(chǎn)品經(jīng)理,項(xiàng)目管理、商務(wù)等崗位。

百度自2019年正式進(jìn)軍數(shù)字人領(lǐng)域,并主打高度定制化的超寫實(shí)機(jī)器人。百度數(shù)字人與機(jī)器人業(yè)務(wù)負(fù)責(zé)人李士巖告訴記者,虛擬人是技術(shù)驅(qū)動(dòng)型的市場,一旦某個(gè)技術(shù)突破,市場就會(huì)迅速展開。“從市場規(guī)模來看,預(yù)計(jì)2030年達(dá)到2700億,在整個(gè)產(chǎn)值來看,2022年發(fā)生在市場上的產(chǎn)值是大幾十億左右,且預(yù)計(jì)每年會(huì)有超過50%的速度遞增。” 

在他看來,虛擬人是web3.0以及元宇宙時(shí)代的主要內(nèi)容,也是主要的交互載體。“我們非??粗靥摂M人未來應(yīng)用場景,以及為企業(yè)在營銷和生產(chǎn)上帶來的價(jià)值,將來虛擬人會(huì)是每個(gè)人在元宇宙中的載體和分身,百度會(huì)堅(jiān)定投入,無論是人力上或者資金的投入方面,每年都是百分之幾十的速度增長。”

快手也宣布了自己在虛擬人方面的進(jìn)展??焓諽-tech AI技術(shù)中心負(fù)責(zé)人萬鵬飛告訴澎湃新聞?dòng)浾撸?ldquo;目前快手已經(jīng)能夠提供從建模到最終的內(nèi)容制作的一站式服務(wù),在全鏈路上都有深厚的積累。”他透露,數(shù)字人和XR是快手發(fā)展路徑上的重要方向。 

10月12日,Meta發(fā)布最新數(shù)字人成果:用手機(jī)掃描即可生成超寫實(shí)數(shù)字化身,根據(jù)扎克伯格在發(fā)布會(huì)視頻中的介紹,Meta的最新掃描技術(shù)允許在任何正常光源下進(jìn)行自主掃描,這是突破數(shù)字人掃描中空間局限的一次大膽嘗試。此外,Meta的科研人員透露,他們?nèi)詫⒅铝τ诳s短處理時(shí)間,以進(jìn)一步提升掃描效率。 

制作成本高昂,實(shí)時(shí)交互是難題

楊棟透露,虛擬人的制作成本非常高,從前期的動(dòng)作、表情捕捉,到后面的數(shù)據(jù)處理、渲染,時(shí)間成本、人力成本都非常高昂。 

“要想降低成本,首先要摸索出一條標(biāo)準(zhǔn)化的制作流程,并且在每一步流程里,提供相應(yīng)地專業(yè)化、標(biāo)準(zhǔn)化工具或解決方案,從而帶動(dòng)整個(gè)行業(yè)加速發(fā)展。” 

在他看來,虛擬人真正的難點(diǎn)應(yīng)該是在實(shí)時(shí)交互上,現(xiàn)在偏寫實(shí)或者3D的虛擬人的展現(xiàn)方式其實(shí)更多的是視頻類型,如果需要做到實(shí)時(shí)交互,則不僅要依靠畫面,還需要語音、智能系統(tǒng)、硬件設(shè)備、網(wǎng)絡(luò)甚至算力的系統(tǒng)配合。產(chǎn)業(yè)的發(fā)展還需要時(shí)間,但是需求和市場都已經(jīng)存在。

萬鵬飛同樣提到了實(shí)時(shí)交互的重要性和難點(diǎn)。“用戶需要和環(huán)境交互的能力,以及和其他人交互的能力。”他認(rèn)為,虛擬世界構(gòu)建的核心仍然是社交關(guān)系,而這種關(guān)系需要身份系統(tǒng)、環(huán)境系統(tǒng)、經(jīng)濟(jì)系統(tǒng)等共同構(gòu)建。這在技術(shù)上仍然是一個(gè)不小的挑戰(zhàn)。

不過,雖然得到業(yè)界和資本圈的普遍看好,虛擬人目前的發(fā)展仍在早期階段。張書樂向記者分析,目前虛擬人內(nèi)容輸出依然需要人工完成,即依靠聲音庫生成而非人工智能角度的虛擬數(shù)字人(如洛天依)演繹的大量內(nèi)容創(chuàng)作者來進(jìn)行歌曲創(chuàng)作、動(dòng)作捕捉,而這并不比配合現(xiàn)實(shí)藝人的演藝簡單。 

另外,人工智能向的虛擬數(shù)字人,盡管可以進(jìn)行有效問答,亦可針對特定內(nèi)容(如高考作文)進(jìn)行創(chuàng)作,但涉及到認(rèn)知盲點(diǎn)就不再有效。例如在駕駛過程中,成為車載導(dǎo)航的虛擬數(shù)字人進(jìn)行人機(jī)交互的展示意義和智能音箱并無二致,形象呈現(xiàn)也無實(shí)際意義。 

“僅僅看到營銷成本降低,卻無視虛擬數(shù)字人的研發(fā)、維護(hù)和升級(jí)成本,都是將虛擬人看作是一種低成本營銷和蹭熱點(diǎn)手段的偏見。”張書樂表示。 

網(wǎng)易伏羲產(chǎn)品經(jīng)理閣語透露,未來技術(shù)團(tuán)隊(duì)的發(fā)展方向主要分為兩類:一是致力于打造更生動(dòng)自然的虛擬人,讓其表現(xiàn)趨近于真人;二是如何去實(shí)現(xiàn)虛擬人生產(chǎn)和AI能力應(yīng)用的一個(gè)規(guī)模化,實(shí)現(xiàn)將虛擬人技術(shù)高效的應(yīng)用在各個(gè)場景中。

掃一掃分享本頁