從概念到落地,數(shù)字人走進(jìn)千行百業(yè)

2023-03-17 15:29:55 作者:陳俊杰

元宇宙概念里的數(shù)字人正在走入“真實(shí)世界”。

百度AI數(shù)字人希加加成為數(shù)字人嘉賓,商湯的虛擬員工“小寧”線上線下全方位賦能傳統(tǒng)銀行,小冰打造的虛擬歌手陳水若登上了廣東衛(wèi)視春節(jié)晚會(huì),每日經(jīng)濟(jì)新聞的虛擬主播24小時(shí)播送新聞……在越來越多的行業(yè)里,人們正在習(xí)慣數(shù)字人的存在。

2022年來,越來越多的數(shù)字人走入千行百業(yè)、投入實(shí)際應(yīng)用,大規(guī)模商業(yè)化就在眼前,行業(yè)同樣在思考,數(shù)字人行業(yè)還有何難點(diǎn)、如何解決、未來數(shù)字人又將向何處去。

百度:數(shù)字人從概念走向?qū)嵱?/strong>

在2月末召開的2023全球人工智能開發(fā)者先鋒大會(huì)(GAIDC)上,作為大會(huì)邀請的數(shù)字人嘉賓,百度AI數(shù)字人希加加以AIGC首席架構(gòu)師身份發(fā)表演講,為人類嘉賓朋友們講解百度文心大模型在AIGC領(lǐng)域的運(yùn)用,分享她的“心路歷程”。

這是百度數(shù)字人在各行各業(yè)應(yīng)用的縮影。

百度智能云AI應(yīng)用產(chǎn)品部總經(jīng)理劉倩介紹,過去一年,百度與各行業(yè)的客戶攜手打造了多個(gè)數(shù)字人,例如在廣電及媒體領(lǐng)域,冬奧期間,與央視新聞合作了AI手語主播,為聽障人士提供了有溫度的賽事觀看體驗(yàn)。央視網(wǎng)數(shù)字主播小C,連續(xù)兩年兩會(huì)期間采訪對(duì)話人大代表。在虛擬偶像領(lǐng)域,百度推出了像百度品牌代言人希加加這樣純誕生自虛擬世界的IP。

另外還包括數(shù)字人健身教練、數(shù)字人導(dǎo)游、數(shù)字人導(dǎo)購、數(shù)字人辦稅官等等,百度智能云打造的多個(gè)數(shù)字人,已經(jīng)廣泛應(yīng)用在金融、運(yùn)營商、政務(wù)、文旅、廣電、互娛、航天等領(lǐng)域。

此外,2021年底,百度推出百度智能云曦靈平臺(tái),集數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)為一體,來實(shí)現(xiàn)數(shù)字人的高效生產(chǎn)、智能驅(qū)動(dòng)和低成本運(yùn)營。劉倩介紹,過去一年,曦靈平臺(tái)的產(chǎn)品不斷豐富和迭代,分別發(fā)布了AI手語平臺(tái)、數(shù)字明星運(yùn)營平臺(tái)、數(shù)字員工平臺(tái)、數(shù)字人直播平臺(tái)等。以AI手語平臺(tái)為例,可以直接實(shí)現(xiàn)文本轉(zhuǎn)手語、視頻轉(zhuǎn)手語、語音轉(zhuǎn)手語,甚至是節(jié)目直播只要接入手語平臺(tái),即可在畫面上實(shí)時(shí)生成數(shù)字人手語播報(bào)。

在劉倩看來,數(shù)字人不管發(fā)展到什么階段,一定是為了更好地服務(wù)人類和創(chuàng)造更大的價(jià)值,2022年,數(shù)字人正在從概念進(jìn)入實(shí)用階段,形態(tài)和應(yīng)用場景也將不斷豐富。“作為從業(yè)者,我們認(rèn)為數(shù)字人發(fā)展的目標(biāo),其一是在于把人從枯燥、重復(fù)性的工作中解放出來,便于人們做更具創(chuàng)造力的創(chuàng)意工作;其二是在于陪伴和寄托,在數(shù)字世界或元宇宙,讓人類有一個(gè)更好的伙伴或自己。”

劉倩認(rèn)為,想要提供服務(wù),或者是提供陪伴與寄托,就需要數(shù)字人不僅僅停留在有人的外觀、行為上,更要具備人的思想,并且能實(shí)現(xiàn)高頻的互動(dòng)以及內(nèi)容輸出。“目前我們看到行業(yè)中,還有很多數(shù)字人的成本、制作周期非常高,比方說給數(shù)字人換一套服裝的成本是幾千到幾萬元不等,時(shí)間上也有幾個(gè)星期甚至一個(gè)月。這給了我們一個(gè)很大的啟示,一個(gè)技術(shù)想要真正廣泛應(yīng)用到各行各業(yè),降低其門檻和普惠化是必經(jīng)之路。”

劉倩介紹,從數(shù)字人市場規(guī)模來看,雖然各個(gè)機(jī)構(gòu)預(yù)測維度不同,但都呈現(xiàn)出中國數(shù)字人市場蓬勃發(fā)展的趨勢。例如有智庫(量子位智庫發(fā)布的《虛擬數(shù)字人深度產(chǎn)業(yè)報(bào)告》)預(yù)測,2030年,中國虛擬數(shù)字人整體市場規(guī)模將高達(dá)2700億。IDC預(yù)測,到2026年,企業(yè)級(jí)市場數(shù)字人相關(guān)的市場規(guī)模將達(dá)102.4億。同時(shí),因?yàn)閿?shù)字人自帶科技感與話題熱度,在2022年形成了多個(gè)營銷熱點(diǎn)。數(shù)字人已經(jīng)應(yīng)用在偶像IP、品牌代言人、直播帶貨、主持播報(bào)、企業(yè)服務(wù)等場景,可見數(shù)字人的商業(yè)價(jià)值正在被驗(yàn)證。

“數(shù)字人到底聰不聰明,取決于交互。”劉倩進(jìn)一步介紹,百度即將在3月推出基于百度智能云技術(shù)打造出來的大模型“文心一言”, 這類生成式AI產(chǎn)品,一方面能提升數(shù)字人自己的經(jīng)驗(yàn)和認(rèn)知,迅速打造不同領(lǐng)域的“專家”,同時(shí)還能開創(chuàng)人格化數(shù)字人的創(chuàng)意空間。到那時(shí),人們可能很難判斷,屏幕之后的究竟是數(shù)字人,還是素未謀面的網(wǎng)友,數(shù)字人和現(xiàn)實(shí)人類之間的界限將被模糊。

商湯科技:虛擬人如何賦能百業(yè)

2022年,商湯科技為寧波銀行專屬打造的虛擬數(shù)字員工“小寧”上線,基于商湯原創(chuàng)的“虛擬IP解決方案”及多種領(lǐng)先的AI技術(shù),可以實(shí)現(xiàn)高效率、低成本的AIGC內(nèi)容創(chuàng)作,助力銀行實(shí)現(xiàn)前端業(yè)務(wù)的用戶積累和營銷轉(zhuǎn)化。

“小寧”也是商湯科技AI數(shù)字人“虛擬IP”在“線上”營銷場景中的首次應(yīng)用,據(jù)介紹,商湯數(shù)字人“虛擬IP”可以自主直播運(yùn)營,從粉絲互動(dòng)到直播帶貨,用更低的運(yùn)營成本為企業(yè)前端業(yè)務(wù)帶來全天候的“用戶觸達(dá)”,不斷增強(qiáng)品牌粘性,為品牌帶來持續(xù)增值。

商湯科技數(shù)字文娛事業(yè)部總經(jīng)理欒青在接受采訪時(shí)談到,商湯科技在數(shù)字人應(yīng)用的探索,主要期待解決兩個(gè)場景,一方面是各種各樣以人為核心的視頻的快速生成,另外一方面是以人為核心的人機(jī)交互能力的提升,包括多模態(tài)的人機(jī)交互、自然語言處理等方面。以寧波銀行的虛擬人為例,在欒青看來,線下能夠幫助日常的銀行客戶回答問題;線上能夠快速的制作各種營銷視頻內(nèi)容,幫助企業(yè)更好地宣傳,這是數(shù)字人能夠最終帶來的核心價(jià)值。

欒青覺得,商湯對(duì)于數(shù)字人的探索,更多看重?cái)?shù)字人是否能夠進(jìn)入具體的場景落地,比如銀行、短視頻等,“真正走到大家日常生活中,幫助中小企業(yè)更好地與客戶交流,提升日常運(yùn)營效率,降低運(yùn)營門檻和成本,這是我們認(rèn)為最好的數(shù)字人。”

在欒青看來,在數(shù)字世界,無論是生活還是工作,虛擬人都是最大的主體,從這個(gè)主體出發(fā),必然有提高其使用效率、讓其更好地服務(wù)大眾的方法。“至少慢慢的每一個(gè)企業(yè)都需要一個(gè)數(shù)字人,直到最終,每個(gè)人在工作和生活中也可能需要一個(gè)數(shù)字人,這其實(shí)是一個(gè)非常大的市場前景。”

而商湯的目標(biāo)則是希望能夠讓更多中小企業(yè)使用數(shù)字人,在欒青看來,這意味著科技能夠普惠大眾,科技能夠有更高的運(yùn)營效率,更低的運(yùn)營成本。

談及商談科技2022年在數(shù)字人層面的探索,欒青表示,首先從技術(shù)實(shí)力與綜合能力層面,商湯數(shù)字人確實(shí)獲得了行業(yè)認(rèn)可。但同時(shí)她也提到,2022年,整個(gè)行業(yè)對(duì)于“數(shù)字人究竟應(yīng)該如何用”的探索,仍舊處于一個(gè)非常表面的階段。

她進(jìn)一步表示,目前,大家看到數(shù)字人更多想到的是如何去做品牌的營銷、如何用數(shù)字人制作宣傳視頻,“我認(rèn)為這是大家開始認(rèn)知數(shù)字人第一個(gè)想到的應(yīng)用,但是我并不認(rèn)為這是真正數(shù)字人(應(yīng)用場景)。”僅僅把數(shù)字人的應(yīng)用停留在宣傳片層面,欒青認(rèn)為,這是對(duì)數(shù)字人的技術(shù)的巨大浪費(fèi)。

在她看來,數(shù)字人最終是真正的生產(chǎn)力,“因?yàn)槿吮旧砭褪巧a(chǎn)力,如果我們在任何一個(gè)場景下替代了人,它就是一個(gè)明確的生產(chǎn)力。”欒青認(rèn)為,如今數(shù)字人行業(yè)已經(jīng)走入一個(gè)更冷靜、更務(wù)實(shí)的階段,未來,行業(yè)也會(huì)從生產(chǎn)力的角度上,去思考和使數(shù)字人,把數(shù)字人變成一個(gè)普遍的方向。

小冰:AI Being普及化的加速

2023年開年,廣東衛(wèi)視春節(jié)晚會(huì)上有了虛擬歌手的身影,小冰打造的虛擬歌手陳水若,與鐘鎮(zhèn)濤、炎明熹等共同演繹了粵語賀年曲《財(cái)神到》。

陳水若基于小冰的神經(jīng)網(wǎng)絡(luò)渲染技術(shù)(XNR)生成,這種技術(shù)能生成一張此前完全不存在的臉(即AI創(chuàng)造面容),并根據(jù)表達(dá)內(nèi)容的不同,渲染出不同的表情和動(dòng)作。整體效果流暢、自然,與真實(shí)人類無異。

小冰公司首席執(zhí)行官李笛在接受采訪時(shí)表示,過去一年,在抖音平臺(tái),小冰AI歌手的視頻播放量達(dá)到5億次,收到了1677.5萬次的交互,回應(yīng)了726.3萬次的交互,交互量超過抖音99%的賬號(hào),“人工智能的高并發(fā)在這里得到了充分的體現(xiàn)。”

回顧去年,李笛表示,2022年,公司在虛擬人布局方面進(jìn)一步拓展到了高度多樣性的虛擬人,他們中絕大部分已經(jīng)不再叫“小冰”,每個(gè)月,這些虛擬人服務(wù)的用戶超過了1.6億人次,“應(yīng)該說我們正在不斷的實(shí)踐AI Being普及化的進(jìn)程。”

李笛進(jìn)一步介紹,除了在以往的 companion(伴侶)、assistant(助理)之外,小冰進(jìn)一步拓展了更多面向企業(yè)的數(shù)字員工,以及在游戲中的AI Being的實(shí)際落地。2022年,小冰公司宣布成立ICEGamer游戲工作室并推動(dòng)NPC向有情感的人工智能交互主體方向發(fā)展,由AI being擔(dān)綱全部NPC。

而在整個(gè)行業(yè)的技術(shù)突破層面,李笛認(rèn)為,2022年在人工智能或者說AI Being的幾個(gè)核心技術(shù)棧上,整個(gè)行業(yè)取得了一些天花板級(jí)的突破。比如,大語言模型帶來的對(duì)話能力的提升,以ChatGPT為代表;多模態(tài)的大模型帶來的AIGC的提升;神經(jīng)網(wǎng)絡(luò)渲染帶來的視覺方面的提升;一系列的超級(jí)自然語音技術(shù)帶來的語音、情感融合在一起的這種交互能力的提升。“整個(gè)產(chǎn)業(yè)以前受限的技術(shù)瓶頸被打破了,所以它必然會(huì)迎來一個(gè)更快的創(chuàng)新發(fā)展。”

與此同時(shí),小冰也面臨著在人工智能方面的最主要難點(diǎn),即技術(shù)創(chuàng)新和倫理以及社會(huì)接受度之間的距離。人工智能最重要的一個(gè)特點(diǎn)是高并發(fā),所以有一點(diǎn)點(diǎn)錯(cuò)誤,都會(huì)被無限放大。李笛進(jìn)一步舉例稱,一個(gè)能夠?qū)懽骰蛱峁┲R(shí)的人工智能系統(tǒng),假設(shè)它的錯(cuò)誤率是10%,假設(shè)每天有1億次交互,那就意味著每天會(huì)創(chuàng)作超過一千萬篇虛假新聞。人工智能的高并發(fā)會(huì)把錯(cuò)誤率變得非常恐怖。“這方面一直是我們所面臨的難點(diǎn),就是說我們需要不停的反復(fù)審視我們手上的技術(shù),設(shè)想這些技術(shù)落地時(shí)可能發(fā)生的挑戰(zhàn),以及我們自己怎樣解決這些問題。”

談及未來,李笛認(rèn)為,人類社會(huì)在AI技術(shù)的推動(dòng)下,必然會(huì)走向人人被AI Being環(huán)繞的那一天。“不只是每個(gè)人有一個(gè)虛擬人,而是每個(gè)人會(huì)和很多個(gè)虛擬人建立連接,每個(gè)虛擬人也可能會(huì)和很多個(gè)人建立連接,這將是一種全新的社交關(guān)系網(wǎng)。”

他進(jìn)一步表示,虛擬人不存在從b端轉(zhuǎn)向c端。“在我們的認(rèn)識(shí)中,凡是需要AI Being這種帶有一定擬人特點(diǎn)的人工智能系統(tǒng),都意味著它必然是在跟人做交互,只要是跟人做交互,就需要有擬人特點(diǎn)。所以即便是給b端提供的AI Being,也非常鮮明的具有c端特點(diǎn)。”

基于此,李笛認(rèn)為,對(duì)于人工智能AI Being來講,所有的to b問題,歸根結(jié)底都是to c問題,從b端轉(zhuǎn)向c端,實(shí)際上早已發(fā)生。

掃一掃分享本頁