傳統(tǒng)行業(yè)應(yīng)用AI面臨三大挑戰(zhàn) 高質(zhì)量數(shù)據(jù)是應(yīng)用前提

2021-10-19 08:37:37 作者:陳曦

近日,知名人工智能學(xué)者吳恩達(dá)發(fā)表文章,闡述了他對(duì)于人工智能在傳統(tǒng)行業(yè)中應(yīng)用緩慢的理解。無(wú)論是刷短視頻時(shí)的個(gè)性化推薦,還是外賣(mài)配送時(shí)的耗時(shí)預(yù)估,或者是移動(dòng)支付時(shí)的人臉識(shí)別,以算法為代表的AI技術(shù)在消費(fèi)互聯(lián)網(wǎng)行業(yè)被應(yīng)用得“得心應(yīng)手”。然而提到傳統(tǒng)行業(yè),人們卻很難快速想起非常成熟的應(yīng)用人工智能的典型案例。為何AI技術(shù)在傳統(tǒng)行業(yè)的應(yīng)用速度和范圍遠(yuǎn)不如消費(fèi)互聯(lián)網(wǎng)等行業(yè)?

消費(fèi)互聯(lián)網(wǎng)行業(yè)應(yīng)用AI更具優(yōu)勢(shì)

“AI技術(shù)的應(yīng)用主要取決于數(shù)據(jù)、算力和算法。”天津大學(xué)智能與計(jì)算學(xué)部副教授朱鵬飛介紹,首先數(shù)據(jù)要達(dá)到一定的體量,這是應(yīng)用的基礎(chǔ),此外算力也要能支持大規(guī)模的模型訓(xùn)練,而后算法方面需要達(dá)到一定的精度,端側(cè)算力也要具備一定的推理能力。

之所以目前只有消費(fèi)互聯(lián)網(wǎng)公司在大規(guī)模應(yīng)用AI技術(shù),主要是在這三方面消費(fèi)互聯(lián)網(wǎng)公司都更具優(yōu)勢(shì)。

前些年短視頻并沒(méi)有現(xiàn)在這么火爆,例如發(fā)展初期的淘寶,也并沒(méi)有很強(qiáng)的用戶(hù)黏性。而隨著推送越來(lái)越精準(zhǔn),用戶(hù)的體驗(yàn)感也得到了極大的提升,最終呈現(xiàn)井噴式的用戶(hù)增長(zhǎng)。

“精準(zhǔn)推送主要依賴(lài)于算法精度的提升,而算法精度的提升又離不開(kāi)海量的數(shù)據(jù)作為基礎(chǔ)。”朱鵬飛解釋?zhuān)谶@個(gè)單一的場(chǎng)景中,算法模型需要不斷進(jìn)化,終身學(xué)習(xí)。由于不是封閉數(shù)據(jù)環(huán)境,總有新的數(shù)據(jù)加入,算法模型需要不斷通過(guò)學(xué)習(xí)進(jìn)行調(diào)整、迭代升級(jí),使其精度越來(lái)越高,形成一個(gè)良性循環(huán)。

“與此同時(shí),雖然目前消費(fèi)互聯(lián)網(wǎng)行業(yè)在算法精度上已經(jīng)上升到一定的高度,但相比一些傳統(tǒng)行業(yè)的應(yīng)用場(chǎng)景,消費(fèi)互聯(lián)網(wǎng)行業(yè)對(duì)于AI算法精度接受的閾值都比較低。比如短視頻、淘寶偏好推薦、百度熱搜關(guān)鍵詞,只需要達(dá)到用戶(hù)產(chǎn)生黏性的目的,只要有一定準(zhǔn)確性,用戶(hù)都可以接受。”朱鵬飛表示,相比之下,在很多傳統(tǒng)行業(yè),對(duì)于技術(shù)精度的要求就高得多。比如基于視覺(jué)的AI技術(shù)在人臉識(shí)別方面的應(yīng)用,在高鐵站、飛機(jī)場(chǎng)核實(shí)身份,1∶1的比對(duì)準(zhǔn)確度要高達(dá)99.99%甚至更高才可以進(jìn)行應(yīng)用。

在算力方面,目前云端算力已經(jīng)可以支持大規(guī)模模型訓(xùn)練和推理,比如短視頻、淘寶推薦等。但在大量傳統(tǒng)行業(yè)應(yīng)用場(chǎng)景中,智能終端上的端側(cè)算力還無(wú)法滿(mǎn)足推理的實(shí)時(shí)性和準(zhǔn)確性要求。

“相比于社交網(wǎng)絡(luò)和電商系統(tǒng),傳統(tǒng)行業(yè)應(yīng)用場(chǎng)景的封閉生態(tài)系統(tǒng)使得云端算力無(wú)法得到有效應(yīng)用。”朱鵬飛舉例說(shuō),以智能無(wú)人系統(tǒng)巡檢為例,電力巡檢、管道巡檢、交通巡檢、河道巡檢以及光伏巡檢等要求搭載在無(wú)人機(jī)和機(jī)器人上的算力滿(mǎn)足實(shí)時(shí)巡檢要求,由于視頻分析的模型復(fù)雜度較高,端側(cè)往往無(wú)法實(shí)現(xiàn)精準(zhǔn)高效的實(shí)時(shí)推理,輕量級(jí)網(wǎng)絡(luò)在滿(mǎn)足實(shí)時(shí)性的同時(shí)損失了識(shí)別精度。由于算法精度達(dá)不到使用要求,使得在很多場(chǎng)景中無(wú)法實(shí)現(xiàn)AI技術(shù)的應(yīng)用。

傳統(tǒng)行業(yè)應(yīng)用AI面臨三大挑戰(zhàn)

吳恩達(dá)認(rèn)為,在AI應(yīng)用方面,消費(fèi)互聯(lián)網(wǎng)行業(yè)之外的其他行業(yè)都面臨著三大挑戰(zhàn):數(shù)據(jù)集很??;定制化成本很高;從驗(yàn)證想法到部署生產(chǎn)的過(guò)程很長(zhǎng)。

對(duì)此,朱鵬飛也深有感觸,他以傳統(tǒng)制造業(yè)為例進(jìn)行了分析。

“傳統(tǒng)制造企業(yè)在制造向智造轉(zhuǎn)型的過(guò)程中,數(shù)據(jù)是一個(gè)很突出的問(wèn)題。”朱鵬飛介紹,首先在數(shù)據(jù)的獲取方面存在一定難度。傳統(tǒng)制造企業(yè)的數(shù)據(jù)是封閉的,因?yàn)楹芏鄠鹘y(tǒng)企業(yè)并不是新型信息化設(shè)備,沒(méi)有傳感器收集實(shí)時(shí)數(shù)據(jù),也沒(méi)有數(shù)據(jù)中心,因此數(shù)據(jù)零散,缺失嚴(yán)重,很難獲取像消費(fèi)互聯(lián)網(wǎng)企業(yè)里那種海量、高質(zhì)量的數(shù)據(jù)。

其次,行業(yè)內(nèi)部各個(gè)工廠(chǎng)的數(shù)據(jù)很多具有商業(yè)價(jià)值,因此工廠(chǎng)都嚴(yán)格保密,這導(dǎo)致數(shù)據(jù)不流通,沒(méi)有辦法進(jìn)行共享,進(jìn)而形成了數(shù)據(jù)孤島效應(yīng),影響了AI算法模型的優(yōu)化。

“我們?cè)陂_(kāi)發(fā)一個(gè)AI算法模型的時(shí)候,因?yàn)閿?shù)據(jù)的保密性,往往得到的數(shù)據(jù)都是經(jīng)過(guò)‘脫敏’的,這也嚴(yán)重地影響了我們的判斷。而傳統(tǒng)行業(yè)的企業(yè)中,又缺乏具有AI算法模型開(kāi)發(fā)能力的技術(shù)人員,因此雙方在合作研發(fā)過(guò)程中也存在著很高的壁壘。”朱鵬飛說(shuō)。

此外,傳統(tǒng)行業(yè)中的數(shù)據(jù)來(lái)源并不像消費(fèi)互聯(lián)網(wǎng)領(lǐng)域那樣來(lái)自單一場(chǎng)景,復(fù)雜的業(yè)務(wù)場(chǎng)景導(dǎo)致數(shù)據(jù)往往很“臟”,必須進(jìn)行“清洗”,去掉大量無(wú)效信息,AI算法模型才能高效率的學(xué)習(xí)以提高精度。“這就像我們教小朋友知識(shí),只講知識(shí)點(diǎn),小朋友們才能學(xué)得快,如果在知識(shí)點(diǎn)中夾雜著大量無(wú)用的信息,小朋友無(wú)從分辨,學(xué)習(xí)效率肯定降低。”朱鵬飛介紹,而給數(shù)據(jù)標(biāo)注“知識(shí)點(diǎn)”的工作是巨大而繁瑣的,需要企業(yè)有專(zhuān)人去做,要花費(fèi)很多時(shí)間精力。

“傳統(tǒng)制造業(yè)要想獲得高質(zhì)量的數(shù)據(jù),就必須對(duì)生產(chǎn)設(shè)備進(jìn)行信息化、智能化的改造。”朱鵬飛表示,這種改造需要企業(yè)投入大量的時(shí)間和精力,還會(huì)增加生產(chǎn)成本,這也成為AI在傳統(tǒng)制造業(yè)中應(yīng)用的壁壘。

高質(zhì)量數(shù)據(jù)是應(yīng)用前提

過(guò)去這10年,大部分AI的研發(fā)和應(yīng)用是“以軟件為中心”驅(qū)動(dòng)的。在海量數(shù)據(jù)的支撐下,不斷優(yōu)化軟件和算法,來(lái)獲得更高的算法精度。在傳統(tǒng)行業(yè)無(wú)法提高數(shù)據(jù)質(zhì)量和數(shù)量的情況下,吳恩達(dá)認(rèn)為,傳統(tǒng)行業(yè)應(yīng)該采用“以數(shù)據(jù)為中心”的模式,把重點(diǎn)放在獲得質(zhì)量更好、匹配度更高的數(shù)據(jù)上。

“在這種思路下,傳統(tǒng)行業(yè)也涌現(xiàn)了一些不錯(cuò)的應(yīng)用案例。比如醫(yī)學(xué)領(lǐng)域的影像識(shí)別AI系統(tǒng),可以幫醫(yī)生‘看’CT影像片子,對(duì)腫瘤等病變加以識(shí)別,輔助醫(yī)生做出判斷。”朱鵬飛介紹,由于很多數(shù)據(jù)都由專(zhuān)業(yè)的放射科醫(yī)生在影像片子上進(jìn)行了標(biāo)注,因此數(shù)據(jù)比較準(zhǔn)確,AI算法模型在學(xué)習(xí)的過(guò)程中進(jìn)步很快。目前很多影像識(shí)別系統(tǒng)的準(zhǔn)確率都能達(dá)到90%以上,由于是輔助醫(yī)生,最后還需醫(yī)生做醫(yī)療決策,但這個(gè)水平的準(zhǔn)確率在很大程度上降低了醫(yī)生的工作強(qiáng)度。

“盡管傳統(tǒng)行業(yè)有了一些應(yīng)用AI技術(shù)的成功案例,但是要想更好地和AI結(jié)合,還得在提高數(shù)據(jù)質(zhì)量方面下功夫。”朱鵬飛建議,首先對(duì)于已經(jīng)積累了海量數(shù)據(jù)的傳統(tǒng)行業(yè),在保證數(shù)據(jù)安全的前提下,主動(dòng)開(kāi)放數(shù)據(jù)。挖掘數(shù)據(jù)中蘊(yùn)藏的價(jià)值,和需求關(guān)聯(lián)起來(lái),會(huì)有很大的發(fā)展空間。其次,對(duì)于新興行業(yè),比如新能源汽車(chē)等,在構(gòu)建智能工廠(chǎng)規(guī)劃的時(shí)候,就把獲取數(shù)據(jù)、智能化的因素考慮進(jìn)去。

不過(guò)朱鵬飛強(qiáng)調(diào),在傳統(tǒng)行業(yè)用好AI技術(shù)的同時(shí),也不要濫用AI技術(shù),在應(yīng)用前做好評(píng)估,如果不能提高生產(chǎn)效率,對(duì)行業(yè)整體有所提升,那么盲目強(qiáng)行使用AI技術(shù),就是對(duì)資源的浪費(fèi)。“比如一些應(yīng)用場(chǎng)景需要AI算法達(dá)到99%以上的精度才可以使用,通過(guò)評(píng)估,現(xiàn)有模型算法只能達(dá)到90%的精度,那么這個(gè)場(chǎng)景就沒(méi)必要強(qiáng)行上馬AI技術(shù)了。”

“總而言之,對(duì)于AI技術(shù)的應(yīng)用要數(shù)據(jù)先行,有高質(zhì)量的數(shù)據(jù)再談應(yīng)用,沒(méi)有好的數(shù)據(jù)很難有好的應(yīng)用。”朱鵬飛說(shuō)。

掃一掃分享本頁(yè)