核心環(huán)節(jié)有望率先受益,ChatGPT促使算力“軍備競賽”開啟

2023-02-16 10:25:58 作者:葉峰

ChatGPT是由微軟投資的AI實(shí)驗(yàn)室OpenAI開發(fā)出的一款智能聊天機(jī)器人模型,它能夠根據(jù)用戶的文本輸入,產(chǎn)生相應(yīng)的智能回答。每一代GPT模型的參數(shù)量都快速增長,2019年2月發(fā)布的GPT-2參數(shù)量為15億,而2020年5月的GPT-3,參數(shù)量達(dá)到了1750億。ChatGPT能夠?qū)崿F(xiàn)當(dāng)前如此強(qiáng)大的交互,離不開背后龐大的算力支撐,隨著AI等新技術(shù)的發(fā)展,對高可靠、高性能、高安全算力需求更加突出。

據(jù)微軟官網(wǎng),微軟Azure為OpenAI開發(fā)的超級計(jì)算機(jī)是一個單一系統(tǒng),具有超過28.5萬個CPU核心、1萬個GPU和400 GB/s的GPU服務(wù)器網(wǎng)絡(luò)傳輸帶寬。據(jù)英偉達(dá),使用單個Tesla架構(gòu)的V100 GPU對1746億參數(shù)的GPT-3模型進(jìn)行一次訓(xùn)練,需要用288年時間。此外,算力資源的大量消耗,必然伴隨著算力成本的上升,據(jù)Lambda,使用訓(xùn)練一次1746億參數(shù)的GPT-3模型所需花費(fèi)的算力成本超過460萬美元。我們認(rèn)為,未來擁有更豐富算力資源的模型開發(fā)者,或?qū)⒛軌蛴?xùn)練出更優(yōu)秀的AI模型,算力霸權(quán)時代或?qū)㈤_啟。

具體來看,AI大模型對于算力資源的需求主要體現(xiàn)在以下三類場景:

首先,模型預(yù)訓(xùn)練:ChatGPT采用預(yù)訓(xùn)練語言模型,核心思想是在利用標(biāo)注數(shù)據(jù)之前,先利用無標(biāo)注的數(shù)據(jù)訓(xùn)練模型。據(jù)測算,訓(xùn)練一次ChatGPT模型(13億參數(shù))需要的算力約27.5PFlop/s-day;

其次,日常運(yùn)營:用戶交互帶來的數(shù)據(jù)處理需求同樣也是一筆不小的算力開支,測算得ChatGPT單月運(yùn)營需要算力約4874.4PFlop/s-day,對應(yīng)成本約616萬美元;

最后,F(xiàn)inetune:ChatGPT模型需要不斷進(jìn)行Finetune模型調(diào)優(yōu),對模型進(jìn)行大規(guī)模或小規(guī)模的迭代訓(xùn)練,產(chǎn)生相應(yīng)算力需求。

華泰證券分析指出,隨著國內(nèi)廠商相繼布局ChatGPT類似模型,算力需求或?qū)⒊掷m(xù)釋放,供給端核心環(huán)節(jié)或?qū)⒙氏仁芤妫浩湟皇撬懔π酒?,GPU采用了數(shù)量眾多的計(jì)算單元和超長的流水線,架構(gòu)更適合進(jìn)行大吞吐量的AI并行計(jì)算;其二則是服務(wù)器,ChatGPT模型訓(xùn)練涉及大量向量及張量運(yùn)算,AI服務(wù)器具備運(yùn)算效率優(yōu)勢,大模型訓(xùn)練有望帶動AI服務(wù)器采購需求放量;最后為數(shù)據(jù)中心,IDC算力服務(wù)是承接AI計(jì)算需求的直接形式,隨著百度、京東等互聯(lián)網(wǎng)廠商相繼布局ChatGPT類似產(chǎn)品,核心城市IDC算力缺口或?qū)⒓哟蟆?/p>

點(diǎn)評:當(dāng)前處在以ChatGPT為主線的新一輪人工智能創(chuàng)新周期,ChatGPT為人工智能產(chǎn)業(yè)注入新活力,有望帶動AIGC類應(yīng)用快速爆發(fā),人工智能技術(shù)作為驅(qū)動數(shù)據(jù)經(jīng)濟(jì)的技術(shù)底層,有望迎來新的發(fā)展機(jī)遇。數(shù)據(jù)、算力與算法是人工智能時代的三大基石,三者相互促進(jìn)帶動AI+應(yīng)用快速落地,ChatGPT為首的自然語言處理類技術(shù)及應(yīng)用,有望迎來全面爆發(fā)。

掃一掃分享本頁