芯片巨頭發(fā)布ChatGPT專用GPU:速度快十倍!未來(lái)將與中國(guó)云服務(wù)商合作

2023-03-22 15:26:58 作者:王月龍 高涵 文多 蓋源源

借AI浪潮翻身的顯卡龍頭英偉達(dá)正試圖乘勝追擊。當(dāng)?shù)貢r(shí)間3月21日,2023年GTC大會(huì)上,英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛發(fā)布了四款A(yù)I推理芯片、三個(gè)大模型云服務(wù)、超級(jí)計(jì)算機(jī),以及針對(duì)場(chǎng)景優(yōu)化的應(yīng)用100個(gè)、更新功能的工業(yè)元宇宙Omniverse。

同時(shí),英偉達(dá)還計(jì)劃開(kāi)放DGX Cloud實(shí)例,其中每個(gè)實(shí)例配有8個(gè) H100或A100 80GB GPU,企業(yè)可以“云租賃”的形式按月租用DGX Cloud集群,價(jià)格為每實(shí)例3.7萬(wàn)美元/月起。根據(jù)介紹,DGX Cloud能為AI超級(jí)計(jì)算提供完整的解決方案,借助該集群,企業(yè)用戶可擴(kuò)展大型多節(jié)點(diǎn)訓(xùn)練工作負(fù)載的開(kāi)發(fā),無(wú)須等待需求量通常很大的加速計(jì)算資源。

3月22日一早,身穿標(biāo)志黑皮夾克的黃仁勛接受采訪時(shí)表示,隨著AI浪潮的涌進(jìn),未來(lái)將出現(xiàn)兩個(gè)拐點(diǎn),一是人工智能工廠的出現(xiàn),第二點(diǎn)則是未來(lái)的每一個(gè)應(yīng)用程序都將與生成式人工智能相連。“許多年輕的創(chuàng)業(yè)公司正在建立大型語(yǔ)言模型,并由此進(jìn)入生成式人工智能革命,英偉達(dá)正以幾種不同的方式為這一切做準(zhǔn)備,其中一種就是將所有內(nèi)容放入云中。”

當(dāng)前很多公司——尤其是開(kāi)發(fā)大型語(yǔ)言模型的中小型公司,都在擔(dān)心計(jì)算能力不足,談及英偉達(dá)計(jì)劃何時(shí)將云服務(wù)提供給中國(guó)客戶時(shí),黃仁勛并未給出具體規(guī)劃,但他也直言,將在中國(guó)與云服務(wù)提供商合作。

“(我們)將完全遵守所有的出口控制和法規(guī),它們(云服務(wù)產(chǎn)品)將在中國(guó)的云公司中實(shí)施。阿里巴巴、騰訊、百度等都是優(yōu)秀的合作伙伴,我完全期待他們擁有最先進(jìn)的系統(tǒng)來(lái)進(jìn)行人工智能計(jì)算。”黃仁勛直言,當(dāng)前市場(chǎng)對(duì)算力、生成式AI的需求極為旺盛,由于其余行業(yè)目前仍不是超級(jí)活躍,公司將有能力在此領(lǐng)域提供大量的供應(yīng)。

3月22日,A股英偉達(dá)概念股持續(xù)走強(qiáng)。截至發(fā)稿,宣亞國(guó)際20%漲停,中富通漲超16%,鴻博股份封板。

CFF20LXzkOyJy0ssYdbfGQx1ibYKKgibloXt7mSiaxKmY95YOJ8Pb01iaXGJPPLzN4RiaDXZMDs8bvA8wRiagm1KUk3g.png

多年來(lái),黃仁勛一直倡導(dǎo)AI和機(jī)器學(xué)習(xí),長(zhǎng)期押注AI的潛力也注定了英偉達(dá)是ChatGPT浪潮中受益最多的公司之一。因?yàn)?,?duì)于大型語(yǔ)言模型來(lái)說(shuō),算力是其中最重要的一環(huán),因此高度依賴英偉達(dá)強(qiáng)大的GPU芯片。

如今,谷歌、亞馬遜等正在自研芯片的科技巨頭,英偉達(dá)的未來(lái)之路并不好走。有分析認(rèn)為,英偉達(dá)不太可能和巨頭在云服務(wù)上直接競(jìng)爭(zhēng),但可能會(huì)推出特定的AI產(chǎn)品。此外,鑒于微軟是唯一一家尚未推出AI芯片的超大規(guī)模廠商,其與英偉達(dá)的合作對(duì)雙方來(lái)說(shuō)意義重大。“英偉達(dá)可以更好地耕耘數(shù)據(jù)中心,微軟不一定需要通過(guò)構(gòu)建基礎(chǔ)設(shè)施來(lái)與亞馬遜競(jìng)爭(zhēng),而是依靠前者成為AI最大的參與者之一。”

AI正迎來(lái)“iPhone時(shí)刻”

GTC開(kāi)發(fā)者大會(huì)于3月20日~23日舉行,本屆大會(huì)將舉辦超過(guò)650場(chǎng)由技術(shù)、商業(yè)、學(xué)術(shù)和政府領(lǐng)域領(lǐng)導(dǎo)者主持的會(huì)議。

在3月21日晚的主旨演講中,黃仁勛介紹了英偉達(dá)在AI領(lǐng)域的最新進(jìn)展,并展示了這些技術(shù)在包括科技、醫(yī)療、金融、圖像、物流配送等各行各業(yè)的應(yīng)用場(chǎng)景,并宣布了包括量子硬件公司 Anyon Systems、Atom Computing、電信巨頭AT&T Corp、醫(yī)療保健技術(shù)提供商美敦力、甲骨文、Adobe、Getty Image等一批全新的合作伙伴。

CFF20LXzkOyJy0ssYdbfGQx1ibYKKgibloUIS4UoB7uaAR4R79MvJREYgHA64AXQwUGSvx3WLwcCZhn2hUwamBHA.png

“我們正處于AI的iPhone時(shí)刻,”黃仁勛說(shuō)道,“初創(chuàng)公司正在競(jìng)相打造顛覆性產(chǎn)品和商業(yè)模式,而科技巨頭們也在尋求突破。”他表示,新的AI技術(shù)和迅速蔓延的應(yīng)用正在改變科學(xué)和各行各業(yè),并為成千上萬(wàn)的新公司開(kāi)辟新的疆域。這將是迄今為止最重要的一次GTC。

記者總結(jié)了英偉達(dá)最新發(fā)布的幾個(gè)重大進(jìn)展。

1. DGX Quantum

英偉達(dá)宣布和Quantum Machines推出DGX Quantum,這是首個(gè)結(jié)合GPU和量子計(jì)算的系統(tǒng),使用新的開(kāi)源CUDA Quantum軟件平臺(tái),該系統(tǒng)為從事高性能和低延遲量子經(jīng)典計(jì)算的研究人員提供了革命性的新架構(gòu)。

其中最主要的是H100 NVL,它將英偉達(dá)的兩個(gè)H100 GPU拼接在一起,以部署像ChatGPT這樣的大型語(yǔ)言模型(LLM)。“當(dāng)前唯一可以實(shí)際處理ChatGPT的GPU是英偉達(dá)HGX A100。與前者相比,現(xiàn)在一臺(tái)搭載四對(duì)H100和雙NVLINK的標(biāo)準(zhǔn)服務(wù)器速度能快10倍,可以將大語(yǔ)言模型的處理成本降低一個(gè)數(shù)量級(jí)。”黃仁勛說(shuō)。

2. DGX™ Cloud

英偉達(dá)宣布推出NVIDIA DGX™ Cloud,這是一項(xiàng)AI超級(jí)計(jì)算服務(wù),能讓企業(yè)立即訪問(wèn)為生成式AI和其他突破性應(yīng)用程序訓(xùn)練高級(jí)模型所需的基礎(chǔ)設(shè)施和軟件。企業(yè)可按月租用DGX Cloud集群,確??焖佥p松地?cái)U(kuò)展大型多節(jié)點(diǎn)訓(xùn)練工作負(fù)載的開(kāi)發(fā),而無(wú)需等待通常需求量很大的加速計(jì)算資源。微軟Azure預(yù)計(jì)將在下個(gè)季度開(kāi)始使用DGX Cloud,并且該服務(wù)將很快擴(kuò)展到谷歌云。

3. BioNeMo Cloud

英偉達(dá)公布了全新的BioNeMo云服務(wù),用于定制AI基礎(chǔ)模型,以加速新蛋白質(zhì)和療法的創(chuàng)造,以及基因組學(xué)、化學(xué)、生物學(xué)和分子動(dòng)力學(xué)領(lǐng)域的研究,安進(jìn)和其他十幾家生物科技初創(chuàng)公司已經(jīng)接入該服務(wù)。

4. CV-CUDA

英偉達(dá)還公布了CV-CUDA測(cè)試版,這是一個(gè)用于云規(guī)模計(jì)算機(jī)視覺(jué)的開(kāi)源GPU加速庫(kù)。黃仁勛透露,微軟、騰訊和百度等公司都正在采用CV-CUDA進(jìn)行計(jì)算機(jī)視覺(jué)AI研究。

5. 將加速計(jì)算帶入計(jì)算光刻領(lǐng)域

此外,英偉達(dá)宣布了一項(xiàng)突破——將加速計(jì)算帶入計(jì)算光刻領(lǐng)域,使ASML、臺(tái)積電和Synopsys等半導(dǎo)體領(lǐng)導(dǎo)者能夠加速下一代芯片的設(shè)計(jì)和制造。

黃仁勛喊話硅谷初創(chuàng)企業(yè):

A100芯片是大模型必備

黃仁勛將GPT-4等生成式AI模型的能力增長(zhǎng)描述為“計(jì)算的新時(shí)代”。他認(rèn)為,對(duì)于許多公司來(lái)說(shuō),在獲得使AI運(yùn)行所需的資源和技能方面,仍然面臨“無(wú)法逾越的障礙”,這也是英偉達(dá)提供AI服務(wù)業(yè)務(wù)的原因。具體來(lái)說(shuō),客戶直接從該公司購(gòu)買AI服務(wù),部署預(yù)訓(xùn)練生成式AI模型,并利用該公司的DGX AI超級(jí)計(jì)算機(jī)。

而英偉達(dá)長(zhǎng)期押注AI的決定了該公司是從ChatGPT浪潮中受益最多的公司之一,因其強(qiáng)大的GPU被用于訓(xùn)練GPT-4模型,以及用來(lái)運(yùn)行AI超大規(guī)模云提供商服務(wù)器上的工作負(fù)載。GPU是其主要業(yè)務(wù),占該公司收入的80%以上。

GPU即圖形處理器,是一種專門在個(gè)人電腦、工作站、游戲機(jī)和一些移動(dòng)設(shè)備上做圖像加速和通用計(jì)算工作的微處理器。“大約十年前,我們就看到,這種做軟件的方式可以改變一切,”黃仁勛在近期接受CNBC采訪時(shí)這樣說(shuō)道,“我們制造的每一個(gè)芯片都專注于AI,這從各個(gè)方面改變了英偉達(dá)。”

事實(shí)證明,這是英偉達(dá)做過(guò)的最正確的決定之一。對(duì)于研究大型語(yǔ)言模型的公司來(lái)說(shuō),算力是其中最重要的一環(huán),AI大模型的推理和訓(xùn)練高度依賴英偉達(dá)的GPU芯片。缺少芯片會(huì)導(dǎo)致算力不足,計(jì)算能力不足意味著無(wú)法處理龐大的模型和數(shù)據(jù)量,最終的結(jié)果是模型存在智商差距。美國(guó)銀行證券的半導(dǎo)體分析師Vivek Arya作了一個(gè)比喻,“計(jì)算能力現(xiàn)在基本上是硅谷的貨幣。”

鑒于英偉達(dá)在高性能GPU方面的技術(shù)領(lǐng)先地位,一些云計(jì)算專業(yè)人士認(rèn)為,1萬(wàn)顆英偉達(dá)A100芯片是一個(gè)好的AI模型的算力門檻。而微軟為OpenAI構(gòu)建的用于訓(xùn)練其模型的AI超級(jí)計(jì)算機(jī)就配備了1萬(wàn)顆英偉達(dá)的GPU芯片。

A100芯片是英偉達(dá)性能最好的芯片,現(xiàn)在售價(jià)約為1萬(wàn)美元。市場(chǎng)研究公司TrendForce在一份報(bào)告中計(jì)算得出,要處理1800億參數(shù)的GPT-3.5大型模型,需要的GPU芯片數(shù)量高達(dá)2萬(wàn)顆,未來(lái)GPT大模型商業(yè)化所需的GPU芯片數(shù)量甚至?xí)^(guò)3萬(wàn)顆。

黃仁勛在接受CNBC采訪時(shí)回憶道,大概五年前,當(dāng)英偉達(dá)生產(chǎn)出第一個(gè)超級(jí)AI芯片時(shí),他親手把這片芯片交給了ChatGPT的開(kāi)發(fā)商OpenAI,這也是全球首個(gè)這樣的芯片。

如今,ChatGPT席卷全球,黃仁勛表示,“我們是全球AI的發(fā)動(dòng)機(jī)。全球有超過(guò)3.5萬(wàn)家公司——不論是科技巨頭還是初創(chuàng)企業(yè),都在使用英偉達(dá)的產(chǎn)品來(lái)開(kāi)發(fā)AI,領(lǐng)域從消費(fèi)者互聯(lián)網(wǎng)、生物科學(xué)到機(jī)器人研發(fā)等。”

他同時(shí)還喊話硅谷初創(chuàng)企業(yè),稱英偉達(dá)還有很多A100芯片。他表示,今天的AI行業(yè),非常像手機(jī)的iPhone時(shí)刻,是一個(gè)革命性的轉(zhuǎn)變時(shí)刻。“對(duì)今天的創(chuàng)業(yè)者來(lái)說(shuō),創(chuàng)業(yè)是和AI一起進(jìn)行的,A100芯片驅(qū)動(dòng)的超級(jí)AI計(jì)算機(jī)將成為你的創(chuàng)業(yè)伙伴。里面的算法、龐大的數(shù)據(jù)等等都將成為創(chuàng)業(yè)計(jì)劃的一部分,這是一個(gè)很大的轉(zhuǎn)變,這也將成為AI行業(yè)的分水嶺。”他這樣說(shuō)道。

外界普遍認(rèn)為,英偉達(dá)的AI系統(tǒng)很貴,只有科技巨頭才能買得起。黃仁勛說(shuō),“AI數(shù)據(jù)中心現(xiàn)在的價(jià)格是1億美元,但是可以由100家公司共同使用,因此,這些成本對(duì)這些公司來(lái)說(shuō),基本上是九牛一毛。而且從芯片研發(fā)的角度來(lái)說(shuō),我們花了20到30億美元才研發(fā)出來(lái)A100這款A(yù)I芯片。更不要說(shuō)我請(qǐng)芯片代工廠制造這些芯片,以及用這些芯片來(lái)進(jìn)行大規(guī)模語(yǔ)言模型訓(xùn)練產(chǎn)生的成本了。”

英偉達(dá)未來(lái):推出AI特定產(chǎn)品

與微軟“強(qiáng)強(qiáng)聯(lián)合”

自ChatGPT掀起這場(chǎng)AI風(fēng)暴后,英偉達(dá)股價(jià)節(jié)節(jié)走高。今年年初至今,英偉達(dá)股價(jià)的漲幅已超80%。黃仁勛表示,并沒(méi)有預(yù)見(jiàn)今天的一切,也不把英偉達(dá)的成功視作是幸運(yùn)。

“我預(yù)見(jiàn)的是,加速計(jì)算機(jī)的發(fā)展,而不是AI的發(fā)展,”黃仁勛這樣說(shuō)道,“我們做了很多偉大的決定,包括搭建平臺(tái),并且讓每個(gè)人都能夠連接到這個(gè)平臺(tái),和全球的研究型大學(xué)建立聯(lián)系等。我們只是相信,在某一天,總有一些新的東西會(huì)出現(xiàn)。”

英偉達(dá)在AI芯片上的部署也幫助其數(shù)據(jù)中心收入在2020年首次超過(guò)游戲部門,企業(yè)相關(guān)收入目前占該公司收入的大部分。上個(gè)月,英偉達(dá)發(fā)布了2023財(cái)年第四季度的財(cái)報(bào),數(shù)據(jù)顯示,該公司的數(shù)據(jù)中心業(yè)務(wù)再次成為最大的收入來(lái)源,該業(yè)務(wù)營(yíng)收在當(dāng)季同比增長(zhǎng)11%,但環(huán)比下降6%。

CFF20LXzkOyJy0ssYdbfGQx1ibYKKgibloThkKapYOv6icPeRs5Nt97s3zNmAicWq5C4aLC4656Fsukn3Tc6sJV18Q.png

但是,由于經(jīng)濟(jì)放緩,英偉達(dá)的總體收入停滯不前。財(cái)報(bào)顯示,2023財(cái)年第四季度營(yíng)收為60.5億美元,同比下滑21%。盡管如此,上個(gè)季度它的表現(xiàn)略好于市場(chǎng)預(yù)期,這主要是基于AI芯片的銷售。

Gartner分析師Alan Priestley表示,盡管市場(chǎng)上大型語(yǔ)言模型和相關(guān)工具的數(shù)量與日俱增,但英偉達(dá)的GPU不太可能很快出現(xiàn)供不應(yīng)求的情況。“目前對(duì)高端性能的需求正在推動(dòng)英偉達(dá)的業(yè)務(wù),”他表示,“我們?nèi)蕴幱谶@種生成式AI趨勢(shì)的斜坡上,沒(méi)有人真正知道它會(huì)在哪里結(jié)束。”

Alan Priestley認(rèn)為,英偉達(dá)的中長(zhǎng)期前景不太明朗。因?yàn)椋坏貌慌c一些想要分一杯羹的科技巨頭抗衡。例如,去年10月,谷歌發(fā)布了其最新的Tensor處理單元,這些單元經(jīng)過(guò)優(yōu)化來(lái)訓(xùn)練和運(yùn)行AI和機(jī)器學(xué)習(xí)模型;亞馬遜市場(chǎng)領(lǐng)先的云平臺(tái)AWS也擁有自己的內(nèi)部芯片。“我們將看到這種情況越來(lái)越多地發(fā)生,”Priestley說(shuō)道。

面對(duì)日益激烈的競(jìng)爭(zhēng),F(xiàn)orrester高級(jí)分析師Tracy Woo認(rèn)為,英偉達(dá)有可能會(huì)提供能與超大規(guī)模廠商競(jìng)爭(zhēng)的服務(wù)和產(chǎn)品。不過(guò),大眾不太可能看到英偉達(dá)推出面向所有業(yè)務(wù)的云服務(wù)(與超大規(guī)模廠商競(jìng)爭(zhēng)的啟動(dòng)成本至少為10億美元),但可能會(huì)看到特定用于AI的產(chǎn)品。

Woo說(shuō):“沒(méi)有人會(huì)嘗試全面與超大規(guī)模企業(yè)競(jìng)爭(zhēng),但你可以試圖去蠶食某些市場(chǎng)領(lǐng)域,因?yàn)樗麄儯ǔ笠?guī)模企業(yè))不一定能主宰一切。”

除此之外,Woo表示,英偉達(dá)與微軟的合作意義重大,后者是唯一一家尚未推出AI芯片的超大規(guī)模廠商。兩家公司在去年11月宣布了一項(xiàng)“多年合作”,微軟將使用英偉達(dá)的GPU在其Azure云平臺(tái)上構(gòu)建強(qiáng)大的AI超級(jí)計(jì)算機(jī)。

另一方面,Woo表示,與英偉達(dá)保持緊密聯(lián)系可能也是微軟與亞馬遜競(jìng)爭(zhēng)對(duì)手保持同步的一種方式。“這可能是一個(gè)非常富有成效的合作伙伴關(guān)系,他們都能從中受益,”她說(shuō)道,英偉達(dá)可以更好地耕耘數(shù)據(jù)中心,而微軟不一定需要通過(guò)構(gòu)建自己的基礎(chǔ)設(shè)施來(lái)與亞馬遜競(jìng)爭(zhēng),而是依靠前者成為AI最大的參與者之一。

掃一掃分享本頁(yè)