全球最具公信力的人工智能(AI)基準(zhǔn)測(cè)試MLPerf已進(jìn)入生成式AI(Generative AI)時(shí)代。NVIDIA憑借其強(qiáng)大的GPU系統(tǒng)在最新的生成式AI訓(xùn)練基準(zhǔn)測(cè)試中取得了領(lǐng)先的地位,而英特爾(Intel)和Google也在測(cè)試中展示了他們的實(shí)力。
在2023年早些時(shí)候,MLPerf新增了大型語(yǔ)言模型(LLM)訓(xùn)練基準(zhǔn)測(cè)試,特別是針對(duì)GPT-3。而在11月,MLPerf又新增了文字轉(zhuǎn)影像生成器Stable Diffusion基準(zhǔn)測(cè)試。這些基準(zhǔn)測(cè)試都是針對(duì)生成式AI的,要求參與者在強(qiáng)大的計(jì)算系統(tǒng)上完成訓(xùn)練。
在這個(gè)測(cè)試中,NVIDIA憑借其HGX H100系統(tǒng)取得了最佳的成績(jī)。HGX H100系統(tǒng)是一個(gè)超級(jí)電腦,搭載了1萬(wàn)顆GPU。名為Eos的NVIDIA系統(tǒng)僅用了不到4分鐘就完成了所有的GPT-3訓(xùn)練基準(zhǔn)測(cè)試。微軟(Microsoft)Azure用相同大小的系統(tǒng)測(cè)試,完成時(shí)間也只落后了幾秒鐘。
英特爾也參與了這個(gè)基準(zhǔn)測(cè)試,他們使用了搭載Gaudi 2加速芯片的系統(tǒng)以及僅搭載第4代Xeon處理器的系統(tǒng)。英特爾啟用了Gaudi 2的8位元浮點(diǎn)(FP8)功能,這在部分GPT-3和其他Transformer神經(jīng)網(wǎng)絡(luò)中使用,其低精度不會(huì)影響精度。測(cè)試結(jié)果顯示,Gaudi 2系統(tǒng)的單芯片速度略低于NVIDIA系統(tǒng)約三分之一,但它是Google TPUv5e的3倍。
英特爾Habana Labs營(yíng)運(yùn)長(zhǎng)Eitan Medina表示,他們預(yù)估FP8將帶來(lái)90%的增益,而實(shí)際測(cè)試中,384個(gè)加速器的叢集將訓(xùn)練時(shí)間縮短了103%。他還指出,Gaudi 2的價(jià)格明顯低于H100,因此在價(jià)格和效能的綜合指標(biāo)上具有優(yōu)勢(shì)。隨著Gaudi 3在2024年的推出,此優(yōu)勢(shì)將進(jìn)一步增強(qiáng)。
除了這些大公司,也有一些僅搭載CPU的系統(tǒng)參與了基準(zhǔn)測(cè)試。這些系統(tǒng)在幾個(gè)基準(zhǔn)測(cè)試的訓(xùn)練時(shí)間介于幾分鐘到幾小時(shí)之間。除了MLPerf基準(zhǔn)測(cè)試外,英特爾還分享了一些數(shù)據(jù),顯示包含AMX矩陣引擎的4節(jié)點(diǎn)Xeon系統(tǒng)能在不到5分鐘內(nèi)微調(diào)Stable Diffusion影像生成器。
據(jù)報(bào)道,共有19家企業(yè)和機(jī)構(gòu)提交了超過(guò)200份測(cè)試結(jié)果,顯示了AI訓(xùn)練的快速發(fā)展。這些提交結(jié)果的平均效能較過(guò)去5個(gè)月增加了2.8倍,比MLPerf開(kāi)始測(cè)試5年來(lái)增加了49倍。
這個(gè)基準(zhǔn)測(cè)試展示了各大公司在AI領(lǐng)域的實(shí)力和進(jìn)步。NVIDIA憑借其強(qiáng)大的GPU系統(tǒng)取得了領(lǐng)先的地位,而英特爾和Google也在測(cè)試中展示了他們的實(shí)力。隨著AI技術(shù)的不斷發(fā)展,我們有理由相信未來(lái)會(huì)有更多的突破和創(chuàng)新。
本文鏈接:http://m.www897cc.com/showinfo-27-30041-0.htmlNVIDIA在生成式AI訓(xùn)練基準(zhǔn)測(cè)試中技?jí)喝盒?/p>
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 蘋(píng)果Vision Pro在企業(yè)市場(chǎng)的應(yīng)用與優(yōu)勢(shì)