外媒The register報導,繼不久前英特爾正式公布新一代AI加速晶片Gaudi 3 之後,另準備針對大陸市場推出「特供版」Gaudi 3,包括名為HL-328的OAM相容夾層卡(Mezzanine Card)和名為HL-388的PCle加速卡兩種硬體形態。

報導指出,英特爾在其Gaudi 3白皮書中披露了上述資訊,其中HL-328將於6月24日推出,HL-388將於9月24日推出。

具體硬體規格方面,大陸特供版的Gaudi 3與原版相比,具有相同的96MB SRAM片上記憶體,128GB HBM2e高頻寬記憶體,頻寬為3.7TB/s,擁有PCIe 5.0 x16介面和解碼標準。但是,由於美國對於AI晶片的出口管制規則限制,使得這類高性能AI的綜合運算性能(TPP)需要低於4800才能出口到大陸, 這意味大陸特供版的Gaudi 3的16bit性能不能超過150 TFLOPS。

根據英特爾公布的資料顯示,Gaudi 3在FP16/BF16上可以達到1835 TFLOPS,相比輝達H100在大模型訓練方面快40%、推理能效高50%。

顯然,大陸特供版的Gaudi 3需要大幅降低AI性能,才能合規出口。因此,大陸特供版Gaudi 3需要大幅削減內核數量(原版擁有8個矩陣數學引擎和64 個張量內核)和工作頻率。

#Gaudi #特供 #英特爾 #大陸市場