Diit.cz - Novinky a informace o hardware, software a internetu

Obrázek Instinct MI300A ukazuje novou strukturu výpočetních bloků u CDNA 3

Zdroj: AMD

AMD zveřejnila obrázek jádra akcelerátorů Instinct MI300, který naznačuje odlišnou strukturu výpočetních bloků oproti předchozím generacím…

Instinct MI300A nese 6 CDNA 3 čipletů (+ tři procesorové), Inctinct MI300X nese 8 CDNA 3 čipletů. Právě jeho obrázek dala AMD k dispozici, vidíte jej v úvodu. Pokud si křemíkovou část srovnáme, bude vypadat takto:

Je patrné, že jednotlivé čiplety tvoří opakující se skupiny jednotek:

Každá obsahuje šest úzce obdélníkových polí a čtyři široce obdélníkové (blížící se čtverci). Toto uspořádání se nepodobá předchozím generacím CDNA, takže patrně půjde o novinku. Popisky k těmto blokům zatím AMD nezveřejnila, takže můžeme jen předpokládat, že alespoň jeden z těchto dvou typů obdélníků symbolizuje bloky stream-procesorů (druhý by mohl symbolizovat maticové akcelerátory - v tom případě by se poměr vektorových a maticových akcelerátorů změnil - nebo něco jiného).

Starší zprávy naznačovaly, že by Instinct MI300A mohl nést kolem 24 tisíc stream-procesorů. O struktuře čipu však nebylo známo nic, takže mohlo jít o hodnotu odvozenou ze struktury známé z CDNA 2.

Z obrázku je patrné, že celý čip obsahuje (6 × 4 × 10 × 2 × 4 =) 1920 úzce obdélníkových polí a (4 × 4 × 10 × 2 × 4 =) 1280 široce obdélníkových polí. Pokud by široce obdélníková pole symbolizovala stream-procesory (vektorové akcelerátory), pak by při 16 stream-procesorech na každé nesl čip fyzicky 30720 stream-procesorů (MI300X), což by znamenalo fyzicky 23040 stream-procesorů pro MI300A. V případě, že jsou stream-procesory integrované v široce obdélníkových polích, pak by jich bylo 20480 (MI300X) / 15360 (MI300A).

Maticových akcelerátorů by tedy v prvním případě bylo 1280 (oproti 880 u Instinct MI250X) pro MI300X a 960 pro MI300A, ve druhém 1920 pro MI300X a 1440 pro MI300A.

 Instinct
MI100
Instinct
MI210
Instinct
MI250X
Instinct
MI300A
Instinct
MI300X
označeníArcturusAldebaranRigel
architekturaCDNACDNA 2CDNA 3
CPU24× Zen 4
formátPCIePCIeOAMsocket SH5OAM
CU/SM120104
(128)
220
(256)
??
FP32 jader76806656
(8192)
14080
(16384)
??
FP64 jader-----
INT32 jader-----
Tens. Cores440?416880??
takt1502 MHz ≤1700 MHz≤1700 MHz??
 ↓↓↓ T(FL)OPS ↓↓↓
FP16
184,6181383??
BF16
92,3181383??
FP32
23,545,3
22,6
95,7
47,9
??
FP64
11,522,647,9??
INT4
184,6181383??
INT8184,6181383??
INT16?????
INT32?????
FP8 tensor1500
3000*
?
FP16 tensor184,6181383750??
BF16 tensor92,3181383750??
FP32 tensor46,145,395,7
190??
TF32 tensor
??
FP64 tensor
45,395,7190??
INT4 tensor??
INT8 tensor
184,6181383??
 ↑↑↑ T(FL)OPS ↑↑↑
TMU480?---
sběrnice4096bit4096bit8192bit8192bit
kapacita
paměti
32 GB64 GB128 GB128 GB192 GB
HBM2,4 GHz3,2 GHz3,2 GHzHBM3 >5 GHz
paměť.
propustn.
1229 GB/s1639 GB/s3277 GB/s5,2 TB/s?5,2 TB/s
TDP300 W300 W500W
560W
?750W
transistorů50 mld.
25,6 mld.
29,1 mld.58,2 mld.146 mld.153 mld.
plocha GPU750 mm²
362 mm²724 mm²660 mm²?
proces7 nm6nm6nm5nm+6nm
datum202020222021Q3 2023?Q4 2023?

Tím se sice nedostáváme k jistým konkrétním číslům, ale dozvídáme se, že některé poměry funkčních bloků v jádře se změní a můžeme si udělat alespoň orientační představu, v jakých mantinelech se výpočetní výbava MI300 může pohybovat. Vzhledem k tomu, že se má podle některých zdrojů výkon v maticových operacích mezigeneračně téměř zdvojnásobit (plus přibude podpora formátu FP8), nelze vyloučit ani možnost s 1280 maticovými akcelerátory, ani s 1920. Obojí může vést ke zdvojnásobení, jen v případě první možnosti (1280) by zároveň bylo potřeba zhruba o třetinu zvýšit taktovací frekvnece, zatímco při druhé možnosti (1920) by naopak mohly trochu klesnout.

Zdroje: 

AMD

Diskuse ke článku Obrázek Instinct MI300A ukazuje novou strukturu výpočetních bloků u CDNA 3

Středa, 21 Červen 2023 - 10:08 | bulldozer | "the compute chiplet is called an XCD,...
Středa, 21 Červen 2023 - 09:38 | no-X | Nahoře jsou výpočetní (CDNA 3) čiplety.
Úterý, 20 Červen 2023 - 19:32 | Slavomir | Čiže Infiny Cache je v AID (najväčšie obdĺžniky)...
Úterý, 20 Červen 2023 - 19:03 | bulldozer | AID chiplety navyse obsahuju po 2 HBM kontrolery...
Úterý, 20 Červen 2023 - 18:49 | Slavomir | Vďaka, toto som potreboval vidieť. :-) Btw, ten...
Úterý, 20 Červen 2023 - 18:42 | bulldozer | Na vrchu su 4 AID chiplety, ktore su na...
Úterý, 20 Červen 2023 - 18:24 | Slavomir | Livestream som nevidel, iba prezentáciu na...
Úterý, 20 Červen 2023 - 18:20 | Tom Buri | no tak vzhledem k tomu ze pocty chipletu...
Úterý, 20 Červen 2023 - 18:19 | Tom Buri | cdna3 chiplety ma mi300a i x stejny..
Úterý, 20 Červen 2023 - 17:53 | Slavomir | Ste si istí tými čipletmi? T.j. 8 MI300X resp. 6+...

Zobrazit diskusi