Tausende von 400-Watt-Chips kombiniert: Tesla hat mit dem Dojo den schnellsten Supercomputer für künstliche Intelligenz gebaut.
Nachdem Tesla mit dem FSD-Chip (Full Self Driving) bereits die Hardware für seine Elektroautos entworfen hat, folgt mit dem D1-Prozessor das Gegenstück für den Dojo-Supercomputer. Tesla kombiniert Tausende dieser Chips, die ersten Racks sollen demnächst montiert werden.
Verantwortlich für Project Dojo ist Ganesh Venkataramanan, der auf dem Tesla AI Day den Aufbau des Prozessors und des Supercomputers erläutert hat. Die Basis bildet eine 64-Bit-in-Order-CPU mit SMT4 für vier 8x8-Matrix-Multiplizier-Einheiten sowie einer für Float/Integer, dazu kommt ein SRAM-Cache mit 1,25 MByte.
645 mm², 50 Mrd Transistoren, 400 Watt
Diesen Block bezeichnet Tesla als Training Node, jeder schafft 1.024 Gigaflops mit BF16-Genauigkeit. Gleich 354 der Kerne bilden einen D1, der über ein 10-TByte/s-Fabric und über 4 TByte/s an Off-Chip-Bandbreite verfügt. Der Prozessor wird in einem 7-nm-Verfahren gefertigt, dabei bringt er 50 Milliarden Transistoren auf 645 mm² unter und benötigt 400 Watt für 362 Teraflops.
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
Kommentare:
Du hast bereits für diesen
Kommentar abgestimmt...