Cerebras Wafer-Scale Engine: Wann alternative KI-Architektur die richtige Wahl ist
CS-3 mit WSE-3 liefert Llama 4 Maverick mit 2.500 Tokens/Sek. pro Nutzer – mehr als 2x schneller als DGX B200 Blackwell. WSE-3 enthält 4 Billionen Transistoren, 900.000 KI-Kerne, 44 GB On-Chip-SRAM mit 21 PB/s...
None