Cerebras Wafer-Scale Engine : Quand Choisir une Architecture IA Alternative
CS-3 avec WSE-3 délivrant Llama 4 Maverick à 2 500 tokens/sec par utilisateur—plus de 2x plus rapide que DGX B200 Blackwell. WSE-3 contient 4 000 milliards de transistors, 900 000 cœurs IA, 44 Go de SRAM on-chip avec 21 Po/s...
None