Cerebras 웨이퍼 스케일 엔진: 대안적 AI 아키텍처를 선택해야 할 때
WSE-3를 탑재한 CS-3가 사용자당 2,500 토큰/초로 Llama 4 Maverick을 제공—DGX B200 Blackwell보다 2배 이상 빠름. WSE-3는 4조 개의 트랜지스터, 900,000개의 AI 코어, 21 PB/s 메모리 대역폭을 갖춘 44GB 온칩 SRAM 탑재(H100 대비 7,000배)...
None