Hạ tầng Huấn luyện FP8: Độ chính xác số thế hệ mới
Huấn luyện FP8 cắt giảm yêu cầu tính toán và bộ nhớ xuống còn khoảng một nửa so với BF16 trong khi vẫn duy trì chất lượng sản xuất. Microsoft, Meta, Google đang huấn luyện các mô hình tiên phong với FP8 đạt được cải thiện thông lượng 30-40%...
None