Дезагреговані обчислення для ШІ: архітектура композитної інфраструктури
CXL-пулінг пам'яті досягає 3,8-кратного прискорення порівняно з 200G RDMA та 6,5-кратного порівняно з 100G RDMA для інференсу LLM. Композитна інфраструктура руйнує фіксовані співвідношення серверів, динамічно підлаштовуючись під точні вимоги робочих навантажень ШІ.
None