Các nền tảng GPU Serverless: So sánh RunPod, Modal và Beam
Modal Labs hoàn tất vòng Series B trị giá 87 triệu USD với định giá 1,1 tỷ USD (tháng 9/2025). RunPod huy động 20 triệu USD để mở rộng sang châu Âu và châu Á. Baseten hoàn tất vòng Series D trị giá 150 triệu USD. Thời gian cold start giảm từ 30-60 giây xuống còn dưới một giây nhờ container caching. GPU serverless đang trở thành lựa chọn mặc định cho inference có lưu lượng biến động mà không cần hạ tầng chuyên dụng.
None