Giá GPU Đám Mây Sụt Giảm: Thuê H100 Giảm 64% Khi Nguồn Cung Bắt Kịp Nhu Cầu
Ngày 10 tháng 12, 2025 Tác giả: Blake Crosley
Thị trường cho thuê GPU đã trải qua đợt điều chỉnh mạnh, với giá H100 giảm từ 8 USD xuống còn 2,85-3,50 USD mỗi giờ—giảm 64% so với mức đỉnh cuối năm 2024.1 Chỉ số Cho thuê H100 của Silicon Data đạt 2,36 USD vào tháng 6 năm 2025, giảm từ 3,06 USD vào tháng 9 năm 2024, đánh dấu mức giảm 23% trong chưa đầy một năm.2 Đối với các tổ chức đang lên kế hoạch hạ tầng AI, sự sụt giảm giá này tạo ra cơ hội chiến lược đồng thời đặt ra câu hỏi về động lực thị trường và xu hướng giá trong tương lai.
AWS đã cắt giảm giá H100 khoảng 44% vào tháng 6 năm 2025, đưa các instance P5 về mức phù hợp với kỳ vọng thị trường.3 H100 spot của GCP hiện ở mức 2,25 USD (A3-High), trong khi AWS spot thường dao động quanh 2,50 USD.4 Các cam kết dài hạn có thể đưa chi phí H100 hiệu quả xuống thấp nhất là 1,90-2,10 USD mỗi GPU-giờ.5 Một số nhà cung cấp cạnh tranh mạnh mẽ còn đưa ra mức thuê H100 chỉ 0,99-1 USD mỗi giờ.6
Động lực giảm giá
Nhiều yếu tố đã hội tụ để tạo ra đợt điều chỉnh thị trường này.
Mở rộng nguồn cung
Tình trạng khan hiếm H100 đặc trưng cho năm 2023 và đầu 2024 đã giảm bớt đáng kể. Các hyperscaler và trung tâm dữ liệu khu vực đã đưa vào hoạt động lượng công suất mới đáng kể.7 Thị trường vốn nghiêng về phía người bán nay đã bắt đầu bình thường hóa khi sản xuất bắt kịp các đơn hàng đặt trong thời kỳ khan hiếm.
Các đối tác sản xuất của NVIDIA đã mở rộng công suất sản xuất xuyên suốt năm 2024 và 2025. Các khoản đầu tư công suất được thực hiện trong điều kiện khan hiếm giờ đang cung cấp GPU vào một thị trường có cung cầu cân bằng hơn. Sự chuyển đổi từ khan hiếm sang sẵn có đã thay đổi căn bản động lực định giá.
Cường độ cạnh tranh
Hơn 300 nhà cung cấp mới đã gia nhập thị trường đám mây H100 vào năm 2025, dẫn đến cạnh tranh giá quyết liệt.8 Các nhà cung cấp nhỏ hơn, chuyên biệt như RunPod và Vast.ai đưa ra mức giá thấp chỉ 1,80-1,87 USD mỗi giờ.9 Sự cạnh tranh buộc các nhà cung cấp lớn hơn phải điều chỉnh giá hoặc mất khách hàng.
Rào cản gia nhập thấp đối với dịch vụ GPU đám mây đã cho phép gia nhập thị trường nhanh chóng. Các tổ chức có quyền truy cập trung tâm dữ liệu và vốn có thể mua hoặc thuê GPU và cung cấp dịch vụ đám mây. Cấu trúc thị trường phân mảnh làm tăng cường cạnh tranh giá so với các dịch vụ đám mây truyền thống có rào cản cao hơn.
Tiến hóa nhu cầu
Các startup AI đã chuyển trọng tâm từ huấn luyện các mô hình nền tảng lớn sang tinh chỉnh các mô hình mã nguồn mở hiện có, giảm cường độ nhu cầu đối với các cụm GPU lớn nhất.10 Các khối lượng công việc suy luận (inference), mặc dù tăng trưởng nhanh chóng, có các đặc điểm khác với huấn luyện—phân tán hơn, yêu cầu thấp hơn cho mỗi instance, và nhạy cảm về giá hơn.
Sự sẵn có của các mô hình mã nguồn mở có năng lực như Llama, Mistral và DeepSeek đã giảm nhu cầu huấn luyện từ đầu tốn kém. Các tổ chức có thể đạt được khả năng AI cạnh tranh thông qua tinh chỉnh thay vì huấn luyện mô hình nền tảng. Sự chuyển đổi này thay đổi thành phần nhu cầu GPU.
Tác động thị trường
Sự sụt giảm giá ảnh hưởng đến các bên tham gia thị trường khác nhau theo những cách riêng biệt.
Nhà đầu tư hạ tầng
Các tổ chức mua GPU ở mức giá đỉnh đang đối mặt với kinh tế học đầy thách thức. Phân tích cho thấy khi giá thuê H100 giảm xuống dưới 1,65 USD mỗi giờ, doanh thu không còn thu hồi được vốn đầu tư.11 Giá cần vượt quá 2,85 USD mỗi giờ để đánh bại tỷ suất hoàn vốn nội bộ do các lựa chọn thay thế trên thị trường chứng khoán cung cấp.12
Ngưỡng lợi nhuận tạo áp lực sàn cho giá. Các nhà cung cấp không thể duy trì hoạt động ở mức giá hiện tại sẽ rời khỏi thị trường, cuối cùng ổn định nguồn cung. Quá trình sàng lọc có thể mất nhiều quý để hoàn thành khi các nhà điều hành với cấu trúc chi phí khác nhau cạnh tranh.
Khách hàng đám mây
Các tổ chức thuê công suất GPU được hưởng lợi trực tiếp từ việc giảm giá. Các dự án trước đây không kinh tế ở mức 8 USD mỗi giờ trở nên khả thi ở mức 2,50 USD mỗi giờ. Khả năng tiếp cận này cho phép thử nghiệm và triển khai AI rộng rãi hơn.
Tuy nhiên, biến động giá làm phức tạp việc lập kế hoạch. Các tổ chức cam kết công suất GPU dài hạn đối mặt với sự không chắc chắn về việc liệu giá hiện tại đại diện cho giá trị hợp lý hay tình trạng dư cung tạm thời. Các cam kết ngắn hạn hơn cung cấp tính linh hoạt nhưng có thể bỏ lỡ mức giá thuận lợi nếu nguồn cung thắt chặt.
Định vị của các hyperscaler
CEO IBM Arvind Krishna đã công khai đặt câu hỏi liệu các khoản đầu tư hạ tầng AI của hyperscaler có tạo ra lợi nhuận hay không, tuyên bố "không có cách nào" toán học hoạt động ở mức chi tiêu hiện tại.13 Sự sụt giảm giá GPU cung cấp bằng chứng hỗ trợ cho những người hoài nghi đồng thời mang lại lợi ích cho người tiêu dùng GPU.
CEO Amazon Andy Jassy phản bác rằng công suất được tiêu thụ "nhanh như chúng tôi đưa vào," cho thấy nhu cầu bền vững bất chấp giá giảm.14 Tăng trưởng khối lượng có thể bù đắp cho việc giảm giá, nhưng biên lợi nhuận đang chịu áp lực trên toàn ngành.
Triển vọng thế hệ tiếp theo
Quỹ đạo giá H100 cung cấp thông tin cho kỳ vọng về các thế hệ GPU mới hơn.
Ra mắt Blackwell
GPU NVIDIA Blackwell đã bắt đầu được vận chuyển, với hệ thống GB200 đến tay khách hàng. Kiến trúc thế hệ tiếp theo cung cấp cải tiến hiệu suất đáng kể so với H100. Tính sẵn có ban đầu của Blackwell vẫn còn hạn chế, với giá cao phản ánh sự khan hiếm.
Giá H100 có thể giảm thêm khi tính sẵn có của Blackwell tăng. Các tổ chức hài lòng với hiệu suất H100 có thể hưởng lợi từ sự xói mòn giá tiếp tục. Những tổ chức yêu cầu khả năng Blackwell sẽ phải trả giá cao cho đến khi nguồn cung bình thường hóa.
Dự báo trung hạn
Các dự báo trung hạn cho thấy khả năng giảm 10-20% khi GPU B200 ra mắt rộng rãi hơn vào năm 2026.15 Chu kỳ giới thiệu có thể lặp lại mô hình H100: khan hiếm ban đầu với giá cao tiếp theo là mở rộng nguồn cung và bình thường hóa giá.
Các tổ chức nên xem xét thời điểm thế hệ GPU khi lập kế hoạch đầu tư hạ tầng. Chờ đợi các thế hệ mới hơn cung cấp lợi ích hiệu suất nhưng trì hoãn triển khai. Phần cứng thế hệ hiện tại với giá giảm cho phép triển khai ngay lập tức.
So sánh giá hiện tại
| Nhà cung cấp | H100 On-Demand | H100 Spot | Giá cam kết |
|---|---|---|---|
| AWS P5 | 3,50 USD/giờ | ~2,50 USD/giờ | 1,90-2,10 USD/giờ (1 năm) |
| GCP A3-High | 3,25 USD/giờ | 2,25 USD/giờ | ~2,00 USD/giờ (1 năm) |
| Azure ND H100 | 3,40 USD/giờ | ~2,60 USD/giờ | ~2,15 USD/giờ (1 năm) |
| RunPod | 2,39 USD/giờ | 1,87 USD/giờ | N/A |
| Vast.ai | Biến động | 1,80-2,50 USD/giờ | N/A |
| Lambda | 2,49 USD/giờ | N/A | 1,99 USD/giờ (đặt trước) |
Giá tính đến tháng 12 năm 2025. Giá spot biến động dựa trên tính sẵn có.
Khung quyết định: thuê vs sở hữu vs chờ đợi
| Tình huống | Khuyến nghị | Lý do |
|---|---|---|
| Khối lượng công việc biến động (<50% sử dụng) | Thuê (spot) | Tính linh hoạt vượt trội tiết kiệm từ sở hữu |
| Khối lượng công việc ổn định (>70% sử dụng) | Đánh giá sở hữu | Có thể đạt điểm hòa vốn ở mức giá hiện tại |
| Chi tiêu GPU >100.000 USD/tháng | Sở hữu hạ tầng | ROI rõ ràng với mức sử dụng bền vững |
| Triển vọng 12 tháng không chắc chắn | Thuê ngắn hạn | Tránh tài sản mắc kẹt nếu nhu cầu thay đổi |
| Huấn luyện mô hình lớn | Sở hữu hoặc đặt trước | Công suất ổn định là quan trọng |
Phân tích hòa vốn: - Giá mua H100: ~25.000-30.000 USD mỗi GPU - Với giá thuê 2,50 USD/giờ: 10.000-12.000 giờ để hòa vốn (~14-16 tháng với 100% sử dụng) - Với giá thuê 1,65 USD/giờ: nhà cung cấp không thể thu hồi vốn đầu tư11 - Ngưỡng lợi nhuận: 2,85 USD/giờ để đánh bại IRR thị trường chứng khoán12
Các bước hành động: 1. Kiểm tra chi tiêu hiện tại: Tính chi phí theo giờ hiệu quả trên tất cả mức sử dụng GPU 2. Đánh giá mức sử dụng: Đo lường công suất thực tế so với công suất đặt trước 3. Đánh giá các tùy chọn cam kết: So sánh giá đặt trước 1 năm với on-demand 4. Xem xét kết hợp: Sở hữu cho nền tảng, thuê cho công suất đột biến
Hướng dẫn chuyên nghiệp
Các quyết định hạ tầng trong thị trường biến động được hưởng lợi từ góc nhìn có kinh nghiệm.
Mạng lưới 550 kỹ sư thực địa của Introl hỗ trợ các tổ chức điều hướng kinh tế học hạ tầng GPU.16 Công ty xếp hạng #14 trong danh sách Inc. 5000 năm 2025 với mức tăng trưởng 9.594% trong ba năm.17
Chuyên môn trên 257 địa điểm toàn cầu cung cấp hiểu biết thị trường bất kể vị trí địa lý.18 Hướng dẫn chuyên nghiệp giúp các tổ chức đưa ra quyết định sáng suốt khi giá cả tiến hóa.
Điểm chính
Cho đội ngũ mua sắm: - Giá H100 giảm 64% từ 8 USD/giờ xuống 2,85-3,50 USD/giờ - Hơn 300 nhà cung cấp mới tăng cường cạnh tranh - Giá spot (GCP 2,25 USD, AWS 2,50 USD) mang lại giá trị tốt nhất cho khối lượng công việc linh hoạt
Cho người lập kế hoạch hạ tầng: - Hòa vốn cho sở hữu: 14-16 tháng với 100% sử dụng - Sàn lợi nhuận của nhà cung cấp: ~1,65 USD/giờ (giá khó giảm thêm nhiều) - Giá cam kết (1,90-2,10 USD/giờ) tốt hơn on-demand hơn 40%
Cho hoạch định chiến lược: - Thị trường đang bình thường hóa sau khan hiếm 2023-2024—không phải sụt giảm tạm thời - Ra mắt Blackwell có thể đẩy giá H100 xuống thấp hơn vào năm 2026 - Tính linh hoạt của thuê có giá trị khi công nghệ tiến hóa nhanh chóng
Triển vọng
Sự sụt giảm giá GPU đám mây đại diện cho sự bình thường hóa thị trường sau điều kiện khan hiếm của 2023-2024. Các tổ chức được hưởng lợi từ khả năng tiếp cận GPU được cải thiện đáng kể, cho phép triển khai AI rộng rãi hơn. Môi trường giá có thể kéo dài khi tăng trưởng nguồn cung tiếp tục đáp ứng nhu cầu, với việc giới thiệu thế hệ tiếp theo có khả năng mở rộng mô hình này.
Các tổ chức nên tận dụng mức giá hiện tại cho các yêu cầu tức thời đồng thời duy trì tính linh hoạt cho sự tiến hóa của thị trường. Các chiến lược thành công nhất sẽ cân bằng giữa tính cấp bách triển khai với các cân nhắc về thời điểm thị trường, sử dụng tính linh hoạt của thuê để tránh cam kết vốn sớm trong một thị trường đang tiến hóa nhanh chóng.
Tài liệu tham khảo
Mức độ cấp bách: Cao — Thay đổi thị trường với tác động mua sắm tức thì Số từ: ~1.800
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." Tháng 12 năm 2025. https://www.thundercompute.com/blog/ai-gpu-rental-market-trends ↩
-
Silicon Data. "H100 Rental Market Cools in September." Tháng 9 năm 2025. https://www.silicondata.com/blog/h100-rental-market-update-september-2025 ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." Tháng 12 năm 2025. ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." Tháng 11 năm 2025. https://intuitionlabs.ai/articles/h100-rental-prices-cloud-comparison ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." Tháng 11 năm 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." Tháng 12 năm 2025. ↩
-
Silicon Data. "H100 Rental Market Cools in September." Tháng 9 năm 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." Tháng 12 năm 2025. ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." Tháng 11 năm 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." Tháng 12 năm 2025. ↩
-
Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. https://cybernews.com/tech/gpu-rental-prices-are-crashing/ ↩↩
-
Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. ↩↩
-
Fortune. "IBM CEO warns there's 'no way' hyperscalers will turn a profit." Tháng 12 năm 2025. https://fortune.com/2025/12/03/ibm-ceo-no-way-hyperscalers-google-amazon-turn-profit-data-center-spending/ ↩
-
CIO Dive. "'We're not dabbling here': AWS backs infrastructure investments." Tháng 12 năm 2025. https://www.ciodive.com/news/aws-ai-cloud-infrastructure-capacity-microsoft-google/746998/ ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." Tháng 12 năm 2025. ↩
-
Introl. "Company Overview." Introl. 2025. https://introl.com ↩
-
Inc. "Inc. 5000 2025." Inc. Magazine. 2025. ↩
-
Introl. "Coverage Area." Introl. 2025. https://introl.com/coverage-area ↩