Giá Cloud GPU Sụp Đổ: Thuê H100 Giảm 64% Khi Nguồn Cung Theo Kịp Cầu

Giá thuê H100 giảm từ $8/giờ xuống $2.85/giờ khi 300+ nhà cung cấp gia nhập thị trường. Tác động chiến lược đối với quyết định mua sắm và sở hữu GPU.

Giá Cloud GPU Sụp Đổ: Thuê H100 Giảm 64% Khi Nguồn Cung Theo Kịp Cầu

Giá Cloud GPU Sụp Đổ: Thuê H100 Giảm 64% Khi Nguồn Cung Theo Kịp Cầu

Ngày 10 tháng 12, 2025 Viết bởi Blake Crosley

Thị trường thuê GPU đã trải qua một đợt điều chỉnh mạnh mẽ, với giá H100 giảm từ $8 mỗi giờ xuống $2.85-3.50 mỗi giờ—mức giảm 64% so với đỉnh cuối năm 2024.1 Chỉ số Silicon Data H100 Rental Index đứng ở mức $2.36 vào tháng 6 năm 2025, giảm từ $3.06 vào tháng 9 năm 2024, đánh dấu mức giảm 23% trong vòng chưa đầy một năm.2 Đối với các tổ chức đang lập kế hoạch hạ tầng AI, sự sụp đổ giá cả tạo ra các cơ hội chiến lược đồng thời đặt ra câu hỏi về động lực thị trường và xu hướng giá trong tương lai.

AWS đã cắt giảm giá H100 khoảng 44% vào tháng 6 năm 2025, đưa các instance P5 phù hợp với kỳ vọng thị trường.3 Spot H100 của GCP hiện chạy ở mức $2.25 (A3-High), trong khi spot AWS thường ở gần mức $2.50.4 Các cam kết dài hạn có thể đưa chi phí H100 hiệu quả xuống thấp tới $1.90-$2.10 mỗi giờ GPU.5 Một số nhà cung cấp tích cực cung cấp thuê H100 với giá thấp tới $0.99-$1 mỗi giờ.6

Động lực giảm giá

Nhiều yếu tố hội tụ để tạo ra đợt điều chỉnh thị trường.

Mở rộng nguồn cung

Tình trạng khan hiếm H100 đã định hình năm 2023 và đầu năm 2024 đã được cải thiện đáng kể. Các hyperscaler và trung tâm dữ liệu khu vực đã đưa vào hoạt động công suất mới đáng kể.7 Thị trường từng thuộc về người bán giờ đây bắt đầu bình thường hóa khi sản xuất theo kịp các đơn đặt hàng được thực hiện trong thời kỳ thiếu hụt.

Các đối tác sản xuất của NVIDIA đã mở rộng công suất sản xuất trong suốt năm 2024 và 2025. Các khoản đầu tư công suất được thực hiện trong điều kiện thiếu hụt giờ đây cung cấp GPU vào thị trường với nguồn cung và cầu cân bằng hơn. Sự chuyển đổi từ khan hiếm sang sẵn có đã thay đổi cơ bản động lực định giá.

Cường độ cạnh tranh

Hơn 300 nhà cung cấp mới gia nhập thị trường cloud H100 trong năm 2025, dẫn đến cạnh tranh giá gay gắt.8 Các nhà cung cấp nhỏ hơn, chuyên biệt như RunPod và Vast.ai cung cấp mức giá thấp tới $1.80-$1.87 mỗi giờ.9 Cạnh tranh buộc các nhà cung cấp lớn hơn phải điều chỉnh giá hoặc mất khách hàng.

Rào cản gia nhập thấp cho dịch vụ cloud GPU đã cho phép gia nhập thị trường nhanh chóng. Các tổ chức có quyền truy cập trung tâm dữ liệu và vốn có thể mua hoặc thuê GPU và cung cấp dịch vụ cloud. Cấu trúc thị trường phân mảnh làm tăng cường cạnh tranh giá so với các dịch vụ cloud truyền thống có rào cản cao hơn.

Tiến hóa cầu

Các startup AI đã chuyển trọng tâm từ huấn luyện các mô hình nền tảng lớn sang tinh chỉnh các mô hình mã nguồn mở hiện có, giảm cường độ cầu cho các cụm GPU lớn nhất.10 Khối lượng công việc inference, mặc dù tăng trường nhanh, có đặc điểm khác với huấn luyện—phân tán hơn, yêu cầu mỗi instance thấp hơn, và nhạy cảm giá hơn.

Sự có sẵn của các mô hình mã nguồn mở có khả năng như Llama, Mistral, và DeepSeek đã giảm nhu cầu huấn luyện từ đầu tốn kém. Các tổ chức có thể đạt được khả năng AI cạnh tranh thông qua tinh chỉnh thay vì huấn luyện mô hình nền tảng. Sự thay đổi làm thay đổi thành phần cầu GPU.

Tác động thị trường

Sự sụp đổ giá ảnh hưởng đến các nhóm tham gia thị trường khác nhau theo những cách riêng biệt.

Nhà đầu tư hạ tầng

Các tổ chức đã mua GPU ở giá đỉnh phải đối mặt với kinh tế học thách thức. Phân tích cho thấy một khi giá thuê H100 giảm xuống dưới $1.65 mỗi giờ, doanh thu không còn thu hồi được khoản đầu tư.11 Giá cần vượt quá $2.85 mỗi giờ để vượt qua tỷ suất hoàn vốn nội bộ do các lựa chọn thị trường chứng khoán cung cấp.12

Ngưỡng lợi nhuận tạo áp lực sàn lên giá. Các nhà cung cấp không thể duy trì hoạt động ở mức giá hiện tại sẽ thoát ra, cuối cùng ổn định nguồn cung. Quá trình loại bỏ có thể mất hàng quý để hoàn thành khi các nhà điều hành với cấu trúc chi phí khác nhau cạnh tranh.

Khách hàng cloud

Các tổ chức thuê công suất GPU được hưởng lợi trực tiếp từ sự giảm giá. Các dự án trước đây không kinh tế ở $8 mỗi giờ trở nên khả thi ở $2.50 mỗi giờ. Khả năng tiếp cận cho phép thử nghiệm và triển khai AI rộng rãi hơn.

Tuy nhiên, biến động giá làm phức tạp việc lập kế hoạch. Các tổ chức cam kết công suất GPU dài hạn phải đối mặt với sự không chắc chắn về việc giá hiện tại có đại diện cho giá trị công bằng hay tình trạng dư cung tạm thời. Các cam kết ngắn hạn cung cấp tính linh hoạt nhưng có thể bỏ lỡ giá cả thuận lợi nếu nguồn cung thắt chặt.

Định vị hyperscaler

CEO IBM Arvind Krishna đã công khai đặt câu hỏi liệu các khoản đầu tư hạ tầng AI của hyperscaler có tạo ra lợi nhuận hay không, tuyên bố "không có cách nào" toán học hoạt động ở mức chi tiêu hiện tại.13 Sự sụp đổ giá GPU cung cấp bằng chứng hỗ trợ cho những người hoài nghi đồng thời có lợi cho người tiêu dùng GPU.

CEO Amazon Andy Jassy phản bác rằng công suất được tiêu thụ "nhanh như chúng tôi đưa vào," cho thấy cầu duy trì bất chấp sự giảm giá.14 Tăng trưởng khối lượng có thể bù đắp cho sự giảm giá, nhưng lợi nhuận đối mặt áp lực trên toàn ngành.

Triển vọng thế hệ tiếp theo

Quỹ đạo giá H100 thông báo kỳ vọng cho các thế hệ GPU mới hơn.

Giới thiệu Blackwell

Các GPU NVIDIA Blackwell đã bắt đầu vận chuyển, với các hệ thống GB200 đến tay khách hàng. Kiến trúc thế hệ tiếp theo cung cấp cải tiến hiệu suất đáng kể so với H100. Tính sẵn có ban đầu của Blackwell vẫn hạn chế, với giá cao phản ánh sự khan hiếm.

Giá H100 có thể giảm thêm khi tính sẵn có của Blackwell tăng. Các tổ chức hài lòng với hiệu suất H100 có thể được hưởng lợi từ sự xói mòn giá tiếp tục. Những người yêu cầu khả năng Blackwell sẽ trả phí cao cho đến khi nguồn cung bình thường hóa.

Dự báo trung hạn

Dự báo trung hạn gợi ý khả năng giảm 10-20% khi các GPU B200 ra mắt rộng rãi hơn vào năm 2026.15 Chu kỳ giới thiệu có thể lặp lại mô hình H100: khan hiếm ban đầu với giá cao tiếp theo là mở rộng nguồn cung và bình thường hóa giá.

Các tổ chức nên xem xét thời gian thế hệ GPU khi lập kế hoạch đầu tư hạ tầng. Chờ đợi các thế hệ mới hơn cung cấp lợi ích hiệu suất nhưng trì hoãn triển khai. Phần cứng thế hệ hiện tại với giá giảm cho phép triển khai ngay lập tức.

So sánh giá hiện tại

Nhà cung cấp H100 On-Demand H100 Spot Tỷ lệ cam kết
AWS P5 $3.50/giờ ~$2.50/giờ $1.90-2.10/giờ (1 năm)
GCP A3-High $3.25/giờ $2.25/giờ ~$2.00/giờ (1 năm)
Azure ND H100 $3.40/giờ ~$2.60/giờ ~$2.15/giờ (1 năm)
RunPod $2.39/giờ $1.87/giờ N/A
Vast.ai Biến động $1.80-2.50/giờ N/A
Lambda $2.49/giờ N/A $1.99/giờ (dành riêng)

Giá tính đến tháng 12 năm 2025. Giá spot dao động dựa trên tính sẵn có.

Framework quyết định: thuê vs sở hữu vs chờ đợi

Kịch bản Khuyến nghị Lý do
Khối lượng công việc biến động (<50% sử dụng) Thuê (spot) Tính linh hoạt vượt trội tiết kiệm sở hữu
Khối lượng công việc ổn định (>70% sử dụng) Đánh giá sở hữu Hòa vốn có thể đạt được ở giá hiện tại
>$100K/tháng chi tiêu GPU Sở hữu hạ tầng ROI rõ ràng với sử dụng duy trì
Triển vọng 12 tháng không chắc chắn Thuê ngắn hạn Tránh tài sản mắc kẹt nếu cầu thay đổi
Huấn luyện mô hình lớn Sở hữu hoặc dành riêng Công suất nhất quán quan trọng

Phân tích hòa vốn: - Giá mua H100: ~$25,000-30,000 mỗi GPU - Ở mức thuê $2.50/giờ: 10,000-12,000 giờ để hòa vốn (~14-16 tháng ở 100% sử dụng) - Ở mức thuê $1.65/giờ: nhà cung cấp không thể thu hồi đầu tư11 - Ngưỡng lợi nhuận: $2.85/giờ để vượt IRR thị trường chứng khoán12

Bước hành động: 1. Kiểm toán chi tiêu hiện tại: Tính chi phí mỗi giờ hiệu quả trên tất cả việc sử dụng GPU 2. Đánh giá sử dụng: Đo sử dụng thực tế vs công suất dành riêng 3. Đánh giá tùy chọn cam kết: So sánh giá dành riêng 1 năm vs on-demand 4. Xem xét hybrid: Sở hữu cho baseline, thuê cho công suất tăng đột biến

Hướng dẫn chuyên nghiệp

Quyết định hạ tầng trong thị trường biến động được hưởng lợi từ quan điểm có kinh nghiệm.

550 kỹ sư hiện trường của Introl hỗ trợ các tổ chức điều hướng kinh tế hạ tầng GPU.16 Công ty xếp hạng #14 trên Inc. 5000 năm 2025 với tăng trưởng 9,594% trong ba năm.17

Chuyên môn trên 257 địa điểm toàn cầu cung cấp hiểu biết thị trường bất kể địa lý.18 Hướng dẫn chuyên nghiệp giúp các tổ chức đưa ra quyết định sáng suốt khi giá cả phát triển.

Điểm chính

Cho các đội mua sắm: - Giá H100 giảm 64% từ $8/giờ xuống $2.85-3.50/giờ - 300+ nhà cung cấp mới tăng cường cạnh tranh - Giá spot (GCP $2.25, AWS $2.50) cung cấp giá trị tốt nhất cho khối lượng công việc linh hoạt

Cho các nhà lập kế hoạch hạ tầng: - Hòa vốn cho sở hữu: 14-16 tháng ở 100% sử dụng - Sàn lợi nhuận nhà cung cấp: ~$1.65/giờ (giá khó có thể giảm thêm nhiều) - Giá cam kết ($1.90-2.10/giờ) vượt on-demand 40%+

Cho lập kế hoạch chiến lược: - Thị trường bình thường hóa sau tình trạng khan hiếm 2023-2024—không phải sự sụt giảm tạm thời - Giới thiệu Blackwell có thể đẩy giá H100 thấp hơn vào năm 2026 - Tính linh hoạt thuê có giá trị khi công nghệ phát triển nhanh chóng

Triển vọng

Sự sụp đổ giá cloud GPU đại diện cho sự bình thường hóa thị trường sau các điều kiện khan hiếm của 2023-2024. Các tổ chức được hưởng lợi từ khả năng tiếp cận GPU được cải thiện đáng kể, cho phép triển khai AI rộng rãi hơn. Môi trường giá có thể duy trì khi tăng trưởng nguồn cung tiếp tục đáp ứng cầu, với các giới thiệu thế hệ tiếp theo có khả năng mở rộng mô hình.

Các tổ chức nên tận dụng giá hiện tại cho các yêu cầu ngay lập tức trong khi duy trì tính linh hoạt cho sự phát triển thị trường. Các chiến lược thành công nhất sẽ cân bằng tính cấp bách triển khai với các cân nhắc thời gian thị trường, sử dụng tính linh hoạt thuê để tránh cam kết vốn sớm trong thị trường phát triển nhanh chóng.

Tài liệu tham khảo


Tính cấp bách: Cao — Thay đổi thị trường với tác động mua sắm ngay lập tức Số từ: ~1,800


  1. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. https://www.thundercompute.com/blog/ai-gpu-rental-market-trends 

  2. Silicon Data. "H100 Rental Market Cools in September." September 2025. https://www.silicondata.com/blog/h100-rental-market-update-september-2025 

  3. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  4. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. https://intuitionlabs.ai/articles/h100-rental-prices-cloud-comparison 

  5. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. 

  6. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  7. Silicon Data. "H100 Rental Market Cools in September." September 2025. 

  8. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  9. IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. 

  10. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  11. Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. https://cybernews.com/tech/gpu-rental-prices-are-crashing/ 

  12. Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. 

  13. Fortune. "IBM CEO warns there's 'no way' hyperscalers will turn a profit." December 2025. https://fortune.com/2025/12/03/ibm-ceo-no-way-hyperscalers-google-amazon-turn-profit-data-center-spending/ 

  14. CIO Dive. "'We're not dabbling here': AWS backs infrastructure investments." December 2025. https://www.ciodive.com/news/aws-ai-cloud-infrastructure-capacity-microsoft-google/746998/ 

  15. Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. 

  16. Introl. "Company Overview." Introl. 2025. https://introl.com 

  17. Inc. "Inc. 5000 2025." Inc. Magazine. 2025. 

  18. Introl. "Coverage Area." Introl. 2025. https://introl.com/coverage-area 

Request a Quote_

Tell us about your project and we'll respond within 72 hours.

> TRANSMISSION_COMPLETE

Request Received_

Thank you for your inquiry. Our team will review your request and respond within 72 hours.

QUEUED FOR PROCESSING