Thị trường GPU thứ cấp: Mua bán phần cứng AI đã qua sử dụng
Cập nhật ngày 11 tháng 12 năm 2025
Cập nhật tháng 12/2025: Các GPU H100 của CoreWeave từ hợp đồng hết hạn năm 2022 đang được đặt lại ngay lập tức với giá bằng 95% so với ban đầu. Các hyperscaler đã kéo dài thời gian khấu hao lên 6 năm, tiết kiệm ~18 tỷ USD hàng năm trên hơn 300 tỷ USD CapEx. Chuỗi giá trị: Năm 1-2 cho huấn luyện tiên phong, 3-4 cho suy luận, 5-6 cho các tác vụ theo lô. Jensen Huang đùa rằng "khi Blackwell xuất xưởng, bạn không thể tặng Hopper cho ai"—nhưng nhu cầu suy luận giữ cho phần cứng thế hệ trước vẫn còn giá trị.
Các GPU H100 của CoreWeave từ hợp đồng hết hạn năm 2022 đã được đặt lại ngay lập tức với giá bằng 95% so với ban đầu.¹ Dữ liệu này tiết lộ điều gì đó ngược trực giác: các bộ tăng tốc AI vẫn giữ được giá trị đáng kể ngay cả khi NVIDIA phát hành các thế hệ mới hơn. Một thị trường thứ cấp trưởng thành đã hình thành cho phần cứng GPU doanh nghiệp, tạo cơ hội cho các tổ chức có được năng lực tính toán với mức giảm giá đáng kể trong khi cho phép người bán thu hồi vốn từ việc nâng cấp cơ sở hạ tầng.
Câu hỏi nghìn tỷ đô la đang lơ lửng trên các khoản đầu tư cơ sở hạ tầng AI—GPU thực sự mất giá nhanh như thế nào—định hình chiến lược mua sắm, kế hoạch tài chính và quyết định vòng đời cơ sở hạ tầng. Hiểu được động lực thị trường thứ cấp giúp doanh nghiệp tối ưu hóa việc mua GPU, lên lịch chu kỳ làm mới phần cứng và tối đa hóa lợi nhuận từ các khoản đầu tư cơ sở hạ tầng AI.
Cuộc tranh luận về khấu hao
Các hyperscaler và nhà cung cấp đám mây GPU bất đồng cơ bản về việc các bộ tăng tốc AI giữ giá trị kinh tế trong bao lâu:
Khấu hao kéo dài (6 năm): Amazon, Microsoft và Google đều đã kéo dài giả định thời gian sử dụng hữu ích của máy chủ từ 3-4 năm lên 6 năm vào năm 2023.² CoreWeave sử dụng chu kỳ khấu hao sáu năm. Cách xử lý kế toán này giảm đáng kể chi phí khấu hao hàng năm—ước tính cho thấy sự thay đổi đã giúp các hyperscaler tiết kiệm 18 tỷ USD chỉ riêng trong năm 2024 trên tổng CapEx hơn 300 tỷ USD.³
Khấu hao nhanh (2-3 năm): Những người phản đối cho rằng phần cứng AI tiến bộ quá nhanh cho các giả định sáu năm. NVIDIA phát hành kiến trúc mới mỗi 2 năm (A100 năm 2020, H100 năm 2022, B200 năm 2024), với mỗi thế hệ mang lại cải thiện hiệu suất 2-3 lần. Chính Jensen Huang đã đùa rằng "khi Blackwell bắt đầu xuất xưởng với số lượng lớn, bạn không thể tặng Hopper cho ai."⁴
Mô hình chuỗi giá trị: Một quan điểm tinh tế hơn nhận ra rằng GPU phục vụ các tác vụ khác nhau khi chúng già đi:⁵ - Năm 1-2: Huấn luyện mô hình tiên phong đòi hỏi hiệu suất tối đa - Năm 3-4: Suy luận thời gian thực giá trị cao nơi phần cứng thế hệ trước đủ dùng - Năm 5-6: Suy luận theo lô và các tác vụ phân tích
Khung chuỗi giải thích kinh nghiệm của CoreWeave: Các GPU A100 vẫn được đặt hết vì các tác vụ suy luận không cần silicon tiên tiến nhất. Các tổ chức huấn luyện mô hình tiên phong cần B200; các tổ chức phục vụ suy luận sản xuất thường không cần.
Giá thị trường hiện tại
Giá GPU thứ cấp phản ánh sự tương tác giữa nguồn cung phần cứng mới, nhu cầu suy luận và các chuyển đổi thế hệ:
Giá H100 (2025)
Mới/bán lẻ: - Giá cơ bản: 25.000-28.000 USD - Cấu hình tích hợp máy chủ: 35.000-40.000 USD+ - Giai đoạn khan hiếm nguồn cung: premium 40-60%⁶
Thị trường thứ cấp: - Ít sử dụng (1-2 năm): 70-85% giá mới - Sử dụng vừa phải (2-3 năm): 50-70% giá mới - Thị trường xám/eBay: giảm 20-40% nhưng có rủi ro bảo hành/hỗ trợ
Bối cảnh thuê đám mây: - Hyperscaler theo nhu cầu: 3-4 USD/giờ (giảm 44% so với 2024) - Nhà cung cấp giá rẻ: 1,80-2,50 USD/giờ - Hơn 300 nhà cung cấp mới gia nhập thị trường năm 2025⁷
Động lực giá A100
Giá A100 giảm mạnh hơn H100 trong các đợt điều chỉnh giữa năm 2025, phản ánh vị trí của GPU này trong một thị trường thứ cấp rộng hơn và thanh khoản hơn.⁸ A100 phục vụ các tác vụ đa dạng bao gồm suy luận, huấn luyện tầm trung và triển khai biên—chính xác là những ứng dụng nơi phần cứng đã qua sử dụng tìm được cuộc sống thứ hai.
Giá A100 thứ cấp hiện tại: - Phiên bản 40GB: 8.000-12.000 USD (từ hơn 15.000 USD khi mới) - Phiên bản 80GB: 12.000-18.000 USD (từ hơn 25.000 USD khi mới) - Gói máy chủ (8x A100): Giảm giá đáng kể khi mua số lượng lớn
Tác động của quá trình chuyển đổi B200
Việc B200 của NVIDIA sẵn sàng phổ biến (dự kiến Q1 2026) sẽ gây áp lực lên giá trị thứ cấp của H100. Các mẫu lịch sử cho thấy giảm giá 10-20% cho phần cứng thế hệ trước khi doanh nghiệp nâng cấp.⁹ Các tổ chức lên kế hoạch mua H100 nên tính thời điểm chuyển đổi vào quyết định mua sắm.
Chiến lược mua sắm
Mua GPU đã qua sử dụng
Chương trình tân trang có chứng nhận: Các nhà cung cấp lớn (Dell, HPE, Supermicro) cung cấp máy chủ GPU tân trang có chứng nhận với bảo hành. Giá thường thấp hơn 30-40% so với mới với bảo hành 1-2 năm. Cách tiếp cận này cân bằng tiết kiệm chi phí với đảm bảo hỗ trợ.
Dư thừa từ hyperscaler: Khi các nhà cung cấp đám mây làm mới cơ sở hạ tầng, lượng GPU đáng kể đi vào thị trường. Lên lịch mua hàng xung quanh các chu kỳ nâng cấp đã biết (AWS thường làm mới 3-4 năm sau khi ra mắt) có thể mang lại giá thuận lợi. Các kênh tiếp thị lại doanh nghiệp xử lý hầu hết khối lượng.
Mạng lưới môi giới: Các công ty xử lý tài sản CNTT chuyên biệt (ITAD) tổng hợp kho GPU từ nhiều người bán. Các môi giới uy tín xác minh nguồn gốc phần cứng, kiểm tra chức năng và cung cấp bảo hành hạn chế. Kỳ vọng tiết kiệm 20-30% so với tân trang có chứng nhận.
Mua trực tiếp từ doanh nghiệp: Các tổ chức nâng cấp cơ sở hạ tầng đôi khi bán trực tiếp cho người mua quen biết, đặc biệt trong các mạng lưới ngành. Giao dịch trực tiếp tránh phí môi giới nhưng yêu cầu thẩm định về tình trạng và nguồn gốc phần cứng.
Rủi ro thị trường xám: eBay, Alibaba và các nền tảng tương tự cung cấp mức giảm giá sâu nhất nhưng có rủi ro đáng kể: - Bảo hành hạn chế hoặc không có - Có thể có hạn chế firmware hoặc khóa vùng - Phần cứng giả hoặc bị xuyên tạc - Không hỗ trợ cập nhật driver/firmware
Mua hàng thị trường xám phù hợp với các tổ chức có chuyên môn phần cứng và khả năng chịu rủi ro cho các tác vụ không quan trọng.
Danh sách kiểm tra thẩm định
Trước khi mua GPU thứ cấp:
-
Xác minh nguồn gốc: Yêu cầu tài liệu mua hàng gốc, đặc biệt cho các H100 giá trị cao. Người bán hợp pháp cung cấp hóa đơn hiển thị các kênh phân phối được ủy quyền.
-
Kiểm tra tình trạng bảo hành: Một số bảo hành của nhà sản xuất chuyển nhượng cho chủ sở hữu tiếp theo; một số khác thì không. Xác minh phạm vi bảo hành trước khi giả định khả năng chuyển nhượng.
-
Kiểm tra chức năng: Kiểm tra căng thẳng GPU dưới các tác vụ đại diện trước khi hoàn tất mua hàng. Lỗi bộ nhớ, giảm xung nhiệt và suy giảm hiệu suất có thể không xuất hiện trong xác nhận cơ bản.
-
Xác nhận khả năng tương thích firmware/driver: Đảm bảo GPU có thể nhận cập nhật firmware hiện tại. Một số đơn vị thị trường xám bị hạn chế truy cập firmware.
-
Đánh giá tình trạng vật lý: Kiểm tra tình trạng xuống cấp của keo tản nhiệt, độ mòn quạt và hư hỏng vật lý. GPU từ trung tâm dữ liệu thường tốt hơn các đơn vị tiêu dùng do môi trường được kiểm soát.
Chiến lược bán hàng
Lên lịch làm mới phần cứng
Thời điểm bán tối ưu cân bằng nhiều yếu tố:
Yêu cầu hiệu suất: Bán khi phần cứng không còn đáp ứng nhu cầu tác vụ chính, không phải khi nó trở nên hoàn toàn lỗi thời. GPU hỗ trợ yêu cầu huấn luyện ngày hôm qua vẫn phục vụ các tác vụ suy luận ngày mai.
Điều kiện thị trường: Ra mắt kiến trúc mới làm giảm giá trị thế hệ trước tạm thời. Bán 6-12 tháng trước khi ra mắt thế hệ kế nhiệm dự kiến tối đa hóa thu hồi. Bán ngay sau khi ra mắt giảm thiểu thu hồi.
Nghĩa vụ hợp đồng: Cam kết đám mây hoặc điều khoản thuê có thể hạn chế thời điểm. Đưa các ràng buộc này vào kế hoạch làm mới.
CEO Microsoft Satya Nadella mô tả việc giãn cách mua chip AI để tránh "bị mắc kẹt với bốn hoặc năm năm khấu hao trên một thế hệ."¹⁰ Cách tiếp cận này đánh đổi giảm giá số lượng lấy rủi ro lỗi thời.
Kỳ vọng thu hồi
Bán lại GPU doanh nghiệp thường thu hồi 60-80% giá mua ban đầu tùy thuộc vào:¹¹ - Tuổi và tình trạng - Độ hiện tại của thế hệ (đã ra mắt bao nhiêu thế hệ kế nhiệm) - Cân bằng cung/cầu thị trường - Mức độ đầy đủ của gói (chỉ GPU so với máy chủ)
Chiến lược gói: Bán máy chủ GPU hoàn chỉnh như các giải pháp turnkey thường mang lại lợi nhuận tốt hơn so với tách riêng từng thành phần. Người mua đánh giá cao việc triển khai đơn giản; người bán giảm độ phức tạp tiếp thị lại.
Kênh bán hàng
Đối tác ITAD: Các công ty xử lý tài sản CNTT xử lý logistics, chứng nhận tiêu hủy dữ liệu và tìm nguồn người mua. Họ thường lấy 15-25% hoa hồng nhưng giảm đáng kể gánh nặng cho người bán.
Bán trực tiếp cho doanh nghiệp: Bán cho người mua quen biết (có thể thông qua hiệp hội ngành hoặc mạng lưới chuyên nghiệp) tránh phí môi giới nhưng yêu cầu người bán nỗ lực tìm người mua và đàm phán điều khoản.
Nền tảng đấu giá: Các cuộc đấu giá tập trung vào công nghệ tổng hợp nhu cầu người mua nhưng tạo ra sự không chắc chắn về giá. Phù hợp cho thanh lý kho hàng khi tốc độ quan trọng hơn tối ưu hóa giá.
Chương trình đổi cũ: Một số nhà cung cấp cung cấp tín dụng đổi cũ lấy mua phần cứng mới. Cách tiếp cận này đơn giản hóa giao dịch nhưng thường thu hồi ít hơn so với bán trên thị trường mở.
Cân nhắc lập kế hoạch tài chính
Tối ưu hóa lịch khấu hao
Các tổ chức nên điều chỉnh khấu hao kế toán với vòng đời phần cứng thực tế:
Cách tiếp cận bảo thủ (3 năm): Phù hợp với giai đoạn sử dụng chính thông thường. Chi phí khấu hao hàng năm cao hơn nhưng không có ghi giảm bất ngờ khi phần cứng trở nên lỗi thời.
Cách tiếp cận kéo dài (6 năm): Phù hợp với tiền lệ hyperscaler. Chi phí hàng năm thấp hơn nhưng yêu cầu sự tin tưởng vào việc duy trì giá trị thị trường thứ cấp.
Cách tiếp cận kết hợp: Khấu hao nhanh trong năm 1-2 (50-60% giá trị), khấu hao chậm hơn trong năm 3-6. Phản ánh kinh tế học chuỗi giá trị nơi sử dụng chính nắm bắt hầu hết giá trị.
Điều chỉnh tổng chi phí sở hữu
Đưa giá trị còn lại vào tính toán TCO:
Chi phí Hàng năm Hiệu quả = (Giá Mua - Dự kiến Bán lại) / Số năm Sử dụng
+ Chi phí Vận hành Hàng năm (điện, làm mát, hỗ trợ)
Ví dụ, máy chủ H100: - Mua: 300.000 USD - Dự kiến bán lại (4 năm): 90.000 USD (còn lại 30%) - Chi phí vận hành: 40.000 USD/năm - Chi phí hàng năm hiệu quả: (300.000 USD - 90.000 USD) / 4 + 40.000 USD = 92.500 USD
So với giả định giá trị còn lại bằng không: - Chi phí hàng năm hiệu quả: 300.000 USD / 4 + 40.000 USD = 115.000 USD
Chênh lệch TCO 20% tác động đáng kể đến quyết định xây dựng hay thuê.
Ảnh hưởng thuế
Tham khảo ý kiến cố vấn thuế về: - Lựa chọn phương pháp khấu hao (đường thẳng so với nhanh) - Khấu trừ Section 179 cho thiết bị đủ điều kiện - Thời điểm bán để tối ưu hóa lãi vốn - Khả năng trao đổi tương đương
Cấu trúc và người tham gia thị trường
Danh mục người bán
Hyperscaler: AWS, Azure và GCP định kỳ loại bỏ năng lực GPU, tạo nguồn cung thứ cấp đáng kể. Thường được chuyển qua các đối tác tiếp thị lại có chứng nhận thay vì thị trường mở.
Nhà cung cấp đám mây GPU: CoreWeave, Lambda Labs và các công ty tương tự làm mới cơ sở hạ tầng theo chu kỳ nhanh hơn hyperscaler. Hết hạn hợp đồng tạo nguồn cung có thể dự đoán.
Doanh nghiệp: Các tổ chức hoàn thành dự án AI hoặc thay đổi chiến lược bán công suất dư thừa. Chất lượng khác nhau rộng rãi dựa trên mẫu sử dụng và thực hành bảo trì.
Startup thất bại: Thất bại của công ty AI giải phóng kho GPU, đôi khi với giá khó khăn. Thẩm định quan trọng do nguồn gốc và lịch sử bảo trì không chắc chắn.
Danh mục người mua
Doanh nghiệp quan tâm chi phí: Các tổ chức có tác vụ suy luận hoặc ứng dụng nghiên cứu nơi phần cứng thế hệ trước đủ dùng.
Thị trường mới nổi: Các tổ chức ở các khu vực nhạy cảm về giá có được cơ sở hạ tầng với mức giá tiếp cận được.
Startup AI: Các công ty giai đoạn đầu khởi động năng lực tính toán trước khi đảm bảo tài trợ cho phần cứng mới.
Tổ chức nghiên cứu: Các tổ chức học thuật và phi lợi nhuận với ngân sách hạn chế tìm kiếm phần cứng có năng lực.
Động lực thị trường 2025
Một số yếu tố định hình điều kiện thị trường thứ cấp hiện tại:
Tác động thuế quan: Các chính sách thương mại Hoa Kỳ ban hành năm 2025 đã tăng chi phí linh kiện GPU 20-40%, ảnh hưởng
[Nội dung bị cắt ngắn cho bản dịch]