AMD MI350 và bối cảnh cạnh tranh GPU
Cập nhật ngày 11 tháng 12, 2025
Cập nhật tháng 12/2025: OpenAI nắm giữ tới 10% cổ phần trong AMD để đảm bảo nguồn cung 6GW GPU. MI350 xuất xưởng với 288GB HBM3e (so với 180GB của Blackwell), băng thông 8TB/s. Microsoft Azure chạy khối lượng công việc Copilot sản xuất trên MI300X. Oracle triển khai các siêu cụm MI300X 16.384-GPU. Ngăn xếp phần mềm ROCm của AMD đạt tới mức độ trưởng thành doanh nghiệp khi các lựa chọn thay thế NVIDIA đạt được độ tin cậy.
OpenAI đã công bố quan hệ đối tác với AMD bao gồm việc nắm giữ tới 10% cổ phần trong công ty để đảm bảo nguồn cung tới sáu gigawatt GPU.¹ AMD đã ký thỏa thuận vào tháng 10/2025 để cung cấp chip AI cho Oracle cho hạ tầng đám mây của họ.² Microsoft Azure hiện chạy cả mô hình độc quyền và mã nguồn mở trong sản xuất trên AMD Instinct MI300X.³ Trong khi NVIDIA duy trì 80% đến 95% thị trường GPU AI, AMD đã thiết lập mình như một lựa chọn thay thế đáng tin cậy mà các doanh nghiệp ngày càng xem xét cho khối lượng công việc suy luận và tối ưu hóa chi phí.⁴
Dòng MI350 ra mắt trong Q3 2025 với thông số kỹ thuật thách thức Blackwell của NVIDIA trên giấy: 288 gigabyte bộ nhớ HBM3e, băng thông 8 terabyte mỗi giây, và tuyên bố hiệu suất AI 2.2x so với các bộ tăng tốc cạnh tranh.⁵ Câu hỏi dành cho các nhà quy hoạch hạ tầng doanh nghiệp là liệu các lợi thế phần cứng của AMD và ngăn xếp phần mềm được cải thiện có biện minh cho việc chuyển đổi từ hệ sinh thái đã thiết lập của NVIDIA hay không.
Thông số kỹ thuật và định vị MI350
Dòng AMD Instinct MI350 có 185 tỷ transistor và 288 gigabyte bộ nhớ HBM3e.⁶ Được xây dựng trên kiến trúc AMD CDNA thế hệ thứ 4, dòng MI350 cung cấp hỗ trợ kiểu dữ liệu mở rộng bao gồm MXFP6 và MXFP4 cho suy luận AI, đào tạo và khối lượng công việc HPC.⁷ Nền tảng MI355X hàng đầu cung cấp tới 4x hiệu suất lý thuyết đỉnh so với thế hệ trước MI300X.⁸
Dung lượng bộ nhớ cung cấp lợi thế phần cứng rõ ràng nhất của AMD. 288 gigabyte HBM3e của MI355X vượt quá H200 Hopper của NVIDIA ở mức 141 gigabyte và B200 Blackwell ở mức 180 gigabyte.⁹ Băng thông bộ nhớ đạt 8 terabyte mỗi giây so với 4.8 terabyte mỗi giây của H200 và 7.7 terabyte mỗi giây của B200.¹⁰
Tiêu thụ điện năng đạt 1.400 watt cho MI355X, phù hợp với yêu cầu của Blackwell Ultra.¹¹ Các hồ sơ năng lượng tương tự có nghĩa là yêu cầu hạ tầng không khác biệt đáng kể giữa các nhà cung cấp ở tầng hiệu suất này.
AMD đã thử nghiệm MI355X so với các nền tảng NVIDIA B200 và GB200, đo thông lượng đào tạo để tinh chỉnh Llama2-70B và thông lượng suy luận trên Llama 3.1-405B.¹² Các điểm chuẩn cho thấy hiệu suất cạnh tranh, mặc dù kết quả thực tế phụ thuộc nhiều vào tối ưu hóa phần mềm.
MI350 đã xuất xưởng cho các đối tác và trung tâm dữ liệu siêu quy mô trong Q3 2025.¹³ Chu kỳ làm mới bộ tăng tốc hàng năm của AMD tiếp tục với dòng MI400 được xác nhận để phát triển năm 2026.¹⁴ Thiết kế tham khảo Helios AI tích hợp GPU MI400, CPU EPYC Venice và NIC Pensando Vulcano trong kiến trúc rack đầy đủ.¹⁵
Việc áp dụng của nhà cung cấp đám mây tăng tốc
IBM Cloud sẽ bổ sung GPU AMD Instinct MI300X trong nửa đầu năm 2025.¹⁶ Sự hợp tác cho phép hỗ trợ các bộ tăng tốc AMD trong nền tảng AI watsonx của IBM và suy luận Red Hat Enterprise Linux AI.¹⁷ Trọng tâm doanh nghiệp nhắm mục tiêu khách hàng tìm kiếm các lựa chọn thay thế cho NVIDIA cho khối lượng công việc AI sản xuất.
Microsoft Azure đã ra mắt các cụm AI được hỗ trợ bởi MI300X tại các vùng Thụy Điển và Ireland để hỗ trợ khối lượng công việc Copilot tùy chỉnh.¹⁸ Microsoft chạy AMD trong sản xuất cho các mô hình độc quyền chứng minh rằng độ trưởng thành phần mềm đã đạt đến yêu cầu doanh nghiệp.
Instance Compute Supercluster của Oracle Cloud Infrastructure hỗ trợ tới 16.384 GPU MI300X trong một cụm duy nhất.¹⁹ Quy mô cho phép đào tạo và triển khai các mô hình với hàng trăm tỷ tham số.²⁰ Việc triển khai của Oracle tập trung vào các trường hợp sử dụng AI chăm sóc sức khỏe và genomic nơi dung lượng bộ nhớ của AMD cung cấp lợi thế.²¹
Các chiến thắng Vultr và Oracle Cloud chứng minh động lực ngày càng tăng đằng sau công nghệ bộ tăng tốc của AMD.²² Lenovo, Dell và SuperMicro đã công bố các dịch vụ dựa trên MI300.²³ Hệ sinh thái nhà cung cấp hiện hỗ trợ AMD ở quy mô doanh nghiệp.
Cohere triển khai các mô hình Command của mình trên AMD Instinct MI300X, cung cấp năng lượng cho suy luận LLM cấp doanh nghiệp với thông lượng cao và quyền riêng tư dữ liệu.²⁴ Việc áp dụng bởi các nhà cung cấp mô hình AI xác nhận vị thế của AMD cho khối lượng công việc suy luận.
Hệ sinh thái phần mềm trưởng thành
Hệ sinh thái phần mềm trong lịch sử đã hạn chế việc áp dụng AMD. Việc củng cố của CUDA đã khiến NVIDIA trở thành lựa chọn mặc định. Tình hình đã thay đổi đáng kể trong năm 2025.
PyTorch 3.1 cung cấp hỗ trợ ROCm gốc cho đào tạo và suy luận.²⁵ Các thư viện phổ biến bao gồm DeepSpeed và Hugging Face Accelerate đã thêm các cờ hiệu suất cụ thể cho AMD.²⁶ Các nhà phát triển ngày càng thoải mái xây dựng trực tiếp cho môi trường MI300X.²⁷
Các nhóm AI doanh nghiệp di chuyển khối lượng công việc suy luận sang AMD để giảm chi phí mà không hy sinh hiệu suất.²⁸ Sự khác biệt về chi phí quan trọng hơn đối với suy luận so với đào tạo vì suy luận chạy liên tục và chiếm ưu thế trong chi tiêu dài hạn.
CUDA của NVIDIA vẫn cung cấp việc áp dụng nhà phát triển rộng hơn và công cụ trưởng thành hơn.²⁹ Hiệu suất thực tế trong môi trường sản xuất thường ủng hộ NVIDIA do tối ưu hóa hệ sinh thái hơn là khả năng phần cứng thô.³⁰ Các tổ chức phải cân nhắc việc tiết kiệm chi phí so với đầu tư kỹ thuật cần thiết để tối ưu hóa cho AMD.
Việc mua lại các kỹ sư phần cứng và phần mềm AI từ Untether AI của AMD tăng cường khả năng biên dịch, phát triển kernel và thiết kế chip.³¹ Khoản đầu tư tăng cường vị thế của AMD trong thị trường suy luận nơi rào cản của CUDA thu hẹp.³²
Động lực thị trường và thị phần
NVIDIA duy trì 80% đến 95% thị trường GPU AI trong năm 2025.³³ Dữ liệu từ Wells Fargo cho thấy thị phần của NVIDIA trong các bộ tăng tốc AI vẫn nằm trong khoảng 80% và 90%.³⁴ NVIDIA nắm giữ hơn 90% thị phần trong không gian GPU trung tâm dữ liệu, với hầu hết mã AI cơ bản được xây dựng trên CUDA.³⁵
Doanh thu trung tâm dữ liệu của AMD trong Q3 2025 đạt 4.3 tỷ USD.³⁶ Doanh thu trung tâm dữ liệu một quý của NVIDIA vào cuối tháng 7/2025 đạt 41.1 tỷ USD.³⁷ Khoảng cách doanh thu chứng minh sự khác biệt quy mô giữa các nhà lãnh đạo thị trường.
Dữ liệu JPR cho thấy NVIDIA kiểm soát 94% thị trường GPU rời rạc trong khi AMD kiểm soát khoảng 6%.³⁸ Thị phần của AMD vẫn là vị trí thứ hai xa xôi, mặc dù thị trường đang mở rộng đủ nhanh để cả hai nhà cung cấp đều tăng trưởng.
Thị phần của AMD trong GPU AI trung tâm dữ liệu tăng đều đặn kể từ Q1 2023.³⁹ Trong Q1 2025, quá trình tăng tốc Blackwell khổng lồ của NVIDIA bắt đầu, và với câu trả lời của AMD chỉ đến vào Q3 2025, thị phần của AMD giảm tạm thời.⁴⁰ Chu kỳ cạnh tranh sẽ tiếp tục khi mỗi nhà cung cấp phát hành các thế hệ mới.
Cơ hội chiến lược cho AMD
AMD đã tạo ra một thị trường ngách trong thị trường suy luận nơi rào cản CUDA của NVIDIA hẹp hơn.⁴¹ Suy luận cuối cùng sẽ trở nên lớn hơn đào tạo, định vị AMD cho quỹ đạo tăng trưởng dài hạn của thị trường.⁴²
Phương pháp tiếp cận của AMD tập trung vào các cơ hội được lựa chọn chiến lược thay vì cố gắng phù hợp với NVIDIA trên tất cả các phân khúc.⁴³ Chiến lược này tăng trưởng phần của AMD trong thị trường mở rộng nhanh chóng trong khi tránh cạnh tranh trực tiếp nơi lợi thế của NVIDIA mạnh nhất.⁴⁴
Quan hệ đối tác OpenAI đại diện cho một sự xác thực lớn. Cam kết tiềm năng 200 tỷ USD của OpenAI cho tới sáu gigawatt GPU AMD báo hiệu niềm tin vào lộ trình của AMD.⁴⁵ Thỏa thuận cung cấp cho AMD một khách hàng marquee ảnh hưởng đến nhận thức doanh nghiệp.
Chiến lược định giá tích cực của AMD cắt giảm NVIDIA, mặc dù chỉ định giá không cho phép AMD phù hợp với hiệu suất của NVIDIA trong tăng trưởng thị phần.⁴⁶ Sự kết hợp của phần cứng cạnh tranh, phần mềm được cải thiện và định giá thuận lợi tạo ra cơ hội với các doanh nghiệp có ý thức về chi phí.
Cân nhắc triển khai doanh nghiệp
Các tổ chức đánh giá AMD nên xem xét hỗn hợp khối lượng công việc của họ. Khối lượng công việc đào tạo, đặc biệt là những khối lượng công việc có phụ thuộc CUDA rộng rãi, vẫn ưu tiên NVIDIA. Khối lượng công việc suy luận cung cấp nhiều cơ hội hơn cho việc áp dụng AMD với chi phí chuyển đổi thấp hơn.
Lợi thế dung lượng bộ nhớ quan trọng cho các mô hình lớn. 288 gigabyte của MI350 cho phép xử lý GPU đơn của các mô hình yêu cầu nhiều GPU NVIDIA. Lợi thế bộ nhớ giảm độ phức tạp hạ tầng cho các tổ chức chạy các mô hình lớn nhất.
Yêu cầu đầu tư phần mềm không nên được đánh giá thấp. Trong khi ROCm được cải thiện đáng kể, các nhóm quen thuộc với CUDA sẽ yêu cầu thời gian và tài nguyên để tối ưu hóa cho AMD. Đường cong học tập ảnh hưởng đến thời gian sản xuất cho các triển khai mới.
Các chiến lược đa nhà cung cấp cung cấp giảm thiểu rủi ro. Các tổ chức đủ điều kiện cho cả NVIDIA và AMD có thể đàm phán giá tốt hơn, tránh hạn chế nguồn cung và chọn phần cứng tối ưu cho từng loại khối lượng công việc. Khoản đầu tư hỗ trợ cả hai nền tảng mang lại lợi ích cho các triển khai lớn.
Truy cập AMD dựa trên đám mây giảm rào cản áp dụng. IBM, Microsoft, Oracle và các nhà cung cấp khác cung cấp các instance AMD cho phép thử nghiệm mà không cần mua sắm phần cứng. Các tổ chức có thể xác thực hiệu suất AMD trên khối lượng công việc của họ trước khi cam kết mua hạ tầng.
Khung quyết định nhanh
Lựa chọn AMD vs NVIDIA:
| Nếu khối lượng công việc của bạn là... | Xem xét | Lý do |
|---|---|---|
| Đào tạo với phụ thuộc CUDA | NVIDIA | Độ trưởng thành hệ sinh thái, công cụ |
| Suy luận ở quy mô | AMD MI350 | Tiết kiệm chi phí, lợi thế bộ nhớ |
| Mô hình lớn bị ràng buộc bộ nhớ | AMD MI350/355X | 288GB vs 180GB (B200) |
| Giảm thiểu rủi ro đa nhà cung cấp | Cả hai | Đa dạng hóa nguồn cung |
| Đánh giá dựa trên đám mây | AMD (IBM, Azure, Oracle) | Thử nghiệm mà không mua sắm |
So sánh thông số kỹ thuật:
| Thông số kỹ thuật | AMD MI355X | NVIDIA B200 | NVIDIA H200 |
|---|---|---|---|
| Bộ nhớ HBM | 288 GB | 180 GB | 141 GB |
| Băng thông bộ nhớ | 8 TB/s | 7.7 TB/s | 4.8 TB/s |
| TDP | 1,400W | 1,000W | 700W |
| Kiến trúc | CDNA 4 | Blackwell | Hopper |
| Thị phần | ~6% | ~80-95% | ~80-95% |
Những điểm chính
Dành cho kiến trúc sư hạ tầng: - AMD MI350 cung cấp 288GB HBM3e—nhiều hơn 60% so với 180GB của B200 - Ngăn xếp phần mềm ROCm trưởng thành đáng kể trong năm 2025—PyTorch 3.1 cung cấp hỗ trợ gốc - Khối lượng công việc suy luận cung cấp chi phí chuyển đổi thấp nhất từ NVIDIA - Các nhà cung cấp đám mây (IBM, Azure, Oracle) cho phép thử nghiệm mà không cần mua sắm phần cứng
Dành cho các nhóm mua sắm: - Cổ phần 10% AMD của OpenAI báo hiệu niềm tin nguồn cung dài hạn - Định giá AMD cắt giảm NVIDIA nhưng không dịch sang tăng trưởng thị phần tương đương - Chiến lược đa nhà cung cấp cho phép đòn bẩy đàm phán tốt hơn và khả năng phục hồi nguồn cung - Lợi thế dung lượng bộ nhớ cho phép xử lý GPU đơn của các mô hình lớn hơn
Dành cho quy hoạch chiến lược: - NVIDIA duy trì 80-95% thị phần—AMD là lựa chọn thay thế đáng tin cậy, không phải thay thế - Thị trường suy luận cuối cùng sẽ vượt quá đào tạo—phân khúc mục tiêu của AMD - Đầu tư phần mềm cần thiết cho tối ưu hóa AMD—yếu tố vào phân tích TCO - Dòng MI400 được xác nhận cho năm 2026—khả năng hiển thị lộ trình cải thiện quy hoạch
AMD sẽ vẫn là vị trí thứ hai xa xôi so với NVIDIA trong tương lai gần.⁴⁷ Tuy nhiên, thị trường AI lớn và đang tăng trưởng có nghĩa là ngay cả thị phần thiểu số cũng đại diện cho doanh thu đáng kể và thiết lập AMD như một lựa chọn doanh nghiệp khả thi. Các tổ chức phát triển chuyên môn AMD định vị mình cho tối ưu hóa chi phí và đa dạng hóa nguồn cung khi thị trường phát triển.
Tham khảo
-
Tech Research Online. "NVIDIA vs AMD (2025): GPUs, AI & Market Share." 2025. https://techresearchonline.com/blog/nvidia-vs-amd-the-gpu-battle-for-ai-dominance/
-
36Kr. "AMD's Aggressive Pricing Stabs Intel but Fails to Outperform NVIDIA." 2025. https://eu.36kr.com/en/p/3541331537719433
-
AMD Newsroom. "AMD Unveils Vision for an Open AI Ecosystem." June 2025. https://www.amd.com/en/newsroom/press-releases/2025-6-12-amd-unveils-vision-for-an-open-ai-ecosystem-detai.html
-
Tech Research Online. "NVIDIA vs AMD (2025)."
-
AMD. "AMD Instinct MI350 Series GPUs." 2025. https://www.amd.com/en/products/accelerators/instinct/mi350.html
-
Kontronn. "AMD Instinct MI350 Officially Announced: 185 Billion Transistors and 288GB HBM