Hạ tầng AI bán lẻ: từ hệ thống đề xuất đến tối ưu hóa tồn kho
Cập nhật ngày 11 tháng 12, 2025
Cập nhật tháng 12/2025: Đề xuất được hỗ trợ bởi AI đóng góp tới 35% tổng doanh thu thương mại điện tử năm 2025. AI tác động đến 80% tương tác khách hàng trong bán lẻ. Chín trên mười nhà bán lẻ triển khai AI cho vận hành. Chuỗi cung ứng dựa trên AI cắt giảm 20-30% tồn kho, 5-20% chi phí logistics. Amazon Rufus dự kiến lợi nhuận vận hành trên 700 triệu đô la (2025), tăng lên 1,2 tỷ đô la vào 2027. Cơ sở dữ liệu vector cho phép tìm kiếm ngữ nghĩa thay thế khớp từ khóa.
Đề xuất được hỗ trợ bởi AI sẽ đóng góp tới 35% tổng doanh thu thương mại điện tử vào năm 2025.¹ AI sẽ tác động đến 80% tương tác khách hàng trong bán lẻ.² Chín trên mười nhà bán lẻ hiện triển khai AI để tối ưu hóa vận hành, cá nhân hóa trải nghiệm khách hàng và hỗ trợ nhân viên.³ Ngành bán lẻ đã chuyển đổi từ thử nghiệm AI sang triển khai sản xuất, và yêu cầu hạ tầng cũng mở rộng theo.
Phạm vi mở rộng vượt ra ngoài cá nhân hóa. McKinsey ước tính rằng các hệ thống chuỗi cung ứng dựa trên AI cắt giảm mức tồn kho 20-30% đồng thời giảm chi phí logistics 5-20% thông qua lập kế hoạch, định tuyến và cảm nhận nhu cầu tốt hơn.⁴ Dự báo nhu cầu hiện đại ngăn chặn 65% tình trạng hết hàng thông qua dự đoán được hỗ trợ bởi AI.⁵ Amazon dự kiến trợ lý mua sắm AI Rufus sẽ đóng góp hơn 700 triệu đô la lợi nhuận vận hành cho năm 2025, tăng lên 1,2 tỷ đô la vào năm 2027.⁶ Đầu tư hạ tầng cần thiết để nắm bắt những lợi ích này hiện thúc đẩy chiến lược công nghệ bán lẻ.
Suy luận thời gian thực thúc đẩy cá nhân hóa quy mô lớn
Các công cụ đề xuất đại diện cho ứng dụng AI bán lẻ dễ nhận thấy nhất. Gợi ý sản phẩm xuất hiện trên mọi trang, trong mọi email và qua mọi điểm tiếp xúc khách hàng. Các hệ thống phải xử lý hàng triệu yêu cầu mỗi giây với độ trễ được đo bằng mili giây. Sự chậm trễ làm giảm trải nghiệm mua sắm; đề xuất không khả dụng làm giảm tỷ lệ chuyển đổi.
Các nhà bán lẻ tận dụng cơ sở dữ liệu vector như Pinecone, Weaviate và Milvus để tìm kiếm tương đồng hiệu suất cao trong các ứng dụng AI.⁷ Khác với tìm kiếm dựa trên từ khóa truyền thống, tìm kiếm vector cho phép hệ thống AI truy xuất thông tin tương đồng về mặt khái niệm, nâng cao hiểu biết ngữ cảnh và mức độ liên quan. Công nghệ này cho phép tìm kiếm ngữ nghĩa và hệ thống đề xuất hiểu ý định của khách hàng thay vì chỉ khớp từ khóa.
Thị trường suy luận AI sẽ tăng từ 106 tỷ đô la năm 2025 lên 255 tỷ đô la vào năm 2030, được thúc đẩy bởi triển khai AI sinh thành thời gian thực và mở rộng hạ tầng hyperscaler.⁸ Phân khúc GPU chiếm ưu thế nhờ khả năng xử lý song song vượt trội và được áp dụng rộng rãi trên các trung tâm dữ liệu cho khối lượng công việc suy luận mô hình lớn.⁹ Bán lẻ chiếm một phần đáng kể trong nhu cầu đó.
NVIDIA Merlin cung cấp cho các nhà bán lẻ nền tảng để đề xuất cá nhân hóa quy mô lớn.¹⁰ Framework xử lý kỹ thuật dữ liệu, huấn luyện mô hình và phục vụ suy luận cần thiết cho hệ thống đề xuất sản xuất. Các nhà bán lẻ có thể tập trung vào logic kinh doanh trong khi NVIDIA cung cấp khả năng hạ tầng cho phép cá nhân hóa thời gian thực.
Hạ tầng lai cân bằng biên và đám mây
Walmart là ví dụ điển hình về kiến trúc hạ tầng mà các nhà bán lẻ tiên tiến triển khai. Công ty vận hành "mô hình bộ ba," một chiến lược hybrid-cloud kết hợp các nhà cung cấp đám mây công cộng với đám mây riêng của Walmart và hàng nghìn nút biên trong các cửa hàng và trung tâm phân phối.¹¹ Kiến trúc này cho phép các nhà phát triển linh hoạt triển khai khối lượng công việc để huấn luyện quy mô lớn trong trung tâm dữ liệu hoặc suy luận độ trễ thấp tại biên cửa hàng.
Triển khai biên chứng minh là thiết yếu cho các ứng dụng trong cửa hàng. Hệ thống thị giác máy tính phát hiện tồn kho trên kệ không thể chịu được độ trễ đám mây. Tự động hóa thanh toán đòi hỏi phản hồi tức thì. Công cụ hỗ trợ nhân viên phải hoạt động ngay cả khi kết nối mạng suy giảm. Các nút biên đưa khả năng AI đến điểm tương tác khách hàng.
Amazon xây dựng và kiểm soát ngăn xếp AI của mình thông qua các mô hình nền tảng độc quyền như Titan và quan hệ đối tác hàng tỷ đô la với Anthropic.¹² Khoản đầu tư 20 tỷ đô la vào AI và trung tâm dữ liệu tích hợp các dịch vụ được nâng cao bởi AI trên giao hàng, phát trực tuyến video và logistics thực phẩm.¹³ Thông qua hệ thống Wellspring độc quyền, Amazon dự đoán sự thay đổi nhu cầu bằng cách tính đến thời tiết khu vực, ngày lễ địa phương và xu hướng mua sắm.¹⁴
Các chiến lược hạ tầng phản ánh các vị thế cạnh tranh khác nhau. Tích hợp dọc của Amazon nắm bắt giá trị trên toàn ngăn xếp. Cách tiếp cận lai của Walmart duy trì sự linh hoạt trong khi đầu tư vào các khả năng độc quyền. Cả hai cách tiếp cận đều đòi hỏi đầu tư hạ tầng đáng kể và chuyên môn chuyên biệt.
Dự báo nhu cầu và tối ưu hóa tồn kho
Dự báo nhu cầu dựa trên AI giảm chi phí tồn kho 20-35% và ngăn chặn 65% tình trạng hết hàng thông qua độ chính xác dự đoán được cải thiện.¹⁵ Triển khai thường mất ba đến sáu tháng với kế hoạch phù hợp. ROI biện minh cho đầu tư hạ tầng đối với các nhà bán lẻ hoạt động quy mô lớn.
Thị trường AI cho quản lý tồn kho tăng từ 7,38 tỷ đô la lên 9,6 tỷ đô la trong giai đoạn 2023-2025, với dự báo đạt 27,23 tỷ đô la vào cuối thập kỷ.¹⁶ Các nhà phân tích ước tính những tiến bộ của Amazon trong AI và robot sẽ tạo ra tiết kiệm chi phí hàng năm lên tới 16 tỷ đô la vào năm 2032.¹⁷ Các trung tâm thực hiện đơn hàng tự động của Walmart cắt giảm chi phí đơn vị 20% so với các địa điểm thủ công, với dự báo giảm chi phí 30% vào cuối năm 2025.¹⁸
AI đại lý đưa dự báo vượt ra ngoài dự đoán sang ra quyết định tự động. Các hệ thống đề xuất điều chỉnh thời gian thực về tồn kho, định giá và chiến lược bổ sung hàng.¹⁹ Sự phát triển hướng tới thương mại đại lý-với-đại lý nơi trợ lý cá nhân của người tiêu dùng tương tác với bot tồn kho của nhà bán lẻ, API định giá hoặc công cụ khuyến mãi để hoàn tất giao dịch trong mili giây.²⁰
Manhattan Active Inventory cung cấp học máy cloud-native cho dự báo nhu cầu và tối ưu hóa tồn kho trên các môi trường đa kênh phức tạp.²¹ O9 Solutions tạo công nghệ bản sao số mô hình hóa và mô phỏng các kịch bản chuỗi cung ứng theo thời gian thực.²² Các nền tảng này yêu cầu hạ tầng GPU để huấn luyện và suy luận đồng thời cung cấp các khả năng đặc thù bán lẻ giúp phân biệt chúng với các công cụ AI đa năng.
Cân nhắc đầu tư hạ tầng
Hơn 60% nhà bán lẻ có kế hoạch tăng đầu tư hạ tầng AI trong vòng 18 tháng tới.²³ Tuy nhiên, một nghiên cứu của NYU Stern phát hiện rằng 68% nhà bán lẻ đầu tư dưới 5 triệu đô la vào hạ tầng AI năm 2025, trong khi chỉ 12% đầu tư hơn 50 triệu đô la.²⁴ Trong số các nhà bán lẻ có doanh thu hàng năm vượt quá 500 triệu đô la, 47% đầu tư dưới 5 triệu đô la trong khi 27% đầu tư hơn 50 triệu đô la.²⁵
Khoảng cách đầu tư tạo ra sự phân hóa cạnh tranh. Các nhà bán lẻ lớn với đầu tư AI đáng kể nắm bắt lợi ích cá nhân hóa, tối ưu hóa tồn kho và cải thiện hiệu quả vận hành. Các nhà bán lẻ nhỏ hơn đầu tư khiêm tốn có thể gặp khó khăn trong cạnh tranh về trải nghiệm khách hàng hoặc cấu trúc chi phí. Lợi thế công nghệ tích lũy khi các nhà bán lẻ hàng đầu tái đầu tư tiết kiệm vào khả năng bổ sung.
Edge AI nổi lên là quan trọng cho triển khai cấp cửa hàng. Khi ngành chuyển từ các dự án thí điểm sang triển khai toàn diện, câu hỏi chuyển từ có nên sử dụng AI sang cách triển khai hiệu quả trên các cửa hàng và hoạt động.²⁶ Triển khai biên giải quyết yêu cầu độ trễ đồng thời giảm sự phụ thuộc vào kết nối mạng.
Các nhà bán lẻ đánh giá hạ tầng AI nên xem xét toàn bộ ngăn xếp: hạ tầng đám mây cho huấn luyện và xử lý hàng loạt, hạ tầng biên cho suy luận cấp cửa hàng, cơ sở dữ liệu vector cho tìm kiếm tương đồng và nền tảng MLOps cho quản lý mô hình. Các thành phần tích hợp thành các hệ thống nhất quán chỉ mang lại giá trị kinh doanh khi tất cả các yếu tố hoạt động cùng nhau.
Ý nghĩa chiến lược
Walmart xây dựng chiến lược AI đại lý trên nền tảng độc quyền bao gồm nền tảng MLOps Element và mô hình ngôn ngữ lớn đặc thù bán lẻ Wallaby, được điều phối thông qua framework "Super Agent".²⁷ Đầu tư vào hạ tầng AI đặc thù bán lẻ cung cấp các khả năng mà các công cụ đa năng không thể sánh được. Các nhà bán lẻ cạnh tranh với Walmart phải xây dựng hạ tầng tương đương hoặc tìm sự khác biệt thay thế.
Sự chuyển đổi từ cá nhân hóa sang đại lý đại diện cho thách thức hạ tầng tiếp theo. Đề xuất sẽ nhường chỗ cho các vòng lặp quyết định do đại lý điều khiển nơi AI không chỉ gợi ý mà còn thực hiện.²⁸ Điều này đòi hỏi hạ tầng hỗ trợ thương mại đại lý-với-đại lý ở độ trễ mili giây với độ tin cậy mà các giao dịch tài chính đòi hỏi.
Châu Á - Thái Bình Dương nổi lên là khu vực tăng trưởng nhanh nhất cho việc áp dụng công cụ đề xuất, được thúc đẩy bởi thương mại điện tử bùng nổ ở Ấn Độ, Indonesia và Việt Nam.²⁹ Các nhà bán lẻ toàn cầu phải triển khai hạ tầng phục vụ các thị trường này với độ trễ phù hợp đồng thời đáp ứng yêu cầu lưu trữ dữ liệu địa phương. Phân bố địa lý của hạ tầng AI bán lẻ sẽ mở rộng đáng kể.
Thị trường thương mại hội thoại đạt 8,8 tỷ đô la năm 2025 và sẽ tăng lên 32,6 tỷ đô la vào năm 2035 với tốc độ tăng trưởng kép hàng năm 14,8%.³⁰ Sự tăng trưởng đại diện cho nhu cầu hạ tầng bổ sung khi các nhà bán lẻ triển khai AI hội thoại trên dịch vụ khách hàng, hỗ trợ mua sắm và ứng dụng thương mại giọng nói. Đầu tư hạ tầng AI bán lẻ sẽ tiếp tục tăng tốc trong suốt thập kỷ.
Tài liệu tham khảo
-
Amra and Elma. "TOP PRODUCT RECOMMENDATION ENGINE STATISTICS 2025." 2025. https://www.amraandelma.com/product-recommendation-engine-statistics/
-
Amra and Elma. "TOP PRODUCT RECOMMENDATION ENGINE STATISTICS 2025."
-
NVIDIA. "Retail Industry Solutions Powered by AI." 2025. https://www.nvidia.com/en-us/industries/retail/
-
Quid. "The State of AI in E-Commerce: 2025 Quid Trend Report." 2025. https://www.quid.com/knowledge-hub/resource-library/blog/the-state-of-ai-in-e-commerce-2025-quid-trend-report
-
Net Solutions. "AI in Retail Demand Forecasting: Smarter Inventory Strategies for 2025." 2025. https://www.netsolutions.com/insights/ai-retail-demand-forecasting/
-
PYMNTS. "Amazon and Walmart Focus AI Investments on Their Retail Soft Spots." 2025. https://www.pymnts.com/news/retail/2025/amazon-and-walmart-arent-surfing-retail-techs-tidal-wave-theyre-driving-it
-
Ignitiv. "How Will Agentic AI Reshape the Commerce Industry in 2025?" 2025. https://www.ignitiv.com/how-will-agentic-ai-reshape-the-commerce-industry-in-2025/
-
MarketsandMarkets. "AI Inference Market Size, Share & Growth, 2025 To 2030." 2025. https://www.marketsandmarkets.com/Market-Reports/ai-inference-market-189921964.html
-
MarketsandMarkets. "AI Inference Market Size, Share & Growth."
-
NVIDIA. "Retail Industry Solutions Powered by AI."
-
PYMNTS. "Amazon Bets on In-House AI Stack as Walmart Amplifies Workforce." 2025. https://www.pymnts.com/news/retail/2025/amazon-bets-on-in-house-ai-stack-as-walmart-amplifies-workforce
-
PYMNTS. "Amazon and Walmart Focus AI Investments on Their Retail Soft Spots."
-
PYMNTS. "Amazon and Walmart Jostle for Infrastructure Dominance." 2025. https://www.pymnts.com/news/retail/2025/amazon-and-walmart-turn-groceries-health-and-data-into-distinct-empires
-
PYMNTS. "Amazon and Walmart Focus AI Investments on Their Retail Soft Spots."
-
Net Solutions. "AI in Retail Demand Forecasting."
-
SuperAGI. "Top 10 AI Inventory Management Systems for 2025." 2025. https://superagi.com/top-10-ai-inventory-management-systems-for-2025-a-comprehensive-guide-to-forecasting-and-optimization/
-
SuperAGI. "Top 10 AI Inventory Management Systems for 2025."
-
PYMNTS. "Walmart Embraces Agentic AI in New Era of Retail." 2025. https://www.pymnts.com/news/artificial-intelligence/2025/walmart-embraces-agentic-ai-new-retail-era/
-
Invent.AI. "How AI is reshaping retail demand planning in 2025." 2025. https://www.invent.ai/blog/how-ai-is-reshaping-retail-demand-planning-in-2025
-
Ignitiv. "How Will Agentic AI Reshape the Commerce Industry in 2025?"