리테일 AI 인프라: 추천 시스템에서 재고 최적화까지
2025년 12월 11일 업데이트
2025년 12월 업데이트: AI 기반 추천이 2025년 이커머스 매출의 최대 35%에 기여. AI가 리테일 고객 상호작용의 80%에 영향. 10개 리테일러 중 9개가 운영에 AI 배포. AI 기반 공급망이 재고 20-30%, 물류 비용 5-20% 절감. Amazon Rufus가 2025년 7억 달러 이상의 영업이익 전망, 2027년까지 12억 달러로 성장. 벡터 데이터베이스가 키워드 매칭을 대체하는 시맨틱 검색 구현.
AI 기반 추천은 2025년 전체 이커머스 매출의 최대 35%에 기여할 것이다.¹ AI는 리테일 고객 상호작용의 80%에 영향을 미칠 것이다.² 현재 10개 리테일러 중 9개가 운영 최적화, 고객 경험 개인화, 직원 역량 강화를 위해 AI를 배포하고 있다.³ 리테일 산업은 AI 실험 단계에서 프로덕션 배포 단계로 전환했으며, 인프라 요구사항도 그에 맞게 확장되었다.
그 범위는 개인화를 넘어선다. McKinsey는 AI 기반 공급망 시스템이 더 나은 계획, 라우팅, 수요 감지를 통해 재고 수준을 20-30% 줄이고 물류 비용을 5-20% 절감한다고 추정한다.⁴ 현대의 수요 예측은 AI 기반 예측을 통해 65%의 품절을 방지한다.⁵ Amazon은 AI 쇼핑 어시스턴트 Rufus가 2025년 7억 달러 이상의 영업이익에 기여하고, 2027년까지 12억 달러로 성장할 것으로 전망한다.⁶ 이러한 이점을 확보하기 위해 필요한 인프라 투자가 현재 리테일 기술 전략을 주도하고 있다.
실시간 추론이 대규모 개인화를 가능하게 하다
추천 엔진은 가장 눈에 띄는 리테일 AI 애플리케이션이다. 상품 제안은 모든 페이지, 모든 이메일, 모든 고객 접점에서 나타난다. 이 시스템은 밀리초 단위의 지연 시간으로 초당 수백만 건의 요청을 처리해야 한다. 지연은 쇼핑 경험을 저하시키고, 추천이 제공되지 않으면 전환율이 감소한다.
리테일러들은 AI 애플리케이션에서 고성능 유사도 검색을 위해 Pinecone, Weaviate, Milvus와 같은 벡터 데이터베이스를 활용한다.⁷ 기존 키워드 기반 검색과 달리 벡터 검색은 AI 시스템이 개념적으로 유사한 정보를 검색할 수 있게 하여 맥락 이해와 관련성을 향상시킨다. 이 기술은 키워드 매칭이 아닌 고객 의도를 이해하는 시맨틱 검색과 추천 시스템을 가능하게 한다.
AI 추론 시장은 실시간 생성형 AI 배포와 확장된 하이퍼스케일러 인프라에 힘입어 2025년 1,060억 달러에서 2030년 2,550억 달러로 성장할 것이다.⁸ GPU 부문은 우수한 병렬 처리 능력과 대규모 모델 추론 워크로드를 위한 데이터 센터 전반의 광범위한 채택으로 인해 시장을 지배한다.⁹ 리테일은 그 수요의 상당 부분을 차지한다.
NVIDIA Merlin은 리테일러에게 대규모 개인화 추천을 위한 플랫폼을 제공한다.¹⁰ 이 프레임워크는 프로덕션 추천 시스템에 필요한 데이터 엔지니어링, 모델 훈련, 추론 서빙을 처리한다. 리테일러는 비즈니스 로직에 집중할 수 있고, NVIDIA는 실시간 개인화를 가능하게 하는 인프라 역량을 제공한다.
하이브리드 인프라가 엣지와 클라우드의 균형을 맞추다
Walmart는 선진 리테일러들이 배포하는 인프라 아키텍처의 대표적인 예다. 이 회사는 퍼블릭 클라우드 제공업체와 Walmart의 프라이빗 클라우드, 그리고 매장과 물류 센터의 수천 개 엣지 노드를 결합한 하이브리드 클라우드 전략인 "트리플렛 모델"을 운영한다.¹¹ 이 아키텍처는 개발자에게 데이터 센터에서의 대규모 훈련이나 매장 엣지에서의 저지연 추론을 위해 워크로드를 유연하게 배포할 수 있게 한다.
엣지 배포는 매장 내 애플리케이션에 필수적이다. 진열대의 재고를 감지하는 컴퓨터 비전 시스템은 클라우드 지연을 허용할 수 없다. 셀프 계산 자동화는 즉각적인 응답이 필요하다. 직원 지원 도구는 네트워크 연결이 불안정할 때도 작동해야 한다. 엣지 노드는 AI 역량을 고객 상호작용 지점으로 가져온다.
Amazon은 독자적인 파운데이션 모델인 Titan과 Anthropic과의 수십억 달러 파트너십을 통해 자체 AI 스택을 구축하고 통제한다.¹² 200억 달러의 AI 및 데이터 센터 투자는 배송, 비디오 스트리밍, 식료품 물류 전반에 걸쳐 AI 강화 서비스를 통합한다.¹³ Amazon은 독자적인 Wellspring 시스템을 통해 지역 날씨, 현지 공휴일, 트렌드 쇼핑 패턴을 고려하여 수요 변화를 예측한다.¹⁴
이러한 인프라 전략은 서로 다른 경쟁적 위치를 반영한다. Amazon의 수직 통합은 스택 전반에서 가치를 포착한다. Walmart의 하이브리드 접근 방식은 독자적 역량에 투자하면서도 유연성을 유지한다. 두 접근 방식 모두 상당한 인프라 투자와 전문 지식이 필요하다.
수요 예측 및 재고 최적화
AI 기반 수요 예측은 예측 정확도 향상을 통해 재고 비용을 20-35% 줄이고 65%의 품절을 방지한다.¹⁵ 적절한 계획을 통해 구현에는 일반적으로 3개월에서 6개월이 소요된다. ROI는 규모 있는 리테일러에게 인프라 투자를 정당화한다.
재고 관리를 위한 AI 시장은 2023년과 2025년 사이에 73억 8천만 달러에서 96억 달러로 성장했으며, 10년 말까지 272억 3천만 달러에 도달할 것으로 전망된다.¹⁶ 분석가들은 Amazon의 AI 및 로보틱스 발전이 2032년까지 연간 최대 160억 달러의 비용 절감을 창출할 것으로 추정한다.¹⁷ Walmart의 자동화 풀필먼트 센터는 수동 사이트 대비 단위 비용을 20% 절감했으며, 2025년 말까지 30% 비용 절감을 전망하고 있다.¹⁸
에이전틱 AI는 예측을 넘어 자동화된 의사결정으로 발전한다. 시스템은 재고, 가격, 보충 전략에 대한 실시간 조정을 권장한다.¹⁹ 이러한 진화는 소비자의 개인 어시스턴트가 리테일러의 재고 봇, 가격 API, 프로모션 엔진과 상호작용하여 밀리초 내에 거래를 완료하는 에이전트 대 에이전트 커머스를 향해 나아가고 있다.²⁰
Manhattan Active Inventory는 복잡한 옴니채널 환경 전반의 수요 예측 및 재고 최적화를 위한 클라우드 네이티브 머신러닝을 제공한다.²¹ O9 Solutions는 실시간으로 공급망 시나리오를 모델링하고 시뮬레이션하는 디지털 트윈 기술을 만든다.²² 이러한 플랫폼은 훈련과 추론을 위한 GPU 인프라가 필요하며, 범용 AI 도구와 차별화되는 리테일 특화 역량을 제공한다.
인프라 투자 고려사항
60% 이상의 리테일러가 향후 18개월 내에 AI 인프라 투자를 늘릴 계획이다.²³ 그러나 NYU Stern의 연구에 따르면 2025년 리테일러의 68%가 AI 인프라에 500만 달러 미만을 투자했으며, 5,000만 달러 이상을 투자한 기업은 12%에 불과했다.²⁴ 연간 매출 5억 달러 이상의 리테일러 중 47%가 500만 달러 미만을 투자했고 27%가 5,000만 달러 이상을 투자했다.²⁵
이러한 투자 격차는 경쟁적 분화를 만든다. 상당한 AI 투자를 한 대형 리테일러는 개인화 이점, 재고 최적화, 운영 효율성 개선을 확보한다. 적은 투자를 한 소규모 리테일러는 고객 경험이나 비용 구조에서 경쟁하기 어려울 수 있다. 선도 리테일러가 절감액을 추가 역량에 재투자하면서 기술 우위가 복리로 증가한다.
엣지 AI는 매장 수준 배포에 필수적으로 부상한다. 업계가 파일럿 프로젝트에서 전면 배포로 이동함에 따라, 질문은 AI를 사용할지 여부에서 매장과 운영 전반에 걸쳐 효율적으로 구현하는 방법으로 바뀐다.²⁶ 엣지 배포는 네트워크 연결 의존도를 줄이면서 지연 요구사항을 해결한다.
AI 인프라를 평가하는 리테일러는 전체 스택을 고려해야 한다: 훈련 및 배치 처리를 위한 클라우드 인프라, 매장 수준 추론을 위한 엣지 인프라, 유사도 검색을 위한 벡터 데이터베이스, 모델 관리를 위한 MLOps 플랫폼. 이러한 구성요소들은 모든 요소가 함께 작동할 때만 비즈니스 가치를 제공하는 일관된 시스템으로 통합된다.
전략적 시사점
Walmart는 독자적인 Element MLOps 플랫폼과 리테일 특화 대규모 언어 모델인 Wallaby를 포함한 독자적 기반 위에 AI 에이전트 전략을 구축하며, "Super Agent" 프레임워크를 통해 조율한다.²⁷ 리테일 특화 AI 인프라에 대한 투자는 범용 도구가 제공할 수 없는 역량을 제공한다. Walmart와 경쟁하는 리테일러는 비슷한 인프라를 구축하거나 대안적인 차별화를 찾아야 한다.
개인화에서 에이전트로의 전환은 다음 인프라 과제를 나타낸다. 추천은 AI가 제안할 뿐만 아니라 실행하는 에이전트 기반 의사결정 루프로 자리를 내줄 것이다.²⁸ 이를 위해서는 금융 거래가 요구하는 신뢰성으로 밀리초 지연 시간의 에이전트 대 에이전트 커머스를 지원하는 인프라가 필요하다.
아시아 태평양은 인도, 인도네시아, 베트남의 급성장하는 이커머스에 힘입어 추천 엔진 채택에서 가장 빠르게 성장하는 지역으로 부상한다.²⁹ 글로벌 리테일러는 현지 데이터 거주 요건을 충족하면서 적절한 지연 시간으로 이러한 시장에 서비스를 제공하는 인프라를 배포해야 한다. 리테일 AI 인프라의 지리적 분포는 크게 확장될 것이다.
대화형 커머스 시장은 2025년 88억 달러에 도달했으며 연평균 14.8%의 성장률로 2035년까지 326억 달러로 성장할 것이다.³⁰ 이러한 성장은 리테일러가 고객 서비스, 쇼핑 어시스턴트, 음성 커머스 애플리케이션 전반에 대화형 AI를 배포함에 따라 추가적인 인프라 수요를 나타낸다. 리테일 AI 인프라 투자는 10년 내내 계속 가속화될 것이다.
참고문헌
-
Amra and Elma. "TOP PRODUCT RECOMMENDATION ENGINE STATISTICS 2025." 2025. https://www.amraandelma.com/product-recommendation-engine-statistics/
-
Amra and Elma. "TOP PRODUCT RECOMMENDATION ENGINE STATISTICS 2025."
-
NVIDIA. "Retail Industry Solutions Powered by AI." 2025. https://www.nvidia.com/en-us/industries/retail/
-
Quid. "The State of AI in E-Commerce: 2025 Quid Trend Report." 2025. https://www.quid.com/knowledge-hub/resource-library/blog/the-state-of-ai-in-e-commerce-2025-quid-trend-report
-
Net Solutions. "AI in Retail Demand Forecasting: Smarter Inventory Strategies for 2025." 2025. https://www.netsolutions.com/insights/ai-retail-demand-forecasting/
-
PYMNTS. "Amazon and Walmart Focus AI Investments on Their Retail Soft Spots." 2025. https://www.pymnts.com/news/retail/2025/amazon-and-walmart-arent-surfing-retail-techs-tidal-wave-theyre-driving-it
-
Ignitiv. "How Will Agentic AI Reshape the Commerce Industry in 2025?" 2025. https://www.ignitiv.com/how-will-agentic-ai-reshape-the-commerce-industry-in-2025/
-
MarketsandMarkets. "AI Inference Market Size, Share & Growth, 2025 To 2030." 2025. https://www.marketsandmarkets.com/Market-Reports/ai-inference-market-189921964.html
-
MarketsandMarkets. "AI Inference Market Size, Share & Growth."
-
NVIDIA. "Retail Industry Solutions Powered by AI."
-
PYMNTS. "Amazon Bets on In-House AI Stack as Walmart Amplifies Workforce." 2025. https://www.pymnts.com/news/retail/2025/amazon-bets-on-in-house-ai-stack-as-walmart-amplifies-workforce
-
PYMNTS. "Amazon and Walmart Focus AI Investments on Their Retail Soft Spots."
-
PYMNTS. "Amazon and Walmart Jostle for Infrastructure Dominance." 2025. https://www.pymnts.com/news/retail/2025/amazon-and-walmart-turn-groceries-health-and-data-into-distinct-empires
-
PYMNTS. "Amazon and Walmart Focus AI Investments on Their Retail Soft Spots."
-
Net Solutions. "AI in Retail Demand Forecasting."
-
SuperAGI. "Top 10 AI Inventory Management Systems for 2025." 2025. https://superagi.com/top-10-ai-inventory-management-systems-for-2025-a-comprehensive-guide-to-forecasting-and-optimization/
-
SuperAGI. "Top 10 AI Inventory Management Systems for 2025."
-
PYMNTS. "Walmart Embraces Agentic AI in New Era of Retail." 2025. https://www.pymnts.com/news/artificial-intelligence/2025/walmart-embraces-agentic-ai-new-retail-era/
-
Invent.AI. "How AI is reshaping retail demand planning in 2025." 2025. https://www.invent.ai/blog/how-ai-is-reshaping-retail-demand-planning-in-2025
-
Ignitiv. "How Will Agentic AI Reshape
[번역을 위해 내용이 잘림]