Infrastruktur AI ritel: dari sistem rekomendasi hingga optimalisasi inventaris
Diperbarui 11 Desember 2025
Pembaruan Desember 2025: Rekomendasi berbasis AI menyumbang hingga 35% pendapatan e-commerce (2025). AI memengaruhi 80% interaksi pelanggan ritel. 9 dari 10 peritel menerapkan AI untuk operasional. Rantai pasokan berbasis AI memangkas inventaris 20-30%, biaya logistik 5-20%. Amazon Rufus memproyeksikan laba operasional $700M+ (2025), tumbuh menjadi $1,2M pada 2027. Database vektor memungkinkan pencarian semantik menggantikan pencocokan kata kunci.
Rekomendasi berbasis AI akan menyumbang hingga 35% dari total pendapatan e-commerce pada 2025.¹ AI akan memengaruhi 80% interaksi pelanggan ritel.² Sembilan dari sepuluh peritel kini menerapkan AI untuk mengoptimalkan operasional, mempersonalisasi pengalaman pelanggan, dan memberdayakan karyawan.³ Industri ritel bertransformasi dari eksperimentasi AI ke penerapan produksi, dan kebutuhan infrastruktur berkembang sesuai dengan itu.
Cakupannya melampaui personalisasi. McKinsey memperkirakan bahwa sistem rantai pasokan berbasis AI memangkas tingkat inventaris sebesar 20-30% sekaligus mengurangi biaya logistik 5-20% melalui perencanaan, pengaturan rute, dan penginderaan permintaan yang lebih baik.⁴ Peramalan permintaan modern mencegah 65% kehabisan stok melalui prediksi berbasis AI.⁵ Amazon memproyeksikan asisten belanja AI-nya, Rufus, akan menyumbang lebih dari $700 juta laba operasional untuk 2025, tumbuh menjadi $1,2 miliar pada 2027.⁶ Investasi infrastruktur yang diperlukan untuk meraih manfaat ini kini mendorong strategi teknologi ritel.
Inferensi real-time menggerakkan personalisasi dalam skala besar
Mesin rekomendasi merupakan aplikasi AI ritel yang paling terlihat. Saran produk muncul di setiap halaman, di setiap email, dan melalui setiap titik kontak pelanggan. Sistem harus memproses jutaan permintaan per detik dengan latensi yang diukur dalam milidetik. Keterlambatan menurunkan pengalaman berbelanja; rekomendasi yang tidak tersedia mengurangi tingkat konversi.
Peritel memanfaatkan database vektor seperti Pinecone, Weaviate, dan Milvus untuk pencarian kemiripan berkinerja tinggi dalam aplikasi AI.⁷ Berbeda dengan pencarian berbasis kata kunci tradisional, pencarian vektor memungkinkan sistem AI mengambil informasi yang serupa secara konseptual, meningkatkan pemahaman kontekstual dan relevansi. Teknologi ini memungkinkan pencarian semantik dan sistem rekomendasi yang memahami maksud pelanggan daripada mencocokkan kata kunci.
Pasar inferensi AI akan tumbuh dari $106 miliar pada 2025 menjadi $255 miliar pada 2030, didorong oleh penerapan AI generatif real-time dan perluasan infrastruktur hyperscaler.⁸ Segmen GPU mendominasi karena kemampuan pemrosesan paralel yang unggul dan adopsi luas di seluruh pusat data untuk beban kerja inferensi model besar.⁹ Ritel merupakan bagian signifikan dari permintaan tersebut.
NVIDIA Merlin menyediakan platform bagi peritel untuk rekomendasi yang dipersonalisasi dalam skala besar.¹⁰ Framework ini menangani rekayasa data, pelatihan model, dan penyajian inferensi yang diperlukan untuk sistem rekomendasi produksi. Peritel dapat fokus pada logika bisnis sementara NVIDIA menyediakan kemampuan infrastruktur yang memungkinkan personalisasi real-time.
Infrastruktur hybrid menyeimbangkan edge dan cloud
Walmart mencontohkan arsitektur infrastruktur yang diterapkan peritel maju. Perusahaan mengoperasikan "model triplet," strategi hybrid-cloud yang menggabungkan penyedia cloud publik dengan cloud privat Walmart dan ribuan node edge di toko dan pusat distribusi.¹¹ Arsitektur ini memberikan fleksibilitas bagi pengembang untuk menerapkan beban kerja untuk pelatihan skala besar di pusat data atau inferensi latensi rendah di edge toko.
Penerapan edge terbukti esensial untuk aplikasi di dalam toko. Sistem computer vision yang mendeteksi inventaris di rak tidak dapat mentoleransi latensi cloud. Otomatisasi kasir memerlukan respons instan. Alat bantu karyawan harus berfungsi bahkan ketika konektivitas jaringan menurun. Node edge membawa kemampuan AI ke titik interaksi pelanggan.
Amazon membangun dan mengendalikan stack AI-nya melalui model fondasi proprietary seperti Titan dan kemitraan senilai miliaran dolar dengan Anthropic.¹² Investasi $20 miliar dalam AI dan pusat data mengintegrasikan layanan yang ditingkatkan AI di seluruh pengiriman, streaming video, dan logistik grocery.¹³ Melalui sistem proprietary Wellspring-nya, Amazon mengantisipasi pergeseran permintaan dengan mempertimbangkan cuaca regional, hari libur lokal, dan pola belanja yang sedang tren.¹⁴
Strategi infrastruktur mencerminkan posisi kompetitif yang berbeda. Integrasi vertikal Amazon menangkap nilai di seluruh stack. Pendekatan hybrid Walmart mempertahankan fleksibilitas sambil berinvestasi dalam kemampuan proprietary. Kedua pendekatan memerlukan investasi infrastruktur substansial dan keahlian khusus.
Peramalan permintaan dan optimalisasi inventaris
Peramalan permintaan berbasis AI mengurangi biaya inventaris sebesar 20-35% dan mencegah 65% kehabisan stok melalui peningkatan akurasi prediksi.¹⁵ Implementasi biasanya memakan waktu tiga hingga enam bulan dengan perencanaan yang tepat. ROI membenarkan investasi infrastruktur bagi peritel yang beroperasi dalam skala besar.
Pasar AI untuk manajemen inventaris tumbuh dari $7,38 miliar menjadi $9,6 miliar antara 2023 dan 2025, dengan proyeksi mencapai $27,23 miliar pada akhir dekade.¹⁶ Analis memperkirakan kemajuan Amazon dalam AI dan robotika akan menghasilkan penghematan biaya tahunan hingga $16 miliar pada 2032.¹⁷ Pusat fulfillment otomatis Walmart memangkas biaya per unit sebesar 20% dibandingkan situs manual, dengan proyeksi pengurangan biaya 30% pada akhir 2025.¹⁸
Agentic AI membawa peramalan melampaui prediksi menuju pengambilan keputusan otomatis. Sistem merekomendasikan penyesuaian real-time untuk inventaris, penetapan harga, dan strategi pengisian ulang.¹⁹ Evolusi ini mengarah pada perdagangan agent-to-agent di mana asisten pribadi konsumen berinteraksi dengan bot inventaris peritel, API penetapan harga, atau mesin promosi untuk menyelesaikan transaksi dalam milidetik.²⁰
Manhattan Active Inventory menyediakan machine learning cloud-native untuk peramalan permintaan dan optimalisasi inventaris di seluruh lingkungan omnichannel yang kompleks.²¹ O9 Solutions menciptakan teknologi digital twin yang memodelkan dan mensimulasikan skenario rantai pasokan secara real-time.²² Platform-platform ini memerlukan infrastruktur GPU untuk pelatihan dan inferensi sambil menyediakan kemampuan khusus ritel yang membedakannya dari alat AI tujuan umum.
Pertimbangan investasi infrastruktur
Lebih dari 60% peritel berencana meningkatkan investasi infrastruktur AI dalam 18 bulan ke depan.²³ Namun sebuah studi oleh NYU Stern menemukan bahwa 68% peritel menginvestasikan kurang dari $5 juta dalam infrastruktur AI pada 2025, sementara hanya 12% yang menginvestasikan lebih dari $50 juta.²⁴ Di antara peritel dengan pendapatan tahunan melebihi $500 juta, 47% menginvestasikan kurang dari $5 juta sementara 27% menginvestasikan lebih dari $50 juta.²⁵
Kesenjangan investasi menciptakan divergensi kompetitif. Peritel besar dengan investasi AI substansial meraih keuntungan personalisasi, optimalisasi inventaris, dan peningkatan efisiensi operasional. Peritel yang lebih kecil yang berinvestasi sederhana mungkin kesulitan bersaing dalam pengalaman pelanggan atau struktur biaya. Keunggulan teknologi berlipat ganda karena peritel terkemuka menginvestasikan kembali penghematan ke dalam kemampuan tambahan.
Edge AI muncul sebagai hal kritis untuk penerapan tingkat toko. Saat industri bergerak dari proyek percontohan ke penerapan skala penuh, pertanyaannya bergeser dari apakah menggunakan AI menjadi bagaimana mengimplementasikannya secara efisien di seluruh toko dan operasional.²⁶ Penerapan edge mengatasi persyaratan latensi sambil mengurangi ketergantungan pada konektivitas jaringan.
Peritel yang mengevaluasi infrastruktur AI harus mempertimbangkan stack lengkap: infrastruktur cloud untuk pelatihan dan pemrosesan batch, infrastruktur edge untuk inferensi tingkat toko, database vektor untuk pencarian kemiripan, dan platform MLOps untuk manajemen model. Komponen-komponen terintegrasi menjadi sistem koheren yang memberikan nilai bisnis hanya ketika semua elemen berfungsi bersama.
Implikasi strategis
Walmart membangun strategi agen AI-nya di atas fondasi proprietary termasuk platform MLOps Element dan model bahasa besar khusus ritel Wallaby, yang diorkestrasi melalui framework "Super Agent".²⁷ Investasi dalam infrastruktur AI khusus ritel menyediakan kemampuan yang tidak dapat ditandingi oleh alat tujuan umum. Peritel yang bersaing dengan Walmart harus membangun infrastruktur yang sebanding atau menemukan diferensiasi alternatif.
Transisi personalisasi ke agen merupakan tantangan infrastruktur berikutnya. Rekomendasi akan memberi jalan kepada loop keputusan berbasis agen di mana AI tidak hanya menyarankan tetapi juga mengeksekusi.²⁸ Ini memerlukan infrastruktur yang mendukung perdagangan agent-to-agent pada latensi milidetik dengan keandalan yang dituntut transaksi keuangan.
Asia-Pasifik muncul sebagai wilayah dengan pertumbuhan tercepat untuk adopsi mesin rekomendasi, didorong oleh ledakan e-commerce di India, Indonesia, dan Vietnam.²⁹ Peritel global harus menerapkan infrastruktur yang melayani pasar-pasar ini dengan latensi yang sesuai sambil memenuhi persyaratan residensi data lokal. Distribusi geografis infrastruktur AI ritel akan berkembang secara signifikan.
Pasar conversational commerce mencapai $8,8 miliar pada 2025 dan akan tumbuh menjadi $32,6 miliar pada 2035 dengan tingkat pertumbuhan tahunan gabungan 14,8%.³⁰ Pertumbuhan ini merupakan permintaan infrastruktur tambahan karena peritel menerapkan AI percakapan di seluruh layanan pelanggan, asisten belanja, dan aplikasi voice commerce. Investasi infrastruktur AI ritel akan terus meningkat sepanjang dekade ini.
Referensi
-
Amra and Elma. "TOP PRODUCT RECOMMENDATION ENGINE STATISTICS 2025." 2025. https://www.amraandelma.com/product-recommendation-engine-statistics/
-
Amra and Elma. "TOP PRODUCT RECOMMENDATION ENGINE STATISTICS 2025."
-
NVIDIA. "Retail Industry Solutions Powered by AI." 2025. https://www.nvidia.com/en-us/industries/retail/
-
Quid. "The State of AI in E-Commerce: 2025 Quid Trend Report." 2025. https://www.quid.com/knowledge-hub/resource-library/blog/the-state-of-ai-in-e-commerce-2025-quid-trend-report
-
Net Solutions. "AI in Retail Demand Forecasting: Smarter Inventory Strategies for 2025." 2025. https://www.netsolutions.com/insights/ai-retail-demand-forecasting/
-
PYMNTS. "Amazon and Walmart Focus AI Investments on Their Retail Soft Spots." 2025. https://www.pymnts.com/news/retail/2025/amazon-and-walmart-arent-surfing-retail-techs-tidal-wave-theyre-driving-it
-
Ignitiv. "How Will Agentic AI Reshape the Commerce Industry in 2025?" 2025. https://www.ignitiv.com/how-will-agentic-ai-reshape-the-commerce-industry-in-2025/
-
MarketsandMarkets. "AI Inference Market Size, Share & Growth, 2025 To 2030." 2025. https://www.marketsandmarkets.com/Market-Reports/ai-inference-market-189921964.html
-
MarketsandMarkets. "AI Inference Market Size, Share & Growth."
-
NVIDIA. "Retail Industry Solutions Powered by AI."
-
PYMNTS. "Amazon Bets on In-House AI Stack as Walmart Amplifies Workforce." 2025. https://www.pymnts.com/news/retail/2025/amazon-bets-on-in-house-ai-stack-as-walmart-amplifies-workforce
-
PYMNTS. "Amazon and Walmart Focus AI Investments on Their Retail Soft Spots."
-
PYMNTS. "Amazon and Walmart Jostle for Infrastructure Dominance." 2025. https://www.pymnts.com/news/retail/2025/amazon-and-walmart-turn-groceries-health-and-data-into-distinct-empires
-
PYMNTS. "Amazon and Walmart Focus AI Investments on Their Retail Soft Spots."
-
Net Solutions. "AI in Retail Demand Forecasting."
-
SuperAGI. "Top 10 AI Inventory Management Systems for 2025." 2025. https://superagi.com/top-10-ai-inventory-management-systems-for-2025-a-comprehensive-guide-to-forecasting-and-optimization/
-
SuperAGI. "Top 10 AI Inventory Management Systems for 2025."
-
PYMNTS. "Walmart Embraces Agentic AI in New Era of Retail." 2025. https://www.pymnts.com/news/artificial-intelligence/2025/walmart-embraces-agentic-ai-new-retail-era/
-
Invent.AI. "How AI is reshaping retail demand planning in 2025." 2025. https://www.invent.ai/blog/how-ai-is-reshaping-retail-demand-planning-in-2025
-
Ignitiv. "How Will Agentic AI Reshape the Commerce Industry in 2025?"
-
Manhattan Associates. "Manhattan Active Inventory." 2025. https://www.manh.com/products/manhattan-active-inventory
-
O9 Solutions. "Digital Twin Technology." 2025. https://o9solutions.com/
-
Coresight Research. "Retail AI Investment Survey." 2025.
-
NYU Stern. "Retail AI Infrastructure Investment Study." 2025.
-
NYU Stern. "Retail AI Infrastructure Investment Study."
-
Edge AI Vision Alliance. "Edge AI in Retail: From Pilot to Production." 2025.
-
PYMNTS. "Walmart Embraces Agentic AI in New Era of Retail."
-
Ignitiv. "How Will Agentic AI Reshape the Commerce Industry in 2025?"
-
Amra and Elma. "TOP PRODUCT RECOMMENDATION ENGINE STATISTICS 2025."
-
Future Market Insights. "Conversational Commerce Market Report." 2025.