โครงสร้างพื้นฐาน AI แบบ Embodied: ความต้องการ GPU สำหรับหุ่นยนต์และ Physical AI

การสร้างโครงสร้างพื้นฐานสำหรับ AI ที่เข้าใจและโต้ตอบกับโลกทางกายภาพ

โครงสร้างพื้นฐาน AI แบบ Embodied: ความต้องการ GPU สำหรับหุ่นยนต์และ Physical AI

โครงสร้างพื้นฐาน AI แบบ Embodied: ความต้องการ GPU สำหรับหุ่นยนต์และ Physical AI

อัปเดต 11 ธันวาคม 2025

อัปเดตธันวาคม 2025: NVIDIA Isaac Sim ทำงานบน AWS EC2 G6e (L40S GPUs) พร้อมการเพิ่มประสิทธิภาพการจำลองสูงขึ้น 2 เท่า โรงงาน AI อุตสาหกรรมในเยอรมนีเปิดตัวด้วย DGX B200 GPUs 10,000 ตัวสำหรับการใช้งานด้านการผลิต Physical AI ครอบคลุมยานยนต์ขับเคลื่อนอัตโนมัติ หุ่นยนต์แขนกลอุตสาหกรรม หุ่นยนต์ฮิวแมนนอยด์ และโรงงานที่ดำเนินการโดยหุ่นยนต์—ต้องการการฝึกฝนเซ็นเซอร์หลายรูปแบบ การจำลองฟิสิกส์ที่ซับซ้อน และการใช้งานแบบเรียลไทม์บนอุปกรณ์ Edge

NVIDIA Isaac Sim ทำงานบน Cloud Instance ของ L40S GPUs ใน Amazon EC2 G6e instances ให้การเพิ่มประสิทธิภาพ 2 เท่าสำหรับการขยายการจำลองหุ่นยนต์และการฝึกโมเดล AI ที่เร็วขึ้น[^1] ตัวเลือกการใช้งานนี้แสดงให้เห็นว่าโครงสร้างพื้นฐาน Cloud ขยายการเข้าถึงความต้องการประมวลผลมหาศาลของการพัฒนา AI แบบ Embodied ได้อย่างไร โรงงาน AI อุตสาหกรรมที่วางแผนไว้ในเยอรมนีจะมี NVIDIA DGX B200 และ RTX PRO servers เริ่มต้นด้วย GPUs 10,000 ตัว ช่วยให้ผู้นำอุตสาหกรรมยุโรปเร่งการใช้งานด้านการผลิตตั้งแต่การจำลองทางวิศวกรรมไปจนถึง Digital Twins ของโรงงานและหุ่นยนต์[^2]

Physical AI หมายถึงโมเดล AI ที่เข้าใจและโต้ตอบกับโลกทางกายภาพ เป็นตัวแทนของคลื่นลูกถัดไปของเครื่องจักรอัตโนมัติ รวมถึงรถยนต์ขับเคลื่อนอัตโนมัติ หุ่นยนต์แขนกลอุตสาหกรรม หุ่นยนต์เคลื่อนที่ หุ่นยนต์ฮิวแมนนอยด์ และโครงสร้างพื้นฐานที่ดำเนินการโดยหุ่นยนต์ เช่น โรงงานและคลังสินค้า[^3] ความต้องการโครงสร้างพื้นฐานแตกต่างอย่างมากจากโมเดลภาษาหรือตัวสร้างภาพ: ระบบ AI แบบ Embodied ต้องฝึกฝนบนเซ็นเซอร์หลากหลายรูปแบบ จำลองฟิสิกส์ที่ซับซ้อน และใช้งานบนอุปกรณ์ Edge ที่ทำงานแบบเรียลไทม์ภายใต้ข้อจำกัดทางกายภาพ

สถาปัตยกรรมคอมพิวเตอร์สามเครื่อง

แนวทางของ NVIDIA สำหรับโครงสร้างพื้นฐานหุ่นยนต์แยกงานออกเป็นสามแพลตฟอร์มประมวลผลที่ปรับให้เหมาะสมสำหรับความต้องการที่แตกต่างกัน

DGX สำหรับการฝึกโมเดล

ระบบ NVIDIA DGX รวมซอฟต์แวร์และโครงสร้างพื้นฐานที่เหมาะสำหรับการฝึก Foundation Models หลายรูปแบบสำหรับหุ่นยนต์[^4] โมเดลหุ่นยนต์รับข้อมูลหลายประเภท รวมถึงภาพจากกล้อง Point Clouds จาก Lidar การอ่านค่า Joint Encoder และการวัด Force-Torque โครงสร้างพื้นฐานการฝึกต้องจัดการข้อมูลที่หลากหลายในขนาดใหญ่ในขณะที่รักษาปริมาณงานที่จำเป็นสำหรับการปรับปรุงสถาปัตยกรรมโมเดล

Foundation Models สำหรับหุ่นยนต์ต้องการการฝึกทั้งข้อมูลจากโลกจริงและข้อมูลสังเคราะห์จากการจำลอง ปริมาณข้อมูลเกินกว่าการฝึกโมเดลภาษาทั่วไปเนื่องจากอินพุตเซ็นเซอร์มิติสูงและความสัมพันธ์ทางเวลาตลอด Trajectories ที่ยาว ระบบ DGX ให้แบนด์วิดท์ Interconnect และความจุหน่วยความจำที่การฝึกหลายรูปแบบขนาดใหญ่ต้องการ

Transfer Learning จาก Foundation Models ด้านการมองเห็นและภาษาเร่งการพัฒนาโมเดลหุ่นยนต์ โมเดลที่ฝึกบนข้อมูลภาพและข้อความระดับอินเทอร์เน็ตให้ Representations ที่ถ่ายโอนไปยังการรับรู้และการใช้เหตุผลของหุ่นยนต์ โครงสร้างพื้นฐานการฝึกรองรับการ Fine-tune โมเดลฐานขนาดใหญ่เหล่านี้บนข้อมูลเฉพาะหุ่นยนต์

OVX สำหรับการจำลอง

ระบบ OVX ให้ประสิทธิภาพกราฟิกและการประมวลผลชั้นนำของอุตสาหกรรมสำหรับงานจำลอง[^4] การเรนเดอร์แบบ Photorealistic สร้างข้อมูลฝึกสังเคราะห์ที่แยกไม่ออกจากภาพกล้องจริง การจำลองฟิสิกส์สร้างการอ่านค่าเซ็นเซอร์และพฤติกรรมหุ่นยนต์ที่ตรงกับความเป็นจริงทางกายภาพ

Isaac Lab รวมฟิสิกส์ GPU Parallel ความเที่ยงตรงสูง การเรนเดอร์ Photorealistic และสถาปัตยกรรมแบบโมดูลาร์สำหรับการออกแบบสภาพแวดล้อมและการฝึก Robot Policies[^5] Framework นี้รวม Actuator Models การจำลองเซ็นเซอร์หลายความถี่ Data Collection Pipelines และเครื่องมือ Domain Randomization ความเที่ยงตรงของการจำลองกำหนดว่า Policies ที่ฝึกแล้วจะถ่ายโอนไปยังหุ่นยนต์จริงได้ดีแค่ไหน

Massive Parallelism เร่งปริมาณงานการจำลอง ฟิสิกส์ที่เร่งด้วย GPU ช่วยให้หุ่นยนต์หลายพันตัวฝึกพร้อมกันในสถานการณ์ที่หลากหลาย Parallelism แปลงการเก็บข้อมูลโลกจริงหลายสัปดาห์เป็นประสบการณ์จำลองในไม่กี่ชั่วโมง

AGX สำหรับการใช้งาน

ระบบ AGX รวมถึง NVIDIA Jetson ให้ประสิทธิภาพและประสิทธิภาพพลังงานที่โดดเด่นสำหรับการใช้งานหุ่นยนต์[^4] การใช้งาน Edge ต้องการ Inference ที่อัตราเซ็นเซอร์ภายในงบประมาณพลังงานที่หุ่นยนต์ใช้แบตเตอรี่ให้ได้ แพลตฟอร์มประมวลผลต้องพอดีกับข้อจำกัดทางกายภาพในขณะที่รันโมเดลที่ซับซ้อน

Jetson Orin ให้ประสิทธิภาพ AI สูงถึง 275 TOPS ในรูปแบบที่เหมาะสมสำหรับหุ่นยนต์เคลื่อนที่และหุ่นยนต์แขนกล แพลตฟอร์มรันโค้ด CUDA เดียวกับที่พัฒนาบนระบบ DGX และ OVX ช่วยให้ใช้เครื่องมือที่สอดคล้องกันตลอดวงจรการพัฒนา

โครงสร้างพื้นฐานการใช้งานต้องจัดการข้อกำหนดเรียลไทม์ที่โครงสร้างพื้นฐานการฝึกไม่สนใจ Control Loops ที่ทำงานที่ 100Hz หรือเร็วกว่าเหลือเวลาเพียงมิลลิวินาทีสำหรับ Inference แพลตฟอร์ม Edge ต้องรับประกันขอบเขต Latency ที่ระบบพัฒนาบรรลุได้เฉพาะค่าเฉลี่ย

ความต้องการโครงสร้างพื้นฐานการจำลอง

โครงสร้างพื้นฐานการจำลองกำหนดความเร็วในการพัฒนา AI แบบ Embodied โดยควบคุมว่าทีมจะปรับปรุงสถาปัตยกรรมโมเดลและแนวทางการฝึกได้เร็วแค่ไหน

การขยายการจำลองฟิสิกส์

Isaac Lab รวมเข้ากับ NVIDIA Isaac Sim โดยใช้ฟิสิกส์ NVIDIA PhysX ที่เร่งด้วย GPU และการเรนเดอร์ RTX สำหรับการตรวจสอบความเที่ยงตรงสูง[^5] ความแม่นยำของการจำลองฟิสิกส์กำหนดความสำเร็จของการถ่ายโอน Sim-to-Real ฟิสิกส์ที่ง่ายลงซึ่งฝึกเร็วกว่าอาจสร้าง Policies ที่ล้มเหลวบนฮาร์ดแวร์จริง

การจำลอง Contact Dynamics ต้องการความเอาใจใส่พิเศษสำหรับงาน Manipulation หุ่นยนต์ที่จับวัตถุประสบแรงสัมผัสที่ซับซ้อนซึ่งฟิสิกส์ที่ง่ายลงประมาณได้ไม่ดี การจำลอง Contact ความเที่ยงตรงสูงเพิ่มความต้องการประมวลผลแต่ปรับปรุงการถ่ายโอนไปยังการจับจริง

การจำลองแบบขนานข้าม GPU Clusters เร่งการฝึกโดยรัน Environment Instances หลายพันตัวพร้อมกัน แต่ละ Environment ให้ประสบการณ์อิสระสำหรับ Policy Learning Parallelism ต้องการโครงสร้างพื้นฐานที่รองรับการฝึกแบบกระจายข้าม Simulated Environments

ความต้องการการเรนเดอร์

การเรนเดอร์ Photorealistic สร้างข้อมูลกล้องและ Depth Sensor ที่ตรงกับลักษณะเซ็นเซอร์จริง Domain Randomization เปลี่ยนแปลงแสง พื้นผิว และองค์ประกอบฉากเพื่อปรับปรุงการ Generalization ของ Policy Pipeline การเรนเดอร์ต้องรักษาปริมาณงานในขณะที่สร้างการสังเกตภาพที่หลากหลาย

RTX Ray Tracing ช่วยให้การจำลองแสงแม่นยำรวมถึงการสะท้อน เงา และ Global Illumination หุ่นยนต์ที่ทำงานในสภาพแวดล้อมอุตสาหกรรมพบแสงที่ซับซ้อนจากหน้าต่าง โคมไฟเหนือศีรษะ และพื้นผิวสะท้อนแสง การฝึกบนแสงที่แม่นยำปรับปรุงประสิทธิภาพการใช้งานในสถานที่จริง

การจำลอง Sensor Noise เพิ่มความเสื่อมที่สมจริงให้กับภาพที่เรนเดอร์และ Point Clouds เซ็นเซอร์จริงแสดง Noise ความเบลอ และ Artifacts ที่การจำลองที่สมบูรณ์แบบละเว้น Policies ที่ฝึกบนข้อมูลการจำลองที่สะอาดอาจล้มเหลวเมื่อเผชิญกับข้อมูลเซ็นเซอร์จริงที่มี Noise

สถาปัตยกรรม Data Pipeline

การจำลองสร้างปริมาณข้อมูลมหาศาลที่ต้องการการจัดเก็บและเรียกคืนอย่างมีประสิทธิภาพสำหรับการฝึก แคมเปญการจำลองเดียวอาจสร้าง Petabytes ของ Trajectories การสังเกต และ Rewards สถาปัตยกรรม Data Pipeline กำหนดว่าโครงสร้างพื้นฐานประมวลผลบรรลุการใช้งานเต็มที่หรืออดรอรอข้อมูล

Parallel File Systems เช่น Lustre และ GPFS ให้แบนด์วิดท์ที่ Clusters การจำลองและการฝึกต้องการ Network-Attached Storage ที่มีแบนด์วิดท์รวมเพียงพอป้อนข้อมูลไปยัง GPU Clusters ในอัตราที่ตรงกับการบริโภคการฝึก Storage ที่จัดเตรียมไม่เพียงพอสร้างคอขวดที่ GPU Compute ราคาแพงไม่สามารถเอาชนะได้

Data Versioning ติดตามการกำหนดค่าการจำลอง พารามิเตอร์ Environment และ Datasets ที่สร้างขึ้น Reproducibility ต้องการการสร้างใหม่ว่าการจำลองใดสร้างข้อมูลการฝึกใด Version Control สำหรับการกำหนดค่าการจำลองเสริม Model Versioning ใน Experiment Tracking

โครงสร้างพื้นฐานข้อมูลโลกจริง

การจำลองเพียงอย่างเดียวไม่สามารถฝึกหุ่นยนต์ที่ใช้งานได้ ข้อมูลโลกจริงจับปรากฏการณ์ทางกายภาพที่การจำลองประมาณได้ไม่สมบูรณ์

การจัดการฝูงหุ่นยนต์

ฝูงหุ่นยนต์จริงสร้างข้อมูลการฝึกผ่าน Teleoperation การทำงานอัตโนมัติ และการสาธิตโดยมนุษย์ โครงสร้างพื้นฐานการจัดการฝูงประสานงานการเก็บข้อมูลข้ามหุ่นยนต์หลายตัวที่ทำงานในสภาพแวดล้อมที่หลากหลาย การประสานงานรับประกันการครอบคลุมที่ครอบคลุมของสถานการณ์ที่หุ่นยนต์จะพบ

การเก็บข้อมูลจากหุ่นยนต์จริงต้องการการบันทึกที่แข็งแกร่งซึ่งจับเซ็นเซอร์ทุกรูปแบบที่ความละเอียดทางเวลาเต็มที่ ข้อมูลที่พลาดสร้างช่องว่างใน Training Sets ที่การจำลองต้องเติม โครงสร้างพื้นฐานการบันทึกที่เชื่อถือได้พิสูจน์ว่ามีค่ามากกว่าขั้นตอนการเก็บที่ซับซ้อนที่ใช้กับข้อมูลที่ไม่สมบูรณ์

Safety Monitoring ปกป้องหุ่นยนต์ สภาพแวดล้อม และมนุษย์ใกล้เคียงระหว่างการเก็บข้อมูล ระบบ AI แบบ Embodied ที่ทำงานในพื้นที่กายภาพสามารถก่อให้เกิดความเสียหายที่ระบบ AI ดิจิทัลล้วนไม่สามารถทำได้ โครงสร้างพื้นฐานความปลอดภัยเพิ่มความซับซ้อนแต่ช่วยให้การสำรวจเชิงรุกที่การฝึกต้องการ

โครงสร้างพื้นฐาน Annotation

Supervised Learning ต้องการ Labels ที่ผู้ทำ Annotation หรือระบบอัตโนมัติให้ โครงสร้างพื้นฐาน Annotation ขยายการสร้าง Label ให้ตรงกับอัตราการเก็บข้อมูล คอขวดใน Annotation จำกัดข้อมูลการฝึกที่มีประโยชน์โดยไม่คำนึงถึงปริมาณข้อมูลดิบ

Semantic Segmentation, Object Detection และ Labels Pose Estimation รองรับการฝึกโมเดล Perception Annotation ด้วยมือในขนาดใหญ่ต้องการการจัดการแรงงานกระจายและการควบคุมคุณภาพ Semi-Automated Annotation ที่รวมการทำนายโมเดลกับการตรวจสอบของมนุษย์ปรับปรุงปริมาณงาน

Trajectory Labeling สำหรับ Imitation Learning ระบุการสาธิตที่ประสบความสำเร็จที่ควรเลียนแบบ การประเมินคุณภาพแยกแยะการสาธิตผู้เชี่ยวชาญจากความล้มเหลวที่ Policies ควรหลีกเลี่ยง โครงสร้างพื้นฐาน Labeling ต้องจับความละเอียดเกินกว่าการจำแนกประเภทสำเร็จ/ล้มเหลวแบบไบนารี

การรวมข้อมูลหลายไซต์

องค์กรที่มีหุ่นยนต์ทำงานข้ามหลายสถานที่รวมข้อมูลส่วนกลางสำหรับการฝึก โครงสร้างพื้นฐานเครือข่ายต้องรองรับการถ่ายโอนข้อมูลขนาดใหญ่จากตำแหน่ง Edge ไปยัง Clusters ส่วนกลาง การตั้งเวลาการถ่ายโอนหลีกเลี่ยงการแย่งเครือข่ายในช่วงเวลาทำงาน

ข้อกำหนด Data Governance อาจจำกัดว่าข้อมูลหุ่นยนต์สามารถไหลไปที่ใด ข้อมูลเซ็นเซอร์ที่จับ Layout สถานที่ คนงาน หรือกระบวนการที่เป็นกรรมสิทธิ์เผชิญการควบคุมที่ข้อมูลข้อความหลีกเลี่ยงได้ โครงสร้างพื้นฐาน Compliance รับประกันการจัดการข้อมูลตรงตามข้อกำหนดขององค์กรและกฎระเบียบ

แนวทาง Federated Learning ฝึกโมเดลโดยไม่รวมข้อมูลดิบส่วนกลาง ตำแหน่ง Edge ส่ง Gradient Updates แทนที่จะเป็นการสังเกต สถาปัตยกรรมจัดการข้อกังวล Data Governance ในขณะที่เปิดใช้งานการเรียนรู้ข้ามฝูงหุ่นยนต์กระจาย

โครงสร้างพื้นฐานการใช้งาน

โครงสร้างพื้นฐานการใช้งานเชื่อมต่อโมเดลที่ฝึกแล้วกับหุ่นยนต์จริงที่ทำงานในสภาพแวดล้อม Production

การจัดเตรียม Edge Compute

แพลตฟอร์ม Edge Compute ต้องตรงกับรูปแบบหุ่นยนต์และงบประมาณพลังงานในขณะที่ให้ประสิทธิภาพ Inference ที่ต้องการ หุ่นยนต์เคลื่อนที่ที่พกแบตเตอรี่ไม่สามารถใช้งาน GPU Cards ศูนย์ข้อมูล การเลือกแพลตฟอร์มจำกัดความซับซ้อนของโมเดลที่บรรลุได้เมื่อใช้งาน

Industrial Copilot for Operations ของ Siemens จะทำงาน On-Premises ด้วย NVIDIA RTX PRO 6000 Blackwell Server Edition GPUs แสดงการใช้งานอุตสาหกรรมของความสามารถ AI ที่ซับซ้อน[^2] การตั้งค่าอุตสาหกรรมมักอนุญาตโครงสร้างพื้นฐานประมวลผลที่มากกว่าหุ่นยนต์เคลื่อนที่ ช่วยให้โมเดลมีความสามารถมากขึ้น

โครงสร้างพื้นฐาน Over-the-Air Update ใช้งานโมเดลใหม่ไปยังฝูงหุ่นยนต์โดยไม่ต้องเข้าถึงทางกายภาพ ขั้นตอนการอัปเดตที่ปลอดภัยรับประกันว่าหุ่นยนต์ยังคงทำงานผ่านกระบวนการใช้งาน ความสามารถ Rollback ย้อนกลับการอัปเดตที่มีปัญหาก่อนที่จะส่งผลกระทบต่อการดำเนินงาน

การผสานรวมระบบเรียลไทม์

ระบบควบคุมหุ่นยนต์กำหนดข้อจำกัดเรียลไทม์ที่ AI Inference ต้องตอบสนอง Control Loops คาดหวังให้การประมวลผลเซ็นเซอร์และ Inference เสร็จสิ้นภายในขอบเขตเวลาที่กำหนด การพลาด Deadlines ทำให้เกิดความไม่เสถียรของการควบคุมแทนที่จะเป็นเพียงการเสื่อมประสิทธิภาพ

การผสานรวม RTOS (Real-Time Operating System)

[เนื้อหาถูกตัดทอนสำหรับการแปล]

ขอใบเสนอราคา_

แจ้งรายละเอียดโครงการของคุณ เราจะตอบกลับภายใน 72 ชั่วโมง

> TRANSMISSION_COMPLETE

ได้รับคำขอแล้ว_

ขอบคุณสำหรับคำสอบถาม ทีมงานจะตรวจสอบคำขอและติดต่อกลับภายใน 72 ชั่วโมง

QUEUED FOR PROCESSING