كفاءة الاستنتاج بدقة FP4 من NVIDIA تحقق تحسناً بمعدل 50 ضعفاً
FP4 الاستنتاج يحقق كفاءة طاقة أعلى بـ 25-50 مرة مع تقليل الذاكرة بـ 3.5 مرة. DeepSeek-R1 يصل إلى 250+ token في الثانية. عصر $0.02/token قد وصل.
None
FP4 الاستنتاج يحقق كفاءة طاقة أعلى بـ 25-50 مرة مع تقليل الذاكرة بـ 3.5 مرة. DeepSeek-R1 يصل إلى 250+ token في الثانية. عصر $0.02/token قد وصل.
Tell us about your project and we'll respond within 72 hours.
Thank you for your inquiry. Our team will review your request and respond within 72 hours.