NVIDIAのFP4推論が50倍の効率を実現
FP4推論は25-50倍のエネルギー効率を実現し、メモリ使用量を3.5倍削減します。DeepSeek-R1は250+トークン/秒を達成。$0.02/トークンの時代が到来しました。
None
FP4推論は25-50倍のエネルギー効率を実現し、メモリ使用量を3.5倍削減します。DeepSeek-R1は250+トークン/秒を達成。$0.02/トークンの時代が到来しました。
Tell us about your project and we'll respond within 72 hours.
Thank you for your inquiry. Our team will review your request and respond within 72 hours.