NVIDIA의 FP4 추론이 50배 효율성을 제공합니다
FP4 추론은 25-50배의 에너지 효율성과 3.5배의 메모리 감소를 제공합니다. DeepSeek-R1은 250+ tokens/sec를 달성합니다. $0.02/token 시대가 도래했습니다.
None
FP4 추론은 25-50배의 에너지 효율성과 3.5배의 메모리 감소를 제공합니다. DeepSeek-R1은 250+ tokens/sec를 달성합니다. $0.02/token 시대가 도래했습니다.
Tell us about your project and we'll respond within 72 hours.
Thank you for your inquiry. Our team will review your request and respond within 72 hours.