Scaling au moment de l'inférence : la nouvelle frontière de l'entraînement pour le raisonnement IA
Le calcul au moment du test émerge comme la prochaine frontière du scaling de l'IA. ThreadWeaver atteint une accélération de 1,5x. P1 remporte l'or aux olympiades de physique. DeepSeek-R1 égale o1 à 70% de coût en moins. Implications pour l'infrastructure.
None