Denken Ohne Tokens: Wie Latentes Reasoning ein 3.5B-Modell wie 50B Performen Lässt
Eine neue Architektur lässt AI-Modelle im latenten Raum statt mit Token-Generierung reasonen. Der rekursive Tiefenansatz skaliert Test-Time-Compute ohne Chain-of-Thought.