Wereldmodellen Race 2026: Hoe LeCun, DeepMind en World Labs het Pad naar AGI Herdefiniëren
Drie miljard dollar pre-launch waardering voor een startup die nog geen enkel product heeft uitgebracht.[^1] Yann LeCun's AMI Labs vertegenwoordigt de grootste gok tot nu toe op een these die AI-onderzoekers jarenlang heeft verdeeld: grote taalmodellen zullen nooit algemene intelligentie bereiken, en het pad voorwaarts loopt via wereldmodellen.
TL;DR
Het wereldmodellen-paradigma explodeerde eind 2025 en begin 2026 in de mainstream AI-ontwikkeling. Yann LeCun verliet Meta na 12 jaar om AMI Labs te lanceren, waarbij hij €500M ophaalde tegen een waardering van €3B om AI-systemen te bouwen die fysica begrijpen in plaats van alleen tekst te voorspellen.[^2] Google DeepMind bracht Genie 3 uit, het eerste real-time interactieve wereldmodel dat in staat is persistente 3D-omgevingen te genereren met 24 fps.[^3] Fei-Fei Li's World Labs lanceerde Marble, waardoor wereldmodelgeneratie commercieel beschikbaar werd met prijzen van gratis tot $95/maand.[^4] NVIDIA's Cosmos-platform heeft 2 miljoen downloads gezien nu robotica- en autonome voertuigontwikkelaars synthetische fysica-bewuste trainingsdata omarmen.[^5] Voor organisaties die AI-infrastructuur bouwen, signaleren wereldmodellen een computationele verschuiving van tekstverwerking naar videogeneratie, fysicasimulatie en belichaamd redeneren.
Het LLM-Plafond
Grote taalmodellen bereikten opmerkelijke capaciteiten door schaal. GPT-4, Claude en Gemini demonstreren geavanceerd redeneren, codegeneratie en probleemoplossing in meerdere stappen.[^6] Toch blijft een fundamentele beperking bestaan: deze modellen leren statistische patronen uit tekst, geen begrip van de fysieke werkelijkheid.[^7]
Onderzoek gepubliceerd in 2024 bewees wiskundig dat LLM's niet alle berekenbare functies kunnen leren en daarom onvermijdelijk zullen hallucineren wanneer ze als algemene probleemoplossers worden gebruikt.[^8] De oorzaak ligt in hoe LLM's werken: voorspellen welke tokens volgen op eerdere tokens gebaseerd op patronen geleerd uit trainingsdata, zonder enige verankering in de fysieke werkelijkheid.[^9]
Het Hallucinatieprobleem
LLM's genereren plausibel klinkende tekst die fysiek onmogelijke scenario's, historisch onjuiste gebeurtenissen of logisch inconsistent redeneren kan beschrijven.[^10] In tegenstelling tot mensen die over zwaartekracht leren door belichaamde ervaring, leren LLM's alleen dat het woord "zwaartekracht" vaak in de buurt van bepaalde andere woorden voorkomt.[^11]
| Beperking | Oorzaak | Gevolg |
|---|---|---|
| Feitelijke hallucinatie | Geen geverifieerde kennisbasis[^12] | Zelfverzekerde fabricatie van feiten |
| Falen fysisch redeneren | Geen belichaamde ervaring[^13] | Beschrijft onmogelijke fysica |
| Causale verwarring | Patroonherkenning, geen begrip[^14] | Correlatie behandeld als causaliteit |
| Temporele incoherentie | Sequentiële tokenvoorspelling[^15] | Gebeurtenissen in onmogelijke volgorde |
Yann LeCun heeft jarenlang publiekelijk betoogd dat het opschalen van LLM's geen algemene intelligentie zal produceren.[^16] "LLM's zijn te beperkend," verklaarde LeCun in zijn NVIDIA GTC-presentatie. "Ze opschalen zal ons niet in staat stellen AGI te bereiken."[^17]
Het alternatief dat hij voorstelt: wereldmodellen die representaties van de fysieke werkelijkheid leren, waardoor voorspelling, planning en redeneren over oorzaak en gevolg mogelijk worden.[^18]
Yann LeCun's AMI Labs
LeCun verliet Meta in december 2025 na 12 jaar, waarvan vijf als oprichtend directeur van Facebook AI Research (FAIR) en zeven als chief AI scientist.[^19] Zijn nieuwe onderneming, Advanced Machine Intelligence (AMI) Labs, vertegenwoordigt de meest ambitieuze poging tot nu toe om wereldmodelonderzoek te commercialiseren.[^20]
Financiering en Structuur
AMI Labs begon financieringsgesprekken met het doel €500 miljoen op te halen tegen een waardering van €3 miljard voordat enig product werd gelanceerd.[^21] Het doel zou een van de grootste pre-launch rondes in de AI-geschiedenis vertegenwoordigen, wat het vertrouwen van investeerders in LeCun's visie en trackrecord weerspiegelt.[^22]
| Rol | Persoon | Achtergrond |
|---|---|---|
| Executive Chairman | Yann LeCun | Turing Award-winnaar, Meta FAIR-oprichter[^23] |
| CEO | Alex LeBrun | Voormalig CEO van Nabla (medische AI)[^24] |
Het bedrijf is van plan tegen januari 2026 een hoofdkantoor in Parijs te vestigen.[^25] Hoewel Meta niet direct in AMI Labs zal investeren, zijn de bedrijven van plan een partnerschap te smeden waardoor LeCun onderzoeksverbindingen kan voortzetten.[^26]
Technische Visie
AMI Labs streeft ernaar AI-systemen te creëren die fysica begrijpen, persistent geheugen behouden en complexe acties plannen in plaats van simpelweg tekstsequenties te voorspellen.[^27] LeCun beschrijft een wereldmodel als "je mentale model van hoe de wereld zich gedraagt."[^28]
"Je kunt je een reeks acties voorstellen die je zou kunnen ondernemen, en je wereldmodel zal je in staat stellen te voorspellen wat het effect van de reeks acties op de wereld zal zijn," legde LeCun uit.[^29]
De aanpak verschilt fundamenteel van LLM's. Waar GPT-achtige modellen het volgende woord voorspellen, voorspellen wereldmodellen de volgende toestand van een fysieke omgeving gegeven acties die erin worden ondernomen.[^30] Dit maakt mogelijk:
- Planning: Uitkomsten simuleren voordat actie wordt ondernomen
- Redeneren over fysica: Begrijpen dat objecten massa, momentum en ruimtelijke relaties hebben
- Oorzaak-gevolg begrip: Leren dat acties voorspelbare consequenties produceren
- Persistent geheugen: Consistente wereldtoestand behouden door de tijd heen
I-JEPA Fundament
AMI Labs bouwt voort op LeCun's I-JEPA (Image Joint Embedding Predictive Architecture) onderzoek bij Meta.[^31] I-JEPA leert door representaties van beeldregio's te voorspellen vanuit andere regio's, waarbij abstract begrip van visuele scènes wordt ontwikkeld zonder expliciete labels nodig te hebben.[^32]
De aanpak loopt parallel aan hoe mensen intuïtieve fysica ontwikkelen door observatie. Een kind dat vallende objecten bekijkt ontwikkelt een intern model van zwaartekracht zonder dat iemand Newton's wetten uitlegt.[^33] I-JEPA en opvolgerarchitecturen streven ernaar dit leerproces in kunstmatige systemen te repliceren.[^34]
DeepMind's Genie 3
Google DeepMind bracht Genie 3 uit in augustus 2025, wat het eerste real-time interactieve algemene wereldmodel vertegenwoordigt.[^35] In tegenstelling tot eerdere systemen die statische omgevingen genereerden of aanzienlijke verwerkingstijd nodig hadden, produceert Genie 3 navigeerbare 3D-werelden met 24 frames per seconde.[^36]
Technische Capaciteiten
Genie 3 genereert dynamische omgevingen uit tekstprompts, waarbij visuele consistentie voor enkele minuten real-time interactie wordt behouden.[^37] Het systeem vertrouwt niet op hard-coded physics engines; in plaats daarvan leert het model zichzelf hoe de wereld werkt door training.[^38]
| Capaciteit | Specificatie |
|---|---|
| Framerate | 24 fps real-time[^39] |
| Resolutie | 720p[^40] |
| Consistentieduur | Enkele minuten[^41] |
| Geheugenhorizon | Tot 1 minuut terugkijken[^42] |
| Fysica | Zelf-geleerd, niet hard-coded[^43] |
"Genie 3 is het eerste real-time interactieve algemene wereldmodel," verklaarde Shlomi Fruchter, onderzoeksdirecteur bij DeepMind. "Het gaat verder dan smalle wereldmodellen die eerder bestonden. Het is niet specifiek voor een bepaalde omgeving."[^44]
Auto-Regressieve Architectuur
Het model genereert één frame tegelijk, terugkijkend naar eerder gegenereerde inhoud om te bepalen wat er vervolgens gebeurt.[^45] Het bereiken van real-time prestaties vereist het meerdere keren per seconde berekenen van dit auto-regressieve proces terwijl consistentie met mogelijk minuut-oude visuele herinneringen wordt behouden.[^46]
Fysieke consistentie ontstaat uit training in plaats van expliciete programmering.[^47] Genie 3-omgevingen behouden stabiele fysica omdat het model fysieke regelmatigheden uit trainingsdata leerde, niet omdat onderzoekers handmatig zwaartekracht of botsingsdetectie codeerden.[^48]
AGI-Implicaties
DeepMind positioneert Genie 3 als een opstap naar kunstmatige algemene intelligentie.[^49] Het lab verwacht dat wereldmodeltechnologie een kritische rol zal spelen naarmate AI-agents meer interacteren met fysieke omgevingen.[^50]
"Genie 3 markeert een grote sprong richting Kunstmatige Algemene Intelligentie door AI-agents in staat te stellen rijkelijk gesimuleerde werelden te 'ervaren', ermee te interacteren en ervan te leren zonder handmatige contentcreatie," volgens DeepMind's aankondiging.[^51]
Huidige Beperkingen
Genie 3 blijft in beperkte onderzoekspreview in plaats van publieke release.[^52] Bekende beperkingen zijn:
- Beperkte actieruimte voor agentinteracties
- Consistentieverval na enkele minuten
- Onvolledige geografische nauwkeurigheid van de echte wereld
- Uitdagingen bij het modelleren van complexe multi-agent interacties
DeepMind blijft testtoegang uitbreiden naar geselecteerde academici en makers.[^53]
Fei-Fei Li's World Labs en Marble
World Labs, opgericht door AI-pionier Fei-Fei Li, lanceerde Marble in november 2025 als het eerste commercieel beschikbare wereldmodelproduct.[^54] De startup kwam uit stealth met $230 miljoen aan financiering iets meer dan een jaar voor de Marble-lancering.[^55]
Productarchitectuur
Marble genereert persistente, downloadbare 3D-omgevingen uit tekstprompts, foto's, video's, 3D-layouts of panoramische beelden.[^56] In tegenstelling tot concurrenten die werelden on-the-fly genereren tijdens verkenning, produceert Marble discrete omgevingen die gebruikers kunnen bewerken en exporteren.[^57]
| Invoertype | Uitvoer |
|---|---|
| Tekstprompt | 3D-omgeving |
| Foto | 3D-omgeving |
| Video | 3D-omgeving |
| 3D-layout | AI-verbeterde 3D-omgeving |
| Panorama | 3D-omgeving |
Het platform biedt AI-native bewerkingstools en een hybride 3D-editor die ruimtelijke structuurblokkering mogelijk maakt voordat AI visuele details invult.[^58] Bestanden exporteren in formaten compatibel met industriestandaard tools zoals Unreal Engine en Unity.[^59]
Prijsmodel
World Labs adopteerde een freemium-structuur gericht op creatieve professionals:[^60]
| Niveau | Prijs | Generaties | Functies |
|---|---|---|---|
| Gratis | $0 | 4/maand | Basisgeneratie |
| Standard | $20/maand | 12/maand | Standaardfuncties |
| Pro | $35/maand | 25/maand | Commerciële rechten |
| Max | $95/maand | 75/maand | Premiumfuncties |
Doeltoepassingen
Initiële use cases richten zich op gaming, visuele effecten voor film en virtual reality.[^61] Marble ondersteunt Vision Pro en Quest 3 VR-headsets, waarbij elke gegenereerde wereld in VR bekeken kan worden.[^62]
Fei-Fei Li positioneert Marble als "de eerste stap naar het creëren van een werkelijk ruimtelijk intelligent wereldmodel."[^63] Naast creatieve toepassingen maakt de technologie roboticatraining mogelijk door gesimuleerde omgevingen die duur of gevaarlijk zouden zijn om in de fysieke werkelijkheid te creëren.[^64]
NVIDIA Cosmos: Industriële Schaal Wereldmodellen
NVIDIA lanceerde Cosmos op CES 2025 als platform voor fysieke AI-ontwikkeling, specifiek gericht op autonome voertuigen en robotica.[^65] Tegen januari 2026 waren Cosmos world foundation models meer dan 2 miljoen keer gedownload.[^66]
Platformarchitectuur
Cosmos omvat generatieve world foundation models, geavanceerde tokenizers, guardrails en een versnelde videoverwerkingspipeline.[^67] De modellen voorspellen en genereren fysica-bewuste video's van toekomstige omgevingstoestanden, waardoor synthetische trainingsdata-generatie op massale schaal mogelijk wordt.[^68]
| Modelniveau | Optimalisatie | Use Case |
|---|---|---|
| Nano | Real-time, edge deployment[^69] | On-device inferentie |
| Super | Hoge prestatie baseline[^70] | Algemene ontwikkeling |
| Ultra | Maximale kwaliteit en getrouwheid[^71] | Custom model distillatie |
Het platform trainde op 9.000 biljoen tokens van 20 miljoen uur real-world data over menselijke interacties, omgevingen, industriële settings, robotica en rijscenario's.[^72]
Industrie-Adoptie
Toonaangevende robotica- en automobielbedrijven adopteerden Cosmos voor synthetische data-generatie:[^73]
| Bedrijf | Domein |
|---|---|
| 1X | Humanoïde robots |
| Agility | Tweevoetige robots |
| Figure AI | Humanoïde robots |
| Waabi | Autonoom vrachtvervoer |
| XPENG | Elektrische voertuigen |
| Uber | Ridesharing autonoom |
Cosmos Modeltypes
Drie modeltypes adresseren verschillende fysieke AI-ontwikkelingsbehoeften:[^74]
Cosmos-Predict: Simuleert en voorspelt toekomstige wereldtoestanden in videovorm **Co
[Inhoud afgekapt voor vertaling]