Wereldmodellen Race 2026: Hoe LeCun, DeepMind en World Labs het Pad naar AGI Herdefiniëren

Yann LeCun haalt €500M op voor AMI Labs terwijl DeepMind's Genie 3 real-time 3D-werelden simuleert. De race van 2026 om AI te bouwen die fysica begrijpt, zou LLM's kunnen overschaduwen.

Blake Crosley

Jan 03, 2026 8 min read Disclaimer

Wereldmodellen Race 2026: Hoe LeCun, DeepMind en World Labs het Pad naar AGI Herdefiniëren

Drie miljard dollar pre-launch waardering voor een startup die nog geen enkel product heeft uitgebracht.[^1] Yann LeCun's AMI Labs vertegenwoordigt de grootste gok tot nu toe op een these die AI-onderzoekers jarenlang heeft verdeeld: grote taalmodellen zullen nooit algemene intelligentie bereiken, en het pad voorwaarts loopt via wereldmodellen.

TL;DR

Het wereldmodellen-paradigma explodeerde eind 2025 en begin 2026 in de mainstream AI-ontwikkeling. Yann LeCun verliet Meta na 12 jaar om AMI Labs te lanceren, waarbij hij €500M ophaalde tegen een waardering van €3B om AI-systemen te bouwen die fysica begrijpen in plaats van alleen tekst te voorspellen.[^2] Google DeepMind bracht Genie 3 uit, het eerste real-time interactieve wereldmodel dat in staat is persistente 3D-omgevingen te genereren met 24 fps.[^3] Fei-Fei Li's World Labs lanceerde Marble, waardoor wereldmodelgeneratie commercieel beschikbaar werd met prijzen van gratis tot $95/maand.[^4] NVIDIA's Cosmos-platform heeft 2 miljoen downloads gezien nu robotica- en autonome voertuigontwikkelaars synthetische fysica-bewuste trainingsdata omarmen.[^5] Voor organisaties die AI-infrastructuur bouwen, signaleren wereldmodellen een computationele verschuiving van tekstverwerking naar videogeneratie, fysicasimulatie en belichaamd redeneren.

Het LLM-Plafond

Grote taalmodellen bereikten opmerkelijke capaciteiten door schaal. GPT-4, Claude en Gemini demonstreren geavanceerd redeneren, codegeneratie en probleemoplossing in meerdere stappen.[^6] Toch blijft een fundamentele beperking bestaan: deze modellen leren statistische patronen uit tekst, geen begrip van de fysieke werkelijkheid.[^7]

Onderzoek gepubliceerd in 2024 bewees wiskundig dat LLM's niet alle berekenbare functies kunnen leren en daarom onvermijdelijk zullen hallucineren wanneer ze als algemene probleemoplossers worden gebruikt.[^8] De oorzaak ligt in hoe LLM's werken: voorspellen welke tokens volgen op eerdere tokens gebaseerd op patronen geleerd uit trainingsdata, zonder enige verankering in de fysieke werkelijkheid.[^9]

Het Hallucinatieprobleem

LLM's genereren plausibel klinkende tekst die fysiek onmogelijke scenario's, historisch onjuiste gebeurtenissen of logisch inconsistent redeneren kan beschrijven.[^10] In tegenstelling tot mensen die over zwaartekracht leren door belichaamde ervaring, leren LLM's alleen dat het woord "zwaartekracht" vaak in de buurt van bepaalde andere woorden voorkomt.[^11]

Beperking	Oorzaak	Gevolg
Feitelijke hallucinatie	Geen geverifieerde kennisbasis[^12]	Zelfverzekerde fabricatie van feiten
Falen fysisch redeneren	Geen belichaamde ervaring[^13]	Beschrijft onmogelijke fysica
Causale verwarring	Patroonherkenning, geen begrip[^14]	Correlatie behandeld als causaliteit
Temporele incoherentie	Sequentiële tokenvoorspelling[^15]	Gebeurtenissen in onmogelijke volgorde

Yann LeCun heeft jarenlang publiekelijk betoogd dat het opschalen van LLM's geen algemene intelligentie zal produceren.[^16] "LLM's zijn te beperkend," verklaarde LeCun in zijn NVIDIA GTC-presentatie. "Ze opschalen zal ons niet in staat stellen AGI te bereiken."[^17]

Het alternatief dat hij voorstelt: wereldmodellen die representaties van de fysieke werkelijkheid leren, waardoor voorspelling, planning en redeneren over oorzaak en gevolg mogelijk worden.[^18]

Yann LeCun's AMI Labs

LeCun verliet Meta in december 2025 na 12 jaar, waarvan vijf als oprichtend directeur van Facebook AI Research (FAIR) en zeven als chief AI scientist.[^19] Zijn nieuwe onderneming, Advanced Machine Intelligence (AMI) Labs, vertegenwoordigt de meest ambitieuze poging tot nu toe om wereldmodelonderzoek te commercialiseren.[^20]

Financiering en Structuur

AMI Labs begon financieringsgesprekken met het doel €500 miljoen op te halen tegen een waardering van €3 miljard voordat enig product werd gelanceerd.[^21] Het doel zou een van de grootste pre-launch rondes in de AI-geschiedenis vertegenwoordigen, wat het vertrouwen van investeerders in LeCun's visie en trackrecord weerspiegelt.[^22]

Rol	Persoon	Achtergrond
Executive Chairman	Yann LeCun	Turing Award-winnaar, Meta FAIR-oprichter[^23]
CEO	Alex LeBrun	Voormalig CEO van Nabla (medische AI)[^24]

Het bedrijf is van plan tegen januari 2026 een hoofdkantoor in Parijs te vestigen.[^25] Hoewel Meta niet direct in AMI Labs zal investeren, zijn de bedrijven van plan een partnerschap te smeden waardoor LeCun onderzoeksverbindingen kan voortzetten.[^26]

Technische Visie

AMI Labs streeft ernaar AI-systemen te creëren die fysica begrijpen, persistent geheugen behouden en complexe acties plannen in plaats van simpelweg tekstsequenties te voorspellen.[^27] LeCun beschrijft een wereldmodel als "je mentale model van hoe de wereld zich gedraagt."[^28]

"Je kunt je een reeks acties voorstellen die je zou kunnen ondernemen, en je wereldmodel zal je in staat stellen te voorspellen wat het effect van de reeks acties op de wereld zal zijn," legde LeCun uit.[^29]

De aanpak verschilt fundamenteel van LLM's. Waar GPT-achtige modellen het volgende woord voorspellen, voorspellen wereldmodellen de volgende toestand van een fysieke omgeving gegeven acties die erin worden ondernomen.[^30] Dit maakt mogelijk:

Planning: Uitkomsten simuleren voordat actie wordt ondernomen
Redeneren over fysica: Begrijpen dat objecten massa, momentum en ruimtelijke relaties hebben
Oorzaak-gevolg begrip: Leren dat acties voorspelbare consequenties produceren
Persistent geheugen: Consistente wereldtoestand behouden door de tijd heen

I-JEPA Fundament

AMI Labs bouwt voort op LeCun's I-JEPA (Image Joint Embedding Predictive Architecture) onderzoek bij Meta.[^31] I-JEPA leert door representaties van beeldregio's te voorspellen vanuit andere regio's, waarbij abstract begrip van visuele scènes wordt ontwikkeld zonder expliciete labels nodig te hebben.[^32]

De aanpak loopt parallel aan hoe mensen intuïtieve fysica ontwikkelen door observatie. Een kind dat vallende objecten bekijkt ontwikkelt een intern model van zwaartekracht zonder dat iemand Newton's wetten uitlegt.[^33] I-JEPA en opvolgerarchitecturen streven ernaar dit leerproces in kunstmatige systemen te repliceren.[^34]

DeepMind's Genie 3

Google DeepMind bracht Genie 3 uit in augustus 2025, wat het eerste real-time interactieve algemene wereldmodel vertegenwoordigt.[^35] In tegenstelling tot eerdere systemen die statische omgevingen genereerden of aanzienlijke verwerkingstijd nodig hadden, produceert Genie 3 navigeerbare 3D-werelden met 24 frames per seconde.[^36]

Technische Capaciteiten

Genie 3 genereert dynamische omgevingen uit tekstprompts, waarbij visuele consistentie voor enkele minuten real-time interactie wordt behouden.[^37] Het systeem vertrouwt niet op hard-coded physics engines; in plaats daarvan leert het model zichzelf hoe de wereld werkt door training.[^38]

Capaciteit	Specificatie
Framerate	24 fps real-time[^39]
Resolutie	720p[^40]
Consistentieduur	Enkele minuten[^41]
Geheugenhorizon	Tot 1 minuut terugkijken[^42]
Fysica	Zelf-geleerd, niet hard-coded[^43]

"Genie 3 is het eerste real-time interactieve algemene wereldmodel," verklaarde Shlomi Fruchter, onderzoeksdirecteur bij DeepMind. "Het gaat verder dan smalle wereldmodellen die eerder bestonden. Het is niet specifiek voor een bepaalde omgeving."[^44]

Auto-Regressieve Architectuur

Het model genereert één frame tegelijk, terugkijkend naar eerder gegenereerde inhoud om te bepalen wat er vervolgens gebeurt.[^45] Het bereiken van real-time prestaties vereist het meerdere keren per seconde berekenen van dit auto-regressieve proces terwijl consistentie met mogelijk minuut-oude visuele herinneringen wordt behouden.[^46]

Fysieke consistentie ontstaat uit training in plaats van expliciete programmering.[^47] Genie 3-omgevingen behouden stabiele fysica omdat het model fysieke regelmatigheden uit trainingsdata leerde, niet omdat onderzoekers handmatig zwaartekracht of botsingsdetectie codeerden.[^48]

AGI-Implicaties

DeepMind positioneert Genie 3 als een opstap naar kunstmatige algemene intelligentie.[^49] Het lab verwacht dat wereldmodeltechnologie een kritische rol zal spelen naarmate AI-agents meer interacteren met fysieke omgevingen.[^50]

"Genie 3 markeert een grote sprong richting Kunstmatige Algemene Intelligentie door AI-agents in staat te stellen rijkelijk gesimuleerde werelden te 'ervaren', ermee te interacteren en ervan te leren zonder handmatige contentcreatie," volgens DeepMind's aankondiging.[^51]

Huidige Beperkingen

Genie 3 blijft in beperkte onderzoekspreview in plaats van publieke release.[^52] Bekende beperkingen zijn:

Beperkte actieruimte voor agentinteracties
Consistentieverval na enkele minuten
Onvolledige geografische nauwkeurigheid van de echte wereld
Uitdagingen bij het modelleren van complexe multi-agent interacties

DeepMind blijft testtoegang uitbreiden naar geselecteerde academici en makers.[^53]

Fei-Fei Li's World Labs en Marble

World Labs, opgericht door AI-pionier Fei-Fei Li, lanceerde Marble in november 2025 als het eerste commercieel beschikbare wereldmodelproduct.[^54] De startup kwam uit stealth met $230 miljoen aan financiering iets meer dan een jaar voor de Marble-lancering.[^55]

Productarchitectuur

Marble genereert persistente, downloadbare 3D-omgevingen uit tekstprompts, foto's, video's, 3D-layouts of panoramische beelden.[^56] In tegenstelling tot concurrenten die werelden on-the-fly genereren tijdens verkenning, produceert Marble discrete omgevingen die gebruikers kunnen bewerken en exporteren.[^57]

Invoertype	Uitvoer
Tekstprompt	3D-omgeving
Foto	3D-omgeving
Video	3D-omgeving
3D-layout	AI-verbeterde 3D-omgeving
Panorama	3D-omgeving

Het platform biedt AI-native bewerkingstools en een hybride 3D-editor die ruimtelijke structuurblokkering mogelijk maakt voordat AI visuele details invult.[^58] Bestanden exporteren in formaten compatibel met industriestandaard tools zoals Unreal Engine en Unity.[^59]

Prijsmodel

World Labs adopteerde een freemium-structuur gericht op creatieve professionals:[^60]

Niveau	Prijs	Generaties	Functies
Gratis	$0	4/maand	Basisgeneratie
Standard	$20/maand	12/maand	Standaardfuncties
Pro	$35/maand	25/maand	Commerciële rechten
Max	$95/maand	75/maand	Premiumfuncties

Doeltoepassingen

Initiële use cases richten zich op gaming, visuele effecten voor film en virtual reality.[^61] Marble ondersteunt Vision Pro en Quest 3 VR-headsets, waarbij elke gegenereerde wereld in VR bekeken kan worden.[^62]

Fei-Fei Li positioneert Marble als "de eerste stap naar het creëren van een werkelijk ruimtelijk intelligent wereldmodel."[^63] Naast creatieve toepassingen maakt de technologie roboticatraining mogelijk door gesimuleerde omgevingen die duur of gevaarlijk zouden zijn om in de fysieke werkelijkheid te creëren.[^64]

NVIDIA Cosmos: Industriële Schaal Wereldmodellen

NVIDIA lanceerde Cosmos op CES 2025 als platform voor fysieke AI-ontwikkeling, specifiek gericht op autonome voertuigen en robotica.[^65] Tegen januari 2026 waren Cosmos world foundation models meer dan 2 miljoen keer gedownload.[^66]

Platformarchitectuur

Cosmos omvat generatieve world foundation models, geavanceerde tokenizers, guardrails en een versnelde videoverwerkingspipeline.[^67] De modellen voorspellen en genereren fysica-bewuste video's van toekomstige omgevingstoestanden, waardoor synthetische trainingsdata-generatie op massale schaal mogelijk wordt.[^68]

Modelniveau	Optimalisatie	Use Case
Nano	Real-time, edge deployment[^69]	On-device inferentie
Super	Hoge prestatie baseline[^70]	Algemene ontwikkeling
Ultra	Maximale kwaliteit en getrouwheid[^71]	Custom model distillatie

Het platform trainde op 9.000 biljoen tokens van 20 miljoen uur real-world data over menselijke interacties, omgevingen, industriële settings, robotica en rijscenario's.[^72]

Industrie-Adoptie

Toonaangevende robotica- en automobielbedrijven adopteerden Cosmos voor synthetische data-generatie:[^73]

Bedrijf	Domein
1X	Humanoïde robots
Agility	Tweevoetige robots
Figure AI	Humanoïde robots
Waabi	Autonoom vrachtvervoer
XPENG	Elektrische voertuigen
Uber	Ridesharing autonoom

Cosmos Modeltypes

Drie modeltypes adresseren verschillende fysieke AI-ontwikkelingsbehoeften:[^74]

Cosmos-Predict: Simuleert en voorspelt toekomstige wereldtoestanden in videovorm **Co

[Inhoud afgekapt voor vertaling]

Wereldmodellen Race 2026: Hoe LeCun, DeepMind en World Labs het Pad naar AGI Herdefiniëren

TL;DR

Het LLM-Plafond

Het Hallucinatieprobleem

Yann LeCun's AMI Labs

Financiering en Structuur

Technische Visie

I-JEPA Fundament

DeepMind's Genie 3

Technische Capaciteiten

Auto-Regressieve Architectuur

AGI-Implicaties

Huidige Beperkingen

Fei-Fei Li's World Labs en Marble

Productarchitectuur

Prijsmodel

Doeltoepassingen

NVIDIA Cosmos: Industriële Schaal Wereldmodellen

Platformarchitectuur

Industrie-Adoptie

Cosmos Modeltypes

You Might Also Like

AIOps voor Datacenters: LLM's Gebruiken voor het Beheren van...

Load Balancing voor AI-inferentie: Verzoeken Verdelen over 1...

Gedisaggregeerde Computing voor AI: Composable Infrastructuu...

Offerte aanvragen_

Aanvraag Ontvangen_