Nieuwe benchmark bevestigt: AI-videogeneratoren zien er verbluffend uit maar kunnen nog steeds niet over de wereld redeneren
Een nieuwe benchmark genaamd WorldReasonBench test videogeneratoren niet op beeldkwaliteit, maar op fysieke en logische plausibiliteit. ByteDance's Seedance 2.0 leidt het veld, voor Veo 3.1 en Sora 2, waarbij commerciële modellen ongeveer twee keer zo hoog scoren als opensource-alternatieven. Logisch redeneren blijft met ruime marge de moeilijkste categorie voor elk model. De sprong van pixelgenerator naar echt wereldmodel is nog altijd niet gemaakt.
🔗 lees originele bron