AI-zoekagenten bevestigen vaak wat ze al weten in plaats van daadwerkelijk het web af te speuren

analyse 📅 2026-05-31

Toonaangevende AI-zoekagents zoals GPT-5.4 en Kimi K2.6 lijken op gevestigde benchmarks amper écht onderzoek te doen. Ze gebruiken het web vooral om te bevestigen wat ze tijdens de training al hebben geleerd. Onderzoekers van het Harbin Institute of Technology ontdekten dit met een nieuwe tijdsgebonden benchmark genaamd LiveBrowseComp, die uitsluitend vragen stelt over gebeurtenissen van de afgelopen 90 dagen. Zodra de modellen niet meer op hun geheugen kunnen terugvallen, stort de prestatie in en worden de bestaande ranglijsten volledig door elkaar geschud.

🔗 lees originele bron