METR zegt dat het Claude Mythos amper kan meten, Palo Alto Networks waarschuwt voor autonome AI-aanvallers
METR kan Claude Mythos Preview amper meten met zijn huidige testopstelling — slechts vijf van de 228 taken beslaan het relevante vaardigheidsbereik. Ondertussen meldt Palo Alto Networks dat frontier-modellen autonoom kwetsbaarheden aaneenschakelen, waardoor de tijd van eerste toegang tot data-exfiltratie is geslonken tot slechts 25 minuten. De evaluatiemethoden groeien trager dan de modellen zelf, en dat is misschien het grotere probleem.
🔗 lees originele bron