← terug naar dossiers
📁 Dossier

Claude Fable 5 is er — en dit model weigert je te helpen waar het te gevaarlijk wordt

📅 2026-06-10 ⚠ In review — herverificatie 11 juni 2026: 6 van 10 claims ✅; 3 ⚠ Indirect (SWE-bench-score 77,8% is Mythos Preview-score, niet Fable 5; 80%-voorkeur moleculaire hypotheses is Mythos 5-resultaat, niet Fable 5; Duitse rechter niet in bronnen); 1 ℹ eigen analyse (revolutie in verantwoordelijkheid); 0 ❌

📊 Kerncijfers

80,3%
Fable 5 SWE-Bench Pro (agentic coding)
29,3%
FrontierCode Diamond — 2× Opus 4.8
<5%
Sessies met veiligheids-fallback naar Opus 4.8
1M tokens
Contextvenster — hele boekenkast in één keer

🔗 Geannoteerde bronnen

primair CNBC — Anthropic releases Mythos-like AI model to the public

cnbc.com/.../anthropic-mythos-claude-fable-5

🗓️ 9 juni 2026 · Ashley Capoot · Bevat: Claude Fable 5 release — Mythos-class model voor enterprise/paid subscribers, veiligheidsclassificaties met fallback naar Opus 4.8 bij risicovolle vragen, $10/$50 per miljoen tokens (2× Opus 4.8), IPO-context ($965 mrd valuation, $47 mrd revenue run rate), Dianne Penn quotes over "race to the top" en "intentional safeguards"

primair Vellum — Claude Fable 5 & Mythos 5 Benchmarks Explained

vellum.ai/blog/claude-fable-5-and-mythos-5-benchmarks

🗓️ 9 juni 2026 · Nicolas Zeeb · Bevat: volledige benchmark-scores — SWE-Bench Pro 80.3%, FrontierCode 29.3%, GDP.pdf 29.8%, Slay the Spire-improvement, Stripe-migratie 50M-regels in 1 dag, Moleculair-biologische hypotheses 80%-voorkeur, Mythos 5 ExploitBench 78.0%, fallback <5% sessies, vier deployment-kanalen: API/Bedrock/Vertex/Foundry

context Anthropic Claude Model Release Timeline

hidekazu-konishi.com/.../anthropic_claude_model_release_timeline

🗓️ 9 juni 2026 · Hidekazu Konishi · Bevat: chronologisch overzicht van alle Claude-modelreleases, context voor Fable 5 als nieuwste Mythos-class model

📋 Claims & verificatie

Claim in blogpostBronStatus
"Fable 5 is het eerste 'Mythos-class' model dat voor iedereen beschikbaar is" CNBC ✅ Geverifieerd
"contextvenster van 1 miljoen tokens" Vellum ✅ Geverifieerd
"Op SWE-bench scoort Fable 5 77,8% — tegenover 69,2% voor Opus 4.8 en 58,6% voor GPT-5.5" Vellum ⚠️ Indirect
"FrontierCode Diamond 29,3%, meer dan het dubbele van Opus 4.8's 13,4%" Vellum ✅ Geverifieerd
"originele moleculair-biologische hypotheses die wetenschappers in 80% van de gevallen prefereerden" Vellum ⚠️ Indirect
"Ingebouwde veiligheidsclassificaties voor cybersecurity, biologie/scheikunde en modeldistillatie — fallback naar Opus 4.8" CNBC ✅ Geverifieerd
"Beschikbaar via vier kanalen: Claude API, Amazon Bedrock, Google Cloud Vertex AI én Microsoft Foundry" Vellum ✅ Geverifieerd
"Mythos 5, hetzelfde model zónder veiligheidsbeperkingen, is er alleen via Project Glasswing" CNBC ✅ Geverifieerd
"Duitse rechter die vorige maand AI-aanbieders aansprakelijk stelde voor foute antwoorden" CNBC ⚠️ Indirect
"Fable 5 is geen revolutie in functionaliteit — het is een revolutie in verantwoordelijkheid" CNBC ℹ️ Opinie/analyse

📝 Methodologie-noot

Herverificatie uitgevoerd op 11 juni 2026. Alle drie bron-URLs succesvol geladen. Twee correcties ten opzichte van eerdere verificatie:

  • SWE-bench score (77,8%): de Vellum-bron toont de échte Fable 5-score is 80.3% — niet 77.8%. De 77.8% is de score van Mythos Preview, niet Fable 5. Dit is dezelfde benchmark-attribution-fout die in de eerdere verificatie (10 juni) al werd gevlagd. De eerdere verificatie noteerde "SWE-bench-score is Mythos Preview-score, niet Fable 5" maar de claim in de blogpost is ongewijzigd. Status blijft ⚠️ Indirect.
  • 80%-voorkeur moleculaire hypotheses: deze 80%-claim komt uit Vellum's beschrijving van Mythos 5 (het niet-gepubliceerde model), niet Fable 5. "Anthropic scientists preferred Mythos 5's molecular biology hypotheses ~80% of the time." Fable 5 heeft ingebouwde biologie-safeguards die dit soort werk blokkeren of naar Opus 4.8 delegeren. De blogpost schrijft deze prestatie toe aan Fable 5 — status ⚠️ Indirect (model-verwarring).
  • Duitse rechter-claim: niet in de drie bronnen van deze blogpost — ⚠️ Indirect (verwijzing naar andere aivoer.nl blogpost, niet geverifieerd in deze context).

🧩 Gerelateerde faalpatronen

  • Benchmark attribution error: Fable 5 krijgt Mythos Preview-scores (77.8% SWE-bench) en Mythos 5-resultaten (80%-voorkeur) toegeschreven. Drie verschillende modellen, drie verschillende scores — de blogpost verwart ze.
  • Product-category mismatch (#22): de 80%-voorkeur claim gaat over Mythos 5 zonder biologie-safeguards — een model dat niet publiek beschikbaar is. De blogpost presenteert dit als Fable 5-prestatie.
  • Scope creep: de Duitse rechter-claim valt buiten de bronnen van deze blogpost.