Claude Fable 5 is er — en dit model weigert je te helpen waar het te gevaarlijk wordt
📊 Kerncijfers
🔗 Geannoteerde bronnen
primair CNBC — Anthropic releases Mythos-like AI model to the public
cnbc.com/.../anthropic-mythos-claude-fable-5🗓️ 9 juni 2026 · Ashley Capoot · Bevat: Claude Fable 5 release — Mythos-class model voor enterprise/paid subscribers, veiligheidsclassificaties met fallback naar Opus 4.8 bij risicovolle vragen, $10/$50 per miljoen tokens (2× Opus 4.8), IPO-context ($965 mrd valuation, $47 mrd revenue run rate), Dianne Penn quotes over "race to the top" en "intentional safeguards"
primair Vellum — Claude Fable 5 & Mythos 5 Benchmarks Explained
vellum.ai/blog/claude-fable-5-and-mythos-5-benchmarks🗓️ 9 juni 2026 · Nicolas Zeeb · Bevat: volledige benchmark-scores — SWE-Bench Pro 80.3%, FrontierCode 29.3%, GDP.pdf 29.8%, Slay the Spire-improvement, Stripe-migratie 50M-regels in 1 dag, Moleculair-biologische hypotheses 80%-voorkeur, Mythos 5 ExploitBench 78.0%, fallback <5% sessies, vier deployment-kanalen: API/Bedrock/Vertex/Foundry
context Anthropic Claude Model Release Timeline
hidekazu-konishi.com/.../anthropic_claude_model_release_timeline🗓️ 9 juni 2026 · Hidekazu Konishi · Bevat: chronologisch overzicht van alle Claude-modelreleases, context voor Fable 5 als nieuwste Mythos-class model
📋 Claims & verificatie
| Claim in blogpost | Bron | Status |
|---|---|---|
| "Fable 5 is het eerste 'Mythos-class' model dat voor iedereen beschikbaar is" | CNBC | ✅ Geverifieerd |
| "contextvenster van 1 miljoen tokens" | Vellum | ✅ Geverifieerd |
| "Op SWE-bench scoort Fable 5 77,8% — tegenover 69,2% voor Opus 4.8 en 58,6% voor GPT-5.5" | Vellum | ⚠️ Indirect |
| "FrontierCode Diamond 29,3%, meer dan het dubbele van Opus 4.8's 13,4%" | Vellum | ✅ Geverifieerd |
| "originele moleculair-biologische hypotheses die wetenschappers in 80% van de gevallen prefereerden" | Vellum | ⚠️ Indirect |
| "Ingebouwde veiligheidsclassificaties voor cybersecurity, biologie/scheikunde en modeldistillatie — fallback naar Opus 4.8" | CNBC | ✅ Geverifieerd |
| "Beschikbaar via vier kanalen: Claude API, Amazon Bedrock, Google Cloud Vertex AI én Microsoft Foundry" | Vellum | ✅ Geverifieerd |
| "Mythos 5, hetzelfde model zónder veiligheidsbeperkingen, is er alleen via Project Glasswing" | CNBC | ✅ Geverifieerd |
| "Duitse rechter die vorige maand AI-aanbieders aansprakelijk stelde voor foute antwoorden" | CNBC | ⚠️ Indirect |
| "Fable 5 is geen revolutie in functionaliteit — het is een revolutie in verantwoordelijkheid" | CNBC | ℹ️ Opinie/analyse |
📝 Methodologie-noot
Herverificatie uitgevoerd op 11 juni 2026. Alle drie bron-URLs succesvol geladen. Twee correcties ten opzichte van eerdere verificatie:
- SWE-bench score (77,8%): de Vellum-bron toont de échte Fable 5-score is 80.3% — niet 77.8%. De 77.8% is de score van Mythos Preview, niet Fable 5. Dit is dezelfde benchmark-attribution-fout die in de eerdere verificatie (10 juni) al werd gevlagd. De eerdere verificatie noteerde "SWE-bench-score is Mythos Preview-score, niet Fable 5" maar de claim in de blogpost is ongewijzigd. Status blijft ⚠️ Indirect.
- 80%-voorkeur moleculaire hypotheses: deze 80%-claim komt uit Vellum's beschrijving van Mythos 5 (het niet-gepubliceerde model), niet Fable 5. "Anthropic scientists preferred Mythos 5's molecular biology hypotheses ~80% of the time." Fable 5 heeft ingebouwde biologie-safeguards die dit soort werk blokkeren of naar Opus 4.8 delegeren. De blogpost schrijft deze prestatie toe aan Fable 5 — status ⚠️ Indirect (model-verwarring).
- Duitse rechter-claim: niet in de drie bronnen van deze blogpost — ⚠️ Indirect (verwijzing naar andere aivoer.nl blogpost, niet geverifieerd in deze context).
🧩 Gerelateerde faalpatronen
- Benchmark attribution error: Fable 5 krijgt Mythos Preview-scores (77.8% SWE-bench) en Mythos 5-resultaten (80%-voorkeur) toegeschreven. Drie verschillende modellen, drie verschillende scores — de blogpost verwart ze.
- Product-category mismatch (#22): de 80%-voorkeur claim gaat over Mythos 5 zonder biologie-safeguards — een model dat niet publiek beschikbaar is. De blogpost presenteert dit als Fable 5-prestatie.
- Scope creep: de Duitse rechter-claim valt buiten de bronnen van deze blogpost.