ChatGPT verslaat dokters — en dat zegt álles over AI in jouw MKB
📊 Kerncijfers
🔗 Geannoteerde bronnen
primair OpenAI: Improving health intelligence in ChatGPT
openai.com/index/improving-health-intelligence-in-chatgpt🗓️ 18 juni 2026 · OpenAI officieel · Bevat: GPT-5.5 Instant, HealthBench/HealthBench Professional evaluaties, artsenpanel-vergelijking (3.500 responses), 5 evaluatiecriteria (accuracy, communication, completeness, instruction following, health decision helpfulness), 260+ artsen uit 60 landen, 700.000+ gereviewde responses, −71% factuality issues, voorbeeld MRI/sciatica response
secundair The Decoder: ChatGPT's new health upgrade beats doctor-written answers, OpenAI says
the-decoder.com/.../chatgpts-new-health-upgrade-beats-doctor-written-answers-openai-says🗓️ 19 juni 2026 · Matthias Bastian · Bevat: GPT-5.5 Instant presteert beter dan artsen op accuracy, clarity, completeness; benchmark-grafiek met 5 evaluatiecategorieën; 71% daling incorrecte health statements; 230M wekelijkse gezondheidsgebruikers
📋 Claims & verificatie
| Claim in blogpost | Bron | Status |
|---|---|---|
| "OpenAI publiceerde deze week resultaten van een studie waarin ChatGPT's gezondheidsantwoorden werden vergeleken met antwoorden van echte artsen" | OpenAI | ✅ Geverifieerd |
| "Een panel van medische experts beoordeelde beide op accuraatheid, volledigheid en empathie. De AI won op alle drie de fronten." | OpenAI | ⚠️ Indirect |
| "Patiënten gaven de AI-antwoorden gemiddeld een hogere score dan de dokter-antwoorden" | OpenAI | ⚠️ Indirect |
| "OpenAI heeft een specifieke 'health intelligence'-module gebouwd die getraind is op medische literatuur, richtlijnen en klinische data" | OpenAI | ✅ Geverifieerd |
| "Google kondigde aan dat hun medische AI AMIE — een systeem dat artsen helpt bij diagnose en behandeling — nieuwe onderzoeksresultaten heeft" | OpenAI | ⚠️ Indirect |
| "ChatGPT scoorde hoger op empathie dan dokters" | OpenAI | ⚠️ Indirect |
| "De Belastingdienst gebruikt al AI voor risicodetectie. De AFM experimenteert met AI voor markttoezicht. Het CBS publiceert data die AI-systemen direct kunnen inlezen." | — | ℹ️ Opinie/analyse |
| "Een administratiekantoor in Zwolle met 12 medewerkers... Resultaat: 40% meer klanten per medewerker, snellere responstijden, hogere klanttevredenheid" | — | ℹ️ Opinie/analyse |
| "Test ChatGPT met een echte vraag uit je vakgebied" / "Bouw een AI-check in je workflow" / "Wees eerlijk over AI-gebruik" | — | ℹ️ Opinie/analyse |
📝 Methodologie-noot
De OpenAI-bron beschrijft 5 evaluatiecriteria: accuracy, communication, completeness, instruction following, en health decision helpfulness. "Empathie" is géén aparte categorie in de OpenAI-bron — de blogpost voegt dit toe als eigen interpretatie. Het evaluatiepanel bestond uit artsen (physicians), niet uit patiënten — de blogpost framet dit als "patiënten gaven de AI-antwoorden een hogere score". Google AMIE wordt niet genoemd in de blogpost-bronnen — dit is scope-creep. De Nederlandse voorbeelden (Belastingdienst, AFM, CBS, administratiekantoor Zwolle) zijn eigen analyse van de auteur, niet uit de bronnen. De 40%-productiviteitsclaim is een fictief rekenvoorbeeld.
🧩 Gerelateerde faalpatronen
- AI-reputatieschade — "Empathie is programmeerbaar" — de claim dat AI hoger scoort op empathie dan artsen is een krachtige maar onvolledig onderbouwde framing. De bron gebruikt "communication" als criterium, niet "empathy".
- AI-cognitieve-erosie — Parallel aan MIT/Lancet: als AI betrouwbaarder wordt dan professionals, ontstaat het risico dat professionals hun eigen vaardigheden verliezen door overmatige AI-afhankelijkheid.
- AI-verkeerde-prikkels — De blogpost framet AI als superieur aan artsen op empathie — een prikkel om menselijke professionals te vervangen door AI, terwijl de bron genuanceerder is over de rol van AI als aanvulling.