← terug naar dossiers
📁 Dossier

Waarom een AI-model van 3 miljard parameters beter presteert dan het duurste alternatief — en wat dat betekent voor jouw MKB

📅 2026-05-27 ✅ Geverifieerd

📊 Kerncijfers

0,911
Score 3B specialist op OCR-benchmark (DharmaOCR) — hoger dan elk commercieel frontier-model
~52×
Goedkoper per miljoen pagina's dan Claude Opus 4.6 (inference vs. API-prijs)
0,20%
Text degeneration rate 3B specialist — 7× lager dan general-purpose model zelfde grootte
0,833
Score Claude Opus 4.6 — 8 procentpunten lager dan de 3B specialist

🔗 Geannoteerde bronnen

primair Specialization Beats Scale: A Strategic Variable Most AI Procurement Decisions Overlook

huggingface.co/blog

🗓️ 22 mei 2026 · Erick Lachmann, Pimenta de Freitas Cardoso (Dharma-AI) · Bevat: Volledige DharmaOCR benchmarkresultaten (Brazilië-Portugees OCR), Pareto frontier-analyse (kwaliteit vs. kosten), specialisatiehiërarchie (generalist → domain-specialist → domain-specific), bewijs dat Nanonets-OCR2-3B (0,921 na finetune) Claude Opus 4.6 (0,833) verslaat tegen 52× lagere kosten, degeneratie-analyse, en strategische reframing van AI-inkoop.

📋 Claims & verificatie

Claim in blogpostBronStatus
"Een gespecialiseerd AI-model met slechts 3 miljard parameters [...] scoorde 0,911. Claude Opus 4.6: 0,833" HuggingFace/Dharma-AI ✅ Geverifieerd
"Het kleine model was ruwweg 52 keer goedkoper per miljoen pagina's" HuggingFace/Dharma-AI ✅ Geverifieerd
"De onderzoekers noemen dit 'distributional alignment': hoe nauw de trainingsdata van een model aansluit bij de klus" HuggingFace/Dharma-AI ✅ Geverifieerd
"Het 3B-model [vertoonde] slechts 0,20% 'text degeneration' [...] Het eerstvolgende beste gespecialiseerde model: 0,40%" HuggingFace/Dharma-AI ✅ Geverifieerd
"Jouw domeinkennis is je concurrentievoordeel [...] Als je die kennis gebruikt om een AI te trainen of finetunen op jouw specifieke documenten, processen en terminologie, ontstaat er een systeem dat generieke oplossingen overtreft" ℹ️ Opinie/analyse
"Een Nederlandse commerciële makelaar [...] Resultaat: 96% classificatie-accuracy, kosten €48 per maand aan rekentijd [...] Een generiek model van €1.200 presteerde slechter dan een specialistisch model van €48" ℹ️ Opinie/analyse

🧩 Gerelateerde faalpatronen

Organisatie-als-bottleneck

De blogpost wijst op de zesde klassieke valkuil: "beginnen bij de tool, niet bij het probleem." MKB-bedrijven kopen het duurste model zonder de vraag te stellen: past dit bij ónze taak? Het Dharma-AI-artikel toont dat deze reflex meetbaar geld kost. Relevantie: ★★★★★

AI-verkeerde-prikkels

De AI-marketingmachine verkoopt "groter = beter." De benchmark toont dat deze prikkel leidt tot suboptimale aankoopbeslissingen — een 3B specialist was 52× goedkoper én beter. De prikkel van vendors (verkopen wat duur is) staat haaks op de prikkel van MKB (kopen wat werkt). Relevantie: ★★★★☆

AI-cognitieve-erosie

De neiging om klakkeloos het grootste model te kiezen zonder kritische evaluatie van de eigen use-case is een vorm van cognitieve erosie: het eigen oordeel wordt vervangen door markthype. De benchmark biedt een antidotum: data-gedreven inkoop. Relevantie: ★★★☆☆