← terug naar dossiers
📁 Dossier

AI schrijft 180% meer code, maar je product gaat er maar 30% op vooruit

📅 2026-06-15 ⚠️ In review — 7 van 8 claims ✅; 1 ⚠️ Indirect (Sarah Guo-quote: paraphrase drift, "only" vs "most")

📊 Kerncijfers

+180%
Code volume stijging met AI coding agents (MIT-studie, 100.000+ developers)
+30%
Code die daadwerkelijk naar productie ging (gap van 150 procentpunten)
14–19%
Line-level dekking: agents vinden de juiste regels (SWE-Explore benchmark)
100.000+
Developers geanalyseerd in de MIT-studie

🔗 Geannoteerde bronnen

primair Forbes: AI Coding Agents Write 180% More Code But Ship Only 30% More Software

forbes.com/sites/josipamajic/.../ai-coding-agents-write-180-more-code-but-ship-only-30-more-software

🗓️ 10 juni 2026 · Josipa Majic Predin · Bevat: MIT-studie met 100.000+ developers, +180% code volume vs +30% productie, Sarah Guo (Conviction) quote, Noam Brown (OpenAI) over evaluatie-horizon, untrainable corner-framework.

primair The Decoder: AI coding agents find the right file but miss the exact lines that matter

the-decoder.com/ai-coding-agents-find-the-right-file-but-miss-the-exact-lines...

🗓️ 14 juni 2026 · Bevat: SWE-Explore benchmark (arXiv:2606.07297), 848 taken, 203 projecten, 10 talen, file-level goed, line-level 14–19%, CoSIL, ablatiestudie, code/data op GitHub/Hugging Face.

📋 Claims & verificatie

Claim in blogpostBronStatus
"Onderzoekers van MIT analyseerden de output van meer dan 100.000 developers die AI coding agents gebruiken" Forbes (Josipa Majic Predin) ✅ Geverifieerd
"Het volume geschreven code steeg met ongeveer 180%" Forbes (Josipa Majic Predin) ✅ Geverifieerd
"De code die daadwerkelijk naar productie ging steeg met slechts 30%" Forbes (Josipa Majic Predin) ✅ Geverifieerd
"Forbes-journalist Josipa Majic Predin vatte het scherp samen: AI agents boosted the volume of code written by roughly 180%, while the amount of code that actually shipped to production rose by only about 30%." Forbes (Josipa Majic Predin) ✅ Geverifieerd
"Sarah Guo van Conviction Capital: Nearly everyone drew the same wrong lesson... the most measurable parts may not be the most important ones." Forbes (Josipa Majic Predin) ⚠️ Indirect
"File-level: agents vinden het juiste bestand. Score: goed." The Decoder (SWE-Explore) ✅ Geverifieerd
"Line-level: agents vinden de exacte regels die ertoe doen. Score: slechts 14-19% dekking." The Decoder (SWE-Explore) ✅ Geverifieerd
"Sterkere modellen lossen dit niet op. OpenAI, Anthropic, Google, Moonshot — de file-line gap is consistent over alle frontier models." The Decoder (SWE-Explore) ✅ Geverifieerd

🔬 Methodologie-noot

Verificatie uitgevoerd op 15 juni 2026 tegen twee primaire bronnen: Forbes (Josipa Majic Predin, 10 juni 2026) en The Decoder (SWE-Explore, 14 juni 2026). Beide bronnen volledig toegankelijk via web_extract.

Claim 5 (Sarah Guo-quote): Parafrase-drift. Forbes-bron: "the most measurable parts may not be the only important ones." Blogpost: "the most measurable parts may not be the most important ones." "Only" vs "most" is betekenisverschil: Guo zegt meetbare delen zijn niet de énige belangrijke; blogpost zegt ze zijn niet de méést belangrijke. Status: ⚠️ Indirect (patroon #23, paraphrase drift).

Eigen analyses van de auteur (drie harde lessen, bottom line) zijn ℹ️ Opinie/analyse — niet in claims-tabel opgenomen. MIT-studie zelf niet als primaire bron geraadpleegd; cijfers geverifieerd tegen Forbes-journalistiek, niet tegen origineel MIT-paper.

🧩 Gerelateerde faalpatronen

patroon 💀 AI Marketing Kloof (score 9/10)

Waarom relevant: AI coding tools gemarket met 180% meer code, "10x sneller" — productie-realiteit slechts 30%. Marketing creëert schijnzekerheid; MKB blijft zelf verantwoordelijk voor productie-code. Cursor, Devin, Copilot = meest-gemarkete tools in deze categorie.

patroon 💀 AI-Verkeerde-Prikkels (score 9/10)

Waarom relevant: "Lines of code gegenereerd is een vanity metric" — exact dit patroon. AI optimaliseert voor code volume (de metric die je geeft), niet voor productie-waarde. 150-procentpunten-gap = textbook incentive misalignment.

patroon 💀 Organisatie als Bottleneck (score 9/10)

Waarom relevant: "De bottleneck zit niet in code genereren maar in verifiëren in jouw specifieke omgeving" — kern van dit patroon. AI faalt niet door technologie maar door organisatie: testinfrastructuur, CI/CD, code review. File-line gap illustreert dit technisch.

patroon 💀 Blind vertrouwen op AI (score 9/10)

Waarom relevant: "AI coding agents zijn accelerators, geen vervangers" — kern van blind-vertrouwen. 14-19% line-level dekking kwantificeert hóé blind: agents missen 81-86% van relevante code-regels.