AI schrijft 180% meer code, maar je product gaat er maar 30% op vooruit
📊 Kerncijfers
🔗 Geannoteerde bronnen
primair Forbes: AI Coding Agents Write 180% More Code But Ship Only 30% More Software
forbes.com/sites/josipamajic/.../ai-coding-agents-write-180-more-code-but-ship-only-30-more-software🗓️ 10 juni 2026 · Josipa Majic Predin · Bevat: MIT-studie met 100.000+ developers, +180% code volume vs +30% productie, Sarah Guo (Conviction) quote, Noam Brown (OpenAI) over evaluatie-horizon, untrainable corner-framework.
primair The Decoder: AI coding agents find the right file but miss the exact lines that matter
the-decoder.com/ai-coding-agents-find-the-right-file-but-miss-the-exact-lines...🗓️ 14 juni 2026 · Bevat: SWE-Explore benchmark (arXiv:2606.07297), 848 taken, 203 projecten, 10 talen, file-level goed, line-level 14–19%, CoSIL, ablatiestudie, code/data op GitHub/Hugging Face.
📋 Claims & verificatie
| Claim in blogpost | Bron | Status |
|---|---|---|
| "Onderzoekers van MIT analyseerden de output van meer dan 100.000 developers die AI coding agents gebruiken" | Forbes (Josipa Majic Predin) | ✅ Geverifieerd |
| "Het volume geschreven code steeg met ongeveer 180%" | Forbes (Josipa Majic Predin) | ✅ Geverifieerd |
| "De code die daadwerkelijk naar productie ging steeg met slechts 30%" | Forbes (Josipa Majic Predin) | ✅ Geverifieerd |
| "Forbes-journalist Josipa Majic Predin vatte het scherp samen: AI agents boosted the volume of code written by roughly 180%, while the amount of code that actually shipped to production rose by only about 30%." | Forbes (Josipa Majic Predin) | ✅ Geverifieerd |
| "Sarah Guo van Conviction Capital: Nearly everyone drew the same wrong lesson... the most measurable parts may not be the most important ones." | Forbes (Josipa Majic Predin) | ⚠️ Indirect |
| "File-level: agents vinden het juiste bestand. Score: goed." | The Decoder (SWE-Explore) | ✅ Geverifieerd |
| "Line-level: agents vinden de exacte regels die ertoe doen. Score: slechts 14-19% dekking." | The Decoder (SWE-Explore) | ✅ Geverifieerd |
| "Sterkere modellen lossen dit niet op. OpenAI, Anthropic, Google, Moonshot — de file-line gap is consistent over alle frontier models." | The Decoder (SWE-Explore) | ✅ Geverifieerd |
🔬 Methodologie-noot
Verificatie uitgevoerd op 15 juni 2026 tegen twee primaire bronnen: Forbes (Josipa Majic Predin, 10 juni 2026) en The Decoder (SWE-Explore, 14 juni 2026). Beide bronnen volledig toegankelijk via web_extract.
Claim 5 (Sarah Guo-quote): Parafrase-drift. Forbes-bron: "the most measurable parts may not be the only important ones." Blogpost: "the most measurable parts may not be the most important ones." "Only" vs "most" is betekenisverschil: Guo zegt meetbare delen zijn niet de énige belangrijke; blogpost zegt ze zijn niet de méést belangrijke. Status: ⚠️ Indirect (patroon #23, paraphrase drift).
Eigen analyses van de auteur (drie harde lessen, bottom line) zijn ℹ️ Opinie/analyse — niet in claims-tabel opgenomen. MIT-studie zelf niet als primaire bron geraadpleegd; cijfers geverifieerd tegen Forbes-journalistiek, niet tegen origineel MIT-paper.
🧩 Gerelateerde faalpatronen
patroon 💀 AI Marketing Kloof (score 9/10)
Waarom relevant: AI coding tools gemarket met 180% meer code, "10x sneller" — productie-realiteit slechts 30%. Marketing creëert schijnzekerheid; MKB blijft zelf verantwoordelijk voor productie-code. Cursor, Devin, Copilot = meest-gemarkete tools in deze categorie.
patroon 💀 AI-Verkeerde-Prikkels (score 9/10)
Waarom relevant: "Lines of code gegenereerd is een vanity metric" — exact dit patroon. AI optimaliseert voor code volume (de metric die je geeft), niet voor productie-waarde. 150-procentpunten-gap = textbook incentive misalignment.
patroon 💀 Organisatie als Bottleneck (score 9/10)
Waarom relevant: "De bottleneck zit niet in code genereren maar in verifiëren in jouw specifieke omgeving" — kern van dit patroon. AI faalt niet door technologie maar door organisatie: testinfrastructuur, CI/CD, code review. File-line gap illustreert dit technisch.
patroon 💀 Blind vertrouwen op AI (score 9/10)
Waarom relevant: "AI coding agents zijn accelerators, geen vervangers" — kern van blind-vertrouwen. 14-19% line-level dekking kwantificeert hóé blind: agents missen 81-86% van relevante code-regels.