Stel je voor: je neemt een spraakopname van je beste verkooppraatje, een foto van je product, een korte video van je werkplaats, en typt drie zinnen instructie. Vijf minuten later heb je een complete, professionele productvideo — zonder cameraploeg, zonder montage-software, zonder €5.000 aan productiekosten.
Dit is geen sciencefiction. Sinds 19 mei 2026 is het realiteit.
Google lanceerde vorige week Gemini Omni, een nieuw AI-model dat élke combinatie van tekst, beeld, audio én video als input accepteert — en er video van maakt. Het eerste model in de familie, Gemini Omni Flash, is nu beschikbaar voor alle Gemini-abonnees en rolt deze week uit naar YouTube Shorts en YouTube Create.
Wat maakt Omni anders dan alles wat er was?
Tot nu toe werkte AI-creatie in hokjes: één model voor tekst-naar-beeld, een ander voor beeld-naar-video, weer een ander voor audio. Stapelen maar, met kwaliteitsverlies bij elke stap.
Gemini Omni gooit die hokjes weg. Het is één enkel model dat alle inputtypes tegelijk begrijpt en verwerkt. Je combineert een stemopname, een referentiefoto van een personage, een videoclip voor de bewegingsstijl en een geschreven beschrijving — en het model smelt alles samen tot één coherente video.
Google noemt het "any-to-any" — van willekeurige input naar video-output, met begrip van hoe de echte wereld werkt. Het model "groundt" zijn output in realiteitsbegrip: het weet dat een koffiekopje op tafel hoort, niet zwevend in de lucht.
Van Silicon Valley naar jouw straat: de domino in 3 stappen
Stap 1 — Nu: Google zet Omni in de handen van consumenten. Twintig dollar per maand, en je maakt video's die eruitzien alsof er een productieteam aan gewerkt heeft. YouTube Shorts-makers gebruiken het al om content te maken in stijlen die voorheen onbetaalbaar waren.
Stap 2 — Over 3 maanden: De zakelijke API opent. Google's VentureBeat-aankondiging zegt het expliciet: "The model marks Google's bid to collapse the multimodal generative stack into a single foundation model with a single editing surface." Vertaling: straks plug je één API in je bedrijfssoftware en heb je álles — productfoto's, instructievideo's, klantcommunicatie, social content.
Stap 3 — Over 6 maanden: Jouw MKB gebruikt het dagelijks. Een meubelmaker maakt een video van een ruwe houten plank met voice-over uitleg → Omni maakt er een complete productvideo van, inclusief animatie van het eindresultaat. Een installateur neemt een spraakmemo op tijdens de rit naar de klant → Omni combineert het met productfoto's tot een offerte-video.
De MKB-vertaling: concreet en praktisch
Voor het Nederlandse MKB is dit bijzonder relevant. Je concurreert niet op marketingbudget met grote bedrijven, maar wél op snelheid en persoonlijkheid. Omni maakt van die twee eigenschappen je sterkste troef:
- Productdemo's in minuten. Geen dure videoproductie meer. Foto van je product + spraakopname met uitleg = kant-en-klare demo voor je website of social media.
- Instructievideo's op maat. Monteur legt een reparatie uit via spraakmemo terwijl hij werkt → Omni combineert met foto's van de handleiding tot een instructievideo voor de klant.
- Gepersonaliseerde klantcommunicatie. Stuur elke klant een video met hun naam, hun product, en jouw stem. Schaalbaar voor het eerst.
Verrassend genoeg is de grootste barrière niet de technologie of de prijs. Het is dat de meeste MKB'ers nog in het "ik moet camera-apparatuur kopen" denkraam zitten. Omni doorbreekt dat fundamenteel: je enige input is wat je al hebt — stem, foto's, bestaande video's. De AI doet de rest.
Wat kun je nu al doen?
Start met de gratis tools. Gemini Omni rolt deze week uit naar YouTube Shorts — maak een account aan en experimenteer. Leer hoe prompts werken voor video: wees specifiek over stijl, belichting, tempo.
Verzamel je eigen beeldmateriaal. Het model werkt het best met jóuw content — foto's van je producten, korte clips van je werkplaats, je team aan het werk. Begin vandaag met fotograferen. Die bibliotheek is over 3 maanden goud waard.
Houd de API-lancering in de gaten. De zakelijke toegang komt "later dit jaar". Bedrijven die nu al experimenteren met de consumentenversie hebben een voorsprong van maanden op de concurrentie.
De AI die video maakt uit elke combinatie van input is geen toekomstmuziek meer. Hij draait nu, op Googles servers, voor twintig dollar per maand. De vraag is niet of je ermee aan de slag gaat. De vraag is of jij de eerste in jouw branche bent die het doet — of de laatste die het ontdekt.