Microsoft lanceert drie MAI-modellen op Foundry

modellen 📅 2026-04-03

Microsoft heeft drie eerste-partij MAI-modellen uitgebracht -- Transcribe-1 voor speech-to-text, Voice-1 voor text-to-speech en Image-2 voor beeldgeneratie -- nu beschikbaar via het Foundry-platform. Transcribe-1 staat eerste op FLEURS voor 11 kerntalen en draait 2,5x sneller dan Azure's bestaande batch-transcriptie. Voice-1 genereert 60 seconden audio per seconde en maakt custom stemmen aan op basis van enkele seconden sample-audio. Image-2 belandde in de top 3 op Arena.ai en verdubbelt de vorige generatiesnelheid. De prijsstelling is agressief: $0,36/uur voor transcriptie, $22 per miljoen karakters voor stemmen. Het feit dat Microsoft eigen productieklare multimodale modellen bouwt terwijl het OpenAI-partnerschap behouden blijft, wijst op een afdekkingsstrategie die steeds moeilijker als louter complementair te lezen valt.

🔗 lees originele bron