Gemini 3.1 Flash Live richt zich op realtime spraak-AI
Google heeft Gemini 3.1 Flash Live in preview uitgebracht, een multimodaal spraakmodel voor audio- en videostreaming met lage latentie en ondersteuning voor AI-agents.
Google heeft Gemini 3.1 Flash Live in preview uitgebracht, een multimodaal spraakmodel ontworpen voor audio- en videostreaming met lage latentie en ondersteuning voor tool use door AI-agents. Het model scoorde 90,8% op ComplexFuncBench Audio – bijna 20% boven de vorige generatie – en vestigde een record op Audio MultiChallenge. Het model ondersteunt meer dan 90 talen, filtert achtergrondgeluid betrouwbaarder uit spraak en verdubbelt de contextlengte in Gemini Live op Android en iOS. Google zet het model in om Search Live wereldwijd uit te rollen in meer dan 200 landen. De opmars van spraakgerichte interfaces versnelt bij alle grote labs: OpenAI, Anthropic en Google hebben ieder in hetzelfde kwartaal een dedicated audiomodel uitgebracht. Latentie en geluidsrobuustheid worden de nieuwe benchmarks die er echt toe doen.

