tts
Realtime spraak-AI versnelt: OpenAI’s GPT‑Realtime‑2 en Google’s Gemini Flash TTS zetten de toon
OpenAI en Google schuiven spraak-AI richting ‘voice-to-action’: realtime redeneren, live vertalen, streaming transcriptie en expressieve TTS.
Spraak-AI wordt volwassen: waarom latency, TTS en toezicht nu het nieuwe slagveld zijn
OpenAI legt uit hoe het WebRTC herbouwt voor lage latency op wereldschaal, terwijl Google Gemini 3.1 Flash TTS inzet op expressieve spraak met controle via tags en watermerken. Samen met groeiend toezicht op AI-modellen wijst dit op één trend: voice wordt de standaardinterface.
