spraak-AI
OpenAI zet in op realtime spraak-AI: 3 nieuwe voice-modellen in de API
OpenAI voegt drie nieuwe voice-modellen toe aan de API voor realtime gesprekken, live vertaling en snelle transcriptie—een stap richting productieklare voice agents.
Realtime spraak-AI versnelt: OpenAI’s GPT‑Realtime‑2 en Google’s Gemini Flash TTS zetten de toon
OpenAI en Google schuiven spraak-AI richting ‘voice-to-action’: realtime redeneren, live vertalen, streaming transcriptie en expressieve TTS.
OpenAI’s nieuwe realtime spraakmodellen: van live vertaling tot voice agents die écht taken uitvoeren
OpenAI introduceert GPT‑Realtime‑2, Realtime‑Translate en Realtime‑Whisper in de Realtime API. Dit verandert hoe je voice apps bouwt—sneller, slimmer en agentischer.
OpenAI zet vol in op realtime spraak: GPT‑Realtime‑2, live vertaling en streaming Whisper in één API
OpenAI introduceert drie nieuwe audiomodellen in de Realtime API: GPT‑Realtime‑2 voor slimmere spraakgesprekken, GPT‑Realtime‑Translate voor live vertaling en GPT‑Realtime‑Whisper voor streaming transcriptie. Wat kun je ermee bouwen — en waar moet je als maker op letten?
OpenAI brengt GPT‑Realtime‑2 naar de API: live vertalen en transcriberen in één spraakstack
OpenAI lanceert GPT‑Realtime‑2 plus live vertaling en streaming transcriptie in de Realtime API. Wat kun je ermee, en wat verandert dit voor voice agents?
Spraak-AI wordt volwassen: waarom latency, TTS en toezicht nu het nieuwe slagveld zijn
OpenAI legt uit hoe het WebRTC herbouwt voor lage latency op wereldschaal, terwijl Google Gemini 3.1 Flash TTS inzet op expressieve spraak met controle via tags en watermerken. Samen met groeiend toezicht op AI-modellen wijst dit op één trend: voice wordt de standaardinterface.
OpenAI laat zien hoe het spraak-AI met lage latency wereldwijd opschaalt (WebRTC-architectuur)
OpenAI beschrijft hoe het zijn WebRTC-stack herbouwde voor lagere latency en stabielere spraak-AI via ChatGPT Voice en de Realtime API.
