Whisper
Realtime spraak-AI versnelt: OpenAI’s GPT‑Realtime‑2 en Google’s Gemini Flash TTS zetten de toon
OpenAI en Google schuiven spraak-AI richting ‘voice-to-action’: realtime redeneren, live vertalen, streaming transcriptie en expressieve TTS.
OpenAI’s nieuwe realtime spraakmodellen: van live vertaling tot voice agents die écht taken uitvoeren
OpenAI introduceert GPT‑Realtime‑2, Realtime‑Translate en Realtime‑Whisper in de Realtime API. Dit verandert hoe je voice apps bouwt—sneller, slimmer en agentischer.
OpenAI zet vol in op realtime spraak: GPT‑Realtime‑2, live vertaling en streaming Whisper in één API
OpenAI introduceert drie nieuwe audiomodellen in de Realtime API: GPT‑Realtime‑2 voor slimmere spraakgesprekken, GPT‑Realtime‑Translate voor live vertaling en GPT‑Realtime‑Whisper voor streaming transcriptie. Wat kun je ermee bouwen — en waar moet je als maker op letten?
