3 mins read

OpenAI zet vol in op realtime spraak: GPT‑Realtime‑2, live vertaling en streaming Whisper in één API

OpenAI introduceert drie nieuwe audiomodellen in de Realtime API: GPT‑Realtime‑2 voor slimmere spraakgesprekken, GPT‑Realtime‑Translate voor live vertaling en GPT‑Realtime‑Whisper voor streaming transcriptie. Wat kun je ermee bouwen — en waar moet je als maker op letten?

3 mins read

Realtime voice agents worden volwassen: waarom events en lage latency nu doorslaggevend zijn

OpenAI beschrijft in zijn Realtime API-documentatie hoe WebRTC/WebSocket-sessies en server-side controls voice agents mogelijk maken. In combinatie met de open source Agents SDK groeit de behoefte aan event-driven architectuur. Wat betekent dat voor teams die nu met AI-telefonie en agents bouwen?