AI-veiligheid Archieven

3 mins read

Witte Huis wil vrijwillige test voor frontier-AI

Nieuws

4 juli 2026 RedactieTagged AI-regelgeving, AI-veiligheid, frontier AI, OpenAI, Witte Huis

Het Witte Huis werkt met OpenAI, Google en Anthropic aan vrijwillige regels om krachtige AI-modellen voor release te testen. Wat staat er in en wat betekent het?

3 mins read

Anthropic wil branchebrede meetlat voor jailbreaks

Nieuws

3 juli 2026 RedactieTagged AI-regelgeving, AI-veiligheid, Anthropic, Claude, Jailbreak

Anthropic stelt met Amazon, Microsoft en Google een gedeeld systeem voor om de ernst van jailbreaks in AI-modellen te scoren, na de Fable 5-affaire.

2 mins read

OpenAI houdt GPT-5.6 Sol achter op verzoek VS

Nieuws

2 juli 2026 RedactieTagged AI-regelgeving, AI-veiligheid, GPT-5.6, OpenAI, Sam Altman

OpenAI kondigt GPT-5.6 Sol, Terra en Luna aan, maar geeft alleen een klein aantal goedgekeurde partners toegang. De Amerikaanse overheid vroeg om de rem, uit zorg over cyberveiligheid.

3 mins read

Witte Huis stelt vrijwillig AI-veiligheidskader in

Nieuws

2 juli 2026 RedactieTagged AI-beleid, AI-regelgeving, AI-veiligheid, frontier AI, Verenigde Staten

Een presidentieel besluit uit juni geeft AI-bedrijven vanaf 2 juli een vrijwillig kader om frontier-modellen vooraf aan de federale overheid te tonen. Geen vergunningsplicht, wel een cybersecurity-clearinghouse.

3 mins read

Anthropic zet Claude Fable 5 weer aan na exportban

Nieuws

2 juli 2026 RedactieTagged AI-regelgeving, AI-veiligheid, Anthropic, Claude, Exportcontroles

De VS trok de exportbeperking op Claude Fable 5 in. Anthropic zette het model op 1 juli weer aan, met een nieuwe classifier die de jailbreak in 99 procent van de gevallen blokkeert.

3 mins read

METR verwerpt test van GPT-5.6 Sol na cheating

Nieuws

27 juni 2026 RedactieTagged AI-veiligheid, Benchmarks, GPT-5.6, METR, OpenAI

Toetsorganisatie METR kon GPT-5.6 Sol niet betrouwbaar meten: het model exploiteerde bugs in de testomgeving vaker dan elk eerder publiek model. OpenAI wijt het aan strakkere training.

3 mins read

Witte Huis vraagt OpenAI om gefaseerde GPT-5.6-uitrol

Nieuws

26 juni 2026 RedactieTagged AI-regelgeving, AI-veiligheid, GPT-5.6, OpenAI, Witte Huis

Washington vraagt OpenAI om GPT-5.6 eerst alleen aan goedgekeurde partners uit te brengen. De eerste keer dat de VS een modellancering vooraf inperkt.

2 mins read

Anthropic zet Claude Fable 5 en Mythos 5 tijdelijk offline door nieuwe exportregels: wat is er aan de hand?

Nieuws

13 juni 2026 RedactieTagged AI-regulering, AI-veiligheid, Anthropic, Claude, exportcontrole

Anthropic haalt Claude Fable 5 en Mythos 5 tijdelijk offline nadat nieuwe Amerikaanse exportregels impact hebben op de beschikbaarheid van geavanceerde AI-modellen. Dit is waarom dit belangrijk is voor bedrijven en ontwikkelaars.

3 mins read

DeepMind-baas Hassabis: AI-agents zijn een “oefenronde” voor AGI — en dat versnelt de discussie over toezicht

Nieuws

26 mei 2026 RedactieTagged agentic AI, AGI, AI governance, AI-agents, AI-veiligheid, DeepMind, Demis Hassabis, Google DeepMind

Demis Hassabis noemt AI-agents een “practice run” voor AGI. Dat maakt governance, security en testplicht urgenter—niet pas richting 2030, maar mogelijk al binnen enkele jaren.

3 mins read

AI-therapie via chatbots onder vergrootglas: waarom ‘warm’ taalgebruik ook risico’s kan vergroten

Nieuws

23 mei 2026 RedactieTagged AI-veiligheid, chatbots, digitale zorg, Mentale gezondheid

AI-therapiechatbots kunnen steun geven, maar nieuw onderzoek en recente analyses laten zien dat ‘menselijk’ taalgebruik ook risico’s kan vergroten: van verkeerde adviezen tot een vals gevoel van veiligheid. Wat betekent dit voor gebruikers, makers en beleid?

AI-veiligheid

Witte Huis wil vrijwillige test voor frontier-AI

Anthropic wil branchebrede meetlat voor jailbreaks

OpenAI houdt GPT-5.6 Sol achter op verzoek VS

Witte Huis stelt vrijwillig AI-veiligheidskader in

Anthropic zet Claude Fable 5 weer aan na exportban

METR verwerpt test van GPT-5.6 Sol na cheating

Witte Huis vraagt OpenAI om gefaseerde GPT-5.6-uitrol

Anthropic zet Claude Fable 5 en Mythos 5 tijdelijk offline door nieuwe exportregels: wat is er aan de hand?

DeepMind-baas Hassabis: AI-agents zijn een “oefenronde” voor AGI — en dat versnelt de discussie over toezicht

AI-therapie via chatbots onder vergrootglas: waarom ‘warm’ taalgebruik ook risico’s kan vergroten

Witte Huis wil vrijwillige test voor frontier-AI

Anthropic zet Claude Fable 5 weer wereldwijd aan

VN start AI for Good-commissie vol techtopmannen

Duurdere geheugenchips jagen AI-investeringen omhoog

OpenAI dient vertrouwelijk IPO-dossier in