AI safety
OpenAI’s Frontier Governance Framework: dit betekent het nu al voor EU AI Act-compliance
OpenAI’s Frontier Governance Framework maakt governance concreet. Dit is wat EU AI Act-compliance en vendor assessments nu al gaan vragen.
Fastino Labs open-sourcet GLiGuard en GLiNER2-PII: 300M-parameter modellen maken safety en PII-detectie ineens betaalbaar
Fastino Labs brengt twee open-source small language models uit: GLiGuard voor safety/guardrails en GLiNER2-PII voor meertalige PII-detectie. Ze mikken op snelheid (sub-100ms) en een brede taxonomie, getraind met een agentic loop via Pioneer.
Anthropic presenteert Introspection Adapters: AI-models leren zelf gedrag rapporteren
Anthropic zegt een nieuwe techniek te hebben ontwikkeld waarmee taalmodellen beter kunnen aangeven welk gedrag ze tijdens fine-tuning hebben geleerd.
