Fastino Labs maakt GLiGuard open-source: kleine AI-modellen die PII in prompts real-time redigeren

Fastino Labs heeft GLiGuard open-source gemaakt: een set compacte AI-modellen die automatisch persoonlijke gegevens (PII) in prompts kunnen herkennen en (waar nodig) redigeren voordat die tekst naar een groter model of externe API gaat. De aankondiging speelt in op een groeiende realiteit: steeds meer teams gebruiken LLM’s in workflows met klantdata, supporttickets en interne documenten — en daarmee groeit het risico op onbedoelde datalekken.

Wat is GLiGuard precies?

Volgens Fastino gaat het om kleine, snelle modellen die je als “guard” vóór een LLM kunt zetten: ze detecteren bijvoorbeeld e-mailadressen, telefoonnummers, namen of andere identificerende info en kunnen die maskeren of labelen. Fastino positioneert GLiGuard nadrukkelijk als een praktische bouwsteen voor privacy-by-design in AI-toepassingen. (Bron: PR Newswire.)

De modellen zijn ook gepubliceerd op Hugging Face, inclusief beschrijvingen van het beoogde gebruik en de manier waarop redactie/annotatie kan worden toegepast in pipelines. (Bron: Hugging Face (Fastino).)

Waarom dit nieuwswaardig is (ook zonder “nieuw frontier model”)

De markt verschuift: niet alleen “slimmer” is belangrijk, maar ook veiliger en compliance-proof. Organisaties willen LLM’s inzetten, maar lopen vast op vragen als: welke data mag er überhaupt naar een model, hoe beperk je prompts met klantinformatie, en hoe toon je aan dat je maatregelen neemt?

GLiGuard past in een trend waarin guardrails, filters en policy-engines steeds vaker los als component worden aangeboden. Dat is relevant in Europa, waar regelgeving en auditbaarheid vaker op de agenda staan. Zie ook onze update over het schuiven met deadlines en verplichtingen in de EU AI Act: EU bereikt compromis over AI Act ‘omnibus’.

Hoe werkt PII-redactie in de praktijk?

In veel teams gebeurt “redactie” nu nog handmatig (of met regex-regels). Dat is foutgevoelig: mensen vergeten velden, of het patroon mist een variant. Een modelmatige benadering kan flexibeler zijn, mits je duidelijk definieert wat je wel en niet als PII behandelt en hoe je false positives minimaliseert.

Fastino verwijst daarnaast naar onderzoek rond real-time redactie en de uitdagingen van betrouwbare detectie. (Bron: arXiv: GLiGuard.)

Voor gebruikers is dit vooral interessant als je LLM’s koppelt aan helpdesk-, sales- of HR-processen: daar zitten vaak identificeerbare gegevens in, en één “copy/paste” naar een chat-interface is genoeg om onbedoeld data te delen.

Wat betekent dit voor teams die ChatGPT/LLM’s gebruiken?

Zie GLiGuard (en vergelijkbare guard-tools) als een extra laag tussen gebruiker en model. Het voorkomt niet alle risico’s, maar het kan een belangrijk deel van “prompt leakage” reduceren — vooral als je ook je accountbeveiliging en governance op orde brengt. Daarover schreven we eerder in Advanced Account Security en passkeys voor ChatGPT.

Ook voor consumentenfuncties is dit relevant, omdat privacy- en veiligheidsfeatures steeds vaker productkeuzes sturen. Kijk bijvoorbeeld naar de discussie rond ChatGPT’s ‘Trusted Contact’ en de recente stap waarbij ChatGPT beter context moet herkennen in gevoelige gesprekken.

Conclusie: een kleine schakel met grote impact

GLiGuard is geen nieuw “alleskunner”-model, maar het is wél precies het soort infrastructuur dat AI uit de experimenteerfase trekt: tooling die datastromen schoner maakt, risico’s verkleint en compliance concreter maakt. Voor teams die nu al LLM’s inzetten, is dit het moment om te denken in lagen: redactie/PII-detectie vóór de prompt, sterke accountbeveiliging, en helder beleid over wat wel/niet naar externe modellen mag.