OncoAgent belooft privacyvriendelijke AI-hulp voor oncologen: multi-agent RAG, on-prem en ‘Zero-PHI’

Een nieuwe technische preprint met de naam OncoAgent beschrijft een open-source ‘clinical decision support’-systeem dat expliciet is ontworpen voor oncologie én voor omgevingen waar patiëntdata het ziekenhuis niet mag verlaten. Opvallend is niet alleen de medische focus, maar vooral de architectuurkeuzes: een dual-tier modelopzet, een multi-agent orkestratie met LangGraph en een Corrective RAG-pijplijn die output aan richtlijnen probeert te verankeren.

Wat is OncoAgent precies (en wat claimt het)?

Volgens de auteurs combineert OncoAgent twee fijngetunede modellen: een ‘sneller’ model (9B) voor eenvoudige vragen en een ‘dieper redenerend’ model (27B) voor complexe casussen. Daarbovenop draait een graf-achtige agent-topologie met meerdere gespecialiseerde stappen (routering, retrieval, specialist/critic, human-in-the-loop) en een veiligheidslaag die een Zero-PHI policy moet afdwingen (dus: geen patiënt-identificeerbare informatie in de output).

Die multi-agent aanpak past in een bredere trend: agent-orkestratie wordt steeds meer gezien als een apart probleem, los van het onderliggende LLM. LangGraph positioneert zichzelf bijvoorbeeld als een low-level runtime voor long-running, stateful agents met o.a. human-in-the-loop en duurzame uitvoering (LangGraph overview).

Waarom ‘on-prem’ en privacy ineens weer centraal staan

De zorgsector wil wel AI, maar niet tegen elke prijs. Veel ziekenhuizen worstelen met governance: wie mag wat zien, wat gaat naar een cloud-API, en hoe bewijs je achteraf welke bronnen een advies beïnvloedden? OncoAgent zet daarom zwaar in op on-prem deployment en retrieval over (volgens de preprint) tientallen richtlijn-documenten. Dat sluit aan bij wat we eerder zagen in de markt: grote spelers bouwen zorgplatformen, maar de vraag blijft waar data en verantwoordelijkheid precies landen (zie ook ons artikel over CVS en Google Cloud).

De hardwarehoek: training in minuten is vooral een infrastructuurverhaal

Een tweede opvallende claim is de trainingssnelheid. De auteurs schrijven dat ze finetuning op AMD Instinct MI300X-hardware hebben gedaan, met veel nadruk op throughput. AMD positioneert de MI300X onder meer met grote geheugenbandbreedte en een forse hoeveelheid HBM-geheugen (zie de productspecificaties op amd.com). Los van de exacte minuten: het onderstreept dat ‘privacyvriendelijke’ AI in de zorg vaak neerkomt op één praktische vraag: kunnen we dit betaalbaar en beheersbaar in eigen huis draaien?

Wat betekent dit voor ziekenhuizen (en voor AI in de zorg)?

OncoAgent is (vooralsnog) een preprint, dus claims zijn niet automatisch klinisch bewezen. Maar het document maakt wel helder welke richting veel teams op bewegen: niet één groot model dat alles doet, maar een gecontroleerde keten van stappen met retrieval, checks en menselijke stopmomenten. Die ‘safety harness’-gedachte zagen we ook in een heel andere context bij coding agents (bijv. Codex veilig inzetten).

Als dit soort open-source, on-prem architecturen volwassen worden, kan dat de drempel verlagen voor ziekenhuizen die wél AI willen, maar geen black box in de cloud. Tegelijk blijft de lat hoog: evaluaties, aansprakelijkheid en integratie met klinische workflows bepalen uiteindelijk of een demo ook zorgpraktijk wordt. Ter vergelijking: zelfs bij bredere medische toepassingen zijn resultaten en implementatie twee verschillende werelden (zie ook: Harvard-studie over AI vs. SEH-artsen).