Nieuwe arXiv-paper koppelt MCP aan wetenschappelijke kennisgrafieken: wat mcp-proto-okn belooft

Een nieuwe arXiv-publicatie laat zien hoe snel de ‘MCP‑ecosysteemlaag’ volwassen wordt. In mcp-proto-okn beschrijven onderzoekers een Python‑gebaseerde Model Context Protocol (MCP) server die AI-assistenten in natuurlijke taal wetenschappelijke kennisgrafieken laat ontdekken en bevragen — inclusief schema-inspectie, multi‑graph queries en het uitvoeren van SPARQL.

Wat is er precies nieuw?

De paper mcp-proto-okn (arXiv:2605.30283) (ingediend op 28 mei 2026) introduceert een MCP-server die bedoeld is om drempels weg te nemen voor het gebruik van open wetenschappelijke knowledge graphs. Volgens de auteurs kan een assistant via natuurlijke taal routes kiezen tussen grafen, ontologieën uitbreiden, SPARQL uitvoeren en resultaten verwerken tot een transcript dat je kunt reviewen. Dat klinkt als “RAG, maar dan op graf-niveau”: niet alleen documenten ophalen, maar ook relaties, entiteiten en schema’s expliciet gebruiken.

Waarom MCP hier het verschil maakt

MCP (Model Context Protocol) is opgezet als een open standaard om AI-apps te verbinden met externe systemen en tools. In de officiële MCP-documentatie wordt het vergeleken met een “USB‑C‑poort voor AI”: één gestandaardiseerde manier om data en acties aan een assistant te koppelen, zodat je niet voor elke integratie opnieuw het wiel uitvindt (Model Context Protocol docs).

Het relevante punt: als je een knowledge graph of database beschikbaar maakt als MCP‑server, kan een client (bijvoorbeeld een assistant in je IDE of chatomgeving) datzelfde endpoint hergebruiken. Dat past bij de trend die we ook bij ‘agent‑werk’ zien: minder losse plug-ins, meer herbruikbare interfaces. (Lees ook ons artikel over Codex als agent op mobiel.)

SPARQL klinkt eng, maar is precies wat je wil voor kennisgrafieken

Veel kennisgrafieken zijn (direct of indirect) gebaseerd op RDF-data. SPARQL is daarvoor de standaard querytaal. De W3C‑aanbeveling omschrijft SPARQL als de taal waarmee je queries over RDF‑grafen kunt uitdrukken, inclusief optionele patronen, aggregaties en het combineren van grafpatronen (W3C: SPARQL 1.1 Query Language).

In de praktijk is dit precies het soort ‘hard’ gereedschap dat AI-assistenten nuttig kan verpakken: jij formuleert je vraag in normale taal (“zoek alle publicaties die dit gen in verband brengen met die aandoening, en geef de relaties”), en de server/assistant vertaalt dat naar SPARQL, voert het uit, en geeft een controleerbaar resultaat terug. Het risico van hallucinaties verschuift dan deels van “model verzint bronnen” naar “query geeft echt geen resultaten” — wat makkelijker te debuggen is.

Wat betekent dit voor teams die AI in onderzoek of datawerk inzetten?

Voor onderzoeksteams, data-analisten en biotech/medische omgevingen is de belofte simpel: sneller van vraag naar verifieerbare graf‑query. Maar het echte voordeel is governance: als je MCP-servers versieert, logging aanzet en transcripts bewaart, kun je veel beter terughalen wat er precies is bevraagd en welke data het antwoord onderbouwt. Dat sluit aan bij de bredere beweging richting transparantie en provenance (zie: content provenance en transparantie) en het idee dat evaluatie en controle productfeatures worden (zie: OpenAI’s playbook voor betrouwbare AI-evaluaties).

Bottom line: mcp-proto-okn is geen “nieuw model”, maar wél een belangrijk signaal: de gereedschapslaag rondom assistants verschuift van losse scripts naar gestandaardiseerde protocollen. Wie nu MCP‑integraties bouwt voor interne data (kennisgrafieken, catalogi, registries) creëert een herbruikbare interface die mee kan groeien met de assistants van morgen — ongeacht welke modelversie er over zes maanden in je menu staat (en ja: versiewissels blijven komen; zie ook onze uitleg over de uitfasering van GPT-4.5 en o3).