Federatieve datasystemen en semantische interoperabiliteit

Dienst

Data centraliseren lijkt de eenvoudigste oplossing — totdat je ziet hoeveel het kost aan beheer, governance en eigenaarschapsvraagstukken. Een federatieve aanpak laat bronnen op hun plek, maar maakt ze samen bevraagbaar.

Federatieve datasystemen zijn systemen waarbij data niet wordt samengevoegd in één centrale database, maar waarbij verschillende databronnen via gestandaardiseerde interfaces met elkaar worden verbonden. Elke bron blijft bij de eigenaar. De informatie is toch als één geheel te bevragen.

Dat klinkt eenvoudig, maar het vereist meer dan technische koppelingen. Systemen moeten elkaars data begrijpen — niet alleen syntactisch (hetzelfde formaat), maar semantisch (dezelfde betekenis). Een ‘meetlocatie’ in het ene systeem moet hetzelfde zijn als een ‘meetpunt’ in het andere, of de relatie daartussen moet expliciet zijn vastgelegd. Dat is de kern van semantische interoperabiliteit, en het is precies waar veel federatieve projecten stranden.

Wat valt hieronder?

  • Ontwerp van federatieve data-architecturen op basis van Linked Data-principes
  • Opzetten van SPARQL-endpoints en gestandaardiseerde REST API’s voor data-ontsluiting
  • Semantische mapping tussen verschillende systemen, modellen en vocabulaires
  • Implementatie van triple stores en RDF-gebaseerde datastores
  • Validatie van data-kwaliteit en -consistentie bij federatieve bevragingen
  • Begeleiding bij het inrichten van governance voor gedeelde data-infrastructuren

Wanneer is dit relevant?

Deze aanpak past goed bij samenwerkingsverbanden tussen organisaties die elk hun eigen systemen beheren maar gezamenlijk behoefte hebben aan geïntegreerd inzicht. Ook bij overheidsorganisaties die willen voldoen aan FAIR-principes zonder bestaande systemen te vervangen, en bij projecten waarbij data uit GIS-systemen, registraties en kennisbanken samen bevraagbaar moet zijn.

Een concreet voorbeeld

In de watersector werk ik aan situaties waarbij informatie over waterobjecten, meetlocaties, normen en begrippen afkomstig is uit verschillende bronnen — beheerd door verschillende organisaties. Via semantische mapping en een gedeeld SPARQL-endpoint zijn die bronnen samen bevraagbaar, zonder dat iemand eigenaarschap hoeft op te geven.Federatief werken betekent: iedereen behoudt de controle over zijn eigen data, maar samen creëren jullie iets wat niemand alleen kan bieden.