Eerder verschenen in: GiSmagazine Augustus 2009
In het afgelopen decennium ben ik twee keer verhuisd. Eerst van Arnhem naar Amsterdam, om samen te gaan wonen. En een paar jaar geleden van Amsterdam naar Culemborg, naar een eerste koopwoning. Beide keren bleek de grootste uitdaging niet het inpakken, maar het ontspullen. Wat neem je mee, wat laat je achter?
De boekenkast moest het elke keer het meest ontgelden. Vanuit Arnhem ging maar een klein deel van de studieboeken mee. De readers waren gelezen, de kennis had zich – zo nam ik tenminste aan – in me verankerd. Weg ermee. De hardcovers mochten blijven. In Amsterdam waren het vooral de manuals. Een vuistdikke eerste editie van Pro Oracle Spatial. En daarnaast de tweede editie. Allebei bewaren? Nee, allebei weg.
Er is iets bevrijdends aan het weggooien van dingen waarvan je jarenlang dacht dat je ze nodig had. En het zette me aan het denken, want datzelfde gevoel ken ik ook van mijn werk.
In ons informatietijdperk is data het kapitaal van een organisatie. Als je het enorme aanbod beperkt tot geo-gerelateerde data, kun je je als organisatie snel rijk rekenen. Vectordata, cyclorama’s, luchtfoto’s, oblique luchfoto’s, Lidar-data, CAD-tekeningen en steeds meer 3D-data. Deze rijkdom is virtueel, vluchtig, niet tastbaar en onzichtbaar. We zien vaak alleen het afgeleide product van een fractie van de data: een kaart op een beeldscherm of een plot. Het meeste van de achter de kaart liggende data blijft onbekend.
Misschien is zelfs het ‘hebben’ van al die data niet helemaal efficiënt. Voor je het weet heb je een enorme berg geo-data in huis met veel dubbele opslag. De omvang neemt dan snel toe. Vectordata is vaak niet genormaliseerd en is redundant opgeslagen. Naast objectdata zijn er ook nog eens topologische datasets. Tegelijk met de uitgepakte bestanden staan ook de origineel gezipte bestanden nog op schijf. Om de beschikbaarheid van de data te garanderen worden databases in clusters geplaatst, en als alles goed gaat ’s nachts gebackupt. Kortom: een explosie aan data.
Natuurlijk kun je fantastische toepassingen bedenken en maken. Heel Nederland herscheppen als virtueel land en dan een fly-through over de uitgestrekte leegte van Noordoost-Groningen maken. De techniek staat het toe, dus waarom niet. Of het interessant en nuttig is, staat nog te bezien.
Niet alleen het aanbod is explosief gegroeid, ook de gedetailleerdheid van de data is enorm toegenomen. Denk aan polygonen van provincies en postcodegebieden die op de millimeter nauwkeurig zijn vastgelegd. Niet zo lang geleden kocht ik een dataset met onder meer een tabel met de zwaartepunten van 443 gemeenten. Toen ik de data goed bekeek, zag ik dat de data wel heel erg nauwkeurig waren, gemiddeld twaalf cijfers achter de komma. Ik moest het even opzoeken, maar 10⁻¹² is een picometer.
Fantastisch dat er software bestaat die met zulke kleine getallen kan werken, maar het is natuurlijk je reinste onzin om het zwaartepunt van een gemeente op een atoombreedte te bepalen. Onzinnige data leveren onzinnige informatie. Wist je bijvoorbeeld dat de afstand tussen Culemborg en Leerdam hemelsbreed 9,56919398683172 kilometer is?
Er zijn manieren om van deze non-informatie af te komen. Ik stel er twee voor. Inmiddels is er veel geo-materiaal beschikbaar via webservices, kaartlagen met vooral basisgegevens. Het vraagt maar een kleine mentale omslag om gebruik te maken van deze publiek beschikbare data: “Vertrouw erop dat andermans data net zo goed kunnen zijn als die van jezelf.”
Leuk, en zeker ook effectief, is het uitvoeren van een geo-garbage-scan. Welke data heb ik eigenlijk in huis, wat heb ik ermee gedaan, wat zijn het voor data? Zit er niet enorm veel ‘lucht’ in mijn data? Beschik ik niet over ontzettende nonsensdata? Moet ik niet gewoon data weggooien? Hup weg ermee, in de garbage can!
GiSmagazine Augustus 2009
