Recht doen aan geografische heterogeniteit

Cover Sturen op statistieken In Monique Biemans et al. (red.), Sturen op statistieken. Visies uit de samenleving. CBS, 2004. ISBN 90-35726-28-6. pp. 34 – 35.

Het Centraal Bureau voor de Statistiek is vooral sterk in nationale statistieken. Het Statistisch Zakboek, dat inmiddels in bijna geen enkele zak meer past, biedt hiervan een fraaie staalkaart. De online database StatLine bevat landelijke gegevens over tienduizenden onderwerpen. Natuurlijk kan er altijd meer bij, maar mijn prioriteit zou elders liggen.

De schat aan data in StatLine doet onvoldoende recht aan de heterogeniteit van Nederland. Op het niveau van gemeenten is er nog veel te vinden, maar wie verder wil inzoomen wil tast in het duister. ‘Buurt in Beeld’ bevat zeer beperkte gegevens op binnengemeentelijk niveau. Het is te weinig, niet gedetailleerd genoeg, en het gebrek aan continuïteit is storend.

Over buurten zijn uitsluitend enkele zeer grove geografische en demografische gegevens beschikbaar, alsmede enkele gegevens over inkomens, WOZ-waarden en over bedrijfsvestigingen – de laatste slechts in schaalwaarden en percentages. In totaal gaat het om, afhankelijk van het jaar, zeventien tot veertig onderwerpen. Ter vergelijking: het Statistisch Bestand Gemeenten bevat gegevens over duizenden onderwerpen. Dit terwijl de grootste buurten meer dan 20.000 inwoners hebben – net zo groot als een middelgrote gemeente – en veertig procent van alle buurten meer inwoners heeft dan de kleinste gemeente.

Op zijn minst zouden er gedetailleerdere gegevens moeten komen over etniciteit, leeftijd, gezondheid (doodsoorzaken bijvoorbeeld), woningen (nieuwbouw, sloop, bouwjaar, huur/koop, type), verhuizingen, criminaliteit, werkgelegenheid, bedrijvigheid, voorzieningenniveau (huisartsen, tandartsen, apotheken, scholen, kinderopvang, banken, winkels per branche, postkantoren), milieu, bodemgebruik, inkomens, vermogens, autobezit (merk, ouderdom). Een groot deel van deze gegevens is reeds in officiële registraties aanwezig, dus in beginsel relatief gemakkelijk te leveren aan het CBS en te ontsluiten.

Hierbij moet de overdreven huiver voor privacyschending maar eens opzij worden gezet. Met de onthulling dat er in een bepaalde buurt drie personen zijn met Afghanistan als geboorteland of vijftien met een inkomen beneden de 15.000 euro is niemands persoonlijke levenssfeer aangetast. Men kan immers de gegevens niet tot op individueel niveau herleiden, en dus niet vaststellen dat twee van de drie Afghanen in kwestie in die inkomenscategorie vallen.

Buurten vormen tot dusverre het meest gedetailleerde niveau waarop gegevens beschikbaar worden gesteld, hoe weinig ook. Dit doet eveneens geen recht aan de geografische heterogeniteit van Nederland. Sommige buurten zijn gewoon te groot. Om bijvoorbeeld onderzoek te kunnen doen naar segregatie (naar etniciteit of inkomen) zijn eenheden van duizenden inwoners veel te grof. Vergelijk dit eens met de mate van detail waarin het US Census Bureau zijn gegevens beschikbaar stelt: veel is tot op block-niveau openbaar, met typisch hooguit enkele honderden inwoners. Evenaring van het detailniveau van de census lijkt me een mooi streven voor het CBS. In de praktijk beschikken veel grote bedrijven al over zulke gedetailleerde gegevens. Deze zijn echter afkomstig uit marktonderzoek, dus handelswaar en voor de burger onbereikbaar en onbetaalbaar.

Buurten zijn zoals gezegd te ongelijk van grootte. Een nieuwe geografische verdeling is daarom gewenst. Postcodegebieden worden in de praktijk breed gebruikt, maar deze hebben als nadeel dat de indeling particulier bezit is. De overheid zou een eigen fijnmazige indeling van Nederland moeten hanteren, vergelijkbaar met de blocks van het Census Bureau. Het postcodestelsel nationaliseren is overigens ook een optie.

Enige continuïteit in die geografische verdeling is wel wenselijk. Van sommige onderwerpen biedt de website van het CBS prachtige tijdreeksen, soms zelfs vanaf 1899. Op landelijk niveau kan men met deze reeksen goed uit de voeten, op niveau van provincie en coropgebied soms ook wel, maar bij gemeenten is het een stuk lastiger. Door het voortdurende proces van herindeling is gemeente X in jaar 1 niet dezelfde als gemeente X in jaar 2, als die überhaupt nog bestaat. Zolang het uitsluitend gaat om samenvoegingen kan de gebruiker nog pogen zelf de tijdreeks te reconstrueren. Maar indien een gemeente is verdeeld tussen twee andere houdt het op. Omdat er geen gegevens op gedetailleerder niveau zijn, valt er niets meer te reconstrueren. Hetzelfde probleem speelt bij buurten. En waar bij gemeenten het herindelingsproces tenminste nog goed is gedocumenteerd is dit bij buurten nauwelijks het geval.

Het eerste wat je leert bij statistiek zijn gemiddelden uitrekenen. Hoe nuttig dat ook is, het is jammer dat het CBS nog te veel een Centraal Bureau voor de Gemiddelden is. Dit ontneemt het zicht op de enorme variatie binnen Nederland.

Dick van Eijk

Gedachten over journalistiek en samenleving

Recht doen aan geografische heterogeniteit