Top Banner
Alles uit de kast Auteur: Masja de Ree Fotografie: Sjoerd van der Hucht Historische collectie CBS gaat online De bibliotheek van het CBS heeft een unieke collectie historische statistische documenten, die vaak geraadpleegd worden. Deze collectie wordt nu digitaal toegankelijk gemaakt voor een breed publiek. De eerste publicaties staan inmiddels online op de nieuwe site www.cbs.nl/historisch. D e historische collectie van de bibliotheek van het CBS bestaat uit zo’n vijf miljoen hand- geschreven en gedrukte pagina’s met statis- tische tabellen en bijbehorende toelichtingen, afkomstig van het CBS en haar voorgangers. Al deze docu- menten worden stapsgewijs gedigitaliseerd en beschik- baar gesteld via www.cbs.nl/historisch. ‘Dat is een meer- jarenproject’, vertelt coördinator Margriet van Stiphout. Op de CBS-website staan nu vier series: de Statistieken voor Internationale Handel (1846-1987), de Maandstatistiek van de Bevolking (1953-1999), het Statistisch Jaarboek (1990-2006) en het Statistical Yearbook (1969-2006). De historische volkstellingen staan al sinds 2006 online op een andere website: www.volkstellingen.nl. ‘Onze kern- taak is het behouden en beschikbaar stellen van de hele CBS-collectie’, zegt teammanager Don Weijers. ‘Het digi- taliseren van de historische collectie hoort daarbij. Het is één van de grotere projecten van de bibliotheek en het heeft al een lange geschiedenis. In 1996 is de bibliotheek begonnen met het eerste digitaliseringsproject, de volkstellingen’. uNiek MAteriAAl Het doel van de digitalisering is drieledig. Ten eerste is het een manier om de collectie te conserveren: wat digi- taal geraadpleegd wordt, kan niet kapot gaan of kwijt- raken. Ten tweede wil de bibliotheek de collectie graag toegankelijk maken voor een groter publiek. Senior informatiespecialist Henk Laloli: ‘Onderzoekers van de universiteit zijn erg geïnteresseerd in onze collectie. Ook intern is er veel vraag naar, vooral om tijdreeksen te maken. De informatie op StatLine begint rond 1990. Met behulp van onze materialen kunnen bijvoorbeeld demo- grafen statistieken ‘terugleggen’ tot honderdvijftig jaar geleden.’ Van Stiphout: ‘De CBS-collectie staat hier com- pleet bij elkaar en wordt niet meer uitgeleend. Onder- zoekers komen nu nog vanuit het hele land en soms uit het buitenland naar het CBS om een document te CBS-project lente 2013 37
3

Historische collectie 2013 01-lente-relatiemagazine-pub

Jul 10, 2015

Download

Science

De bibliotheek van het CBS heeft een unieke collectie
historische statistische documenten, die vaak geraadpleegd worden. Deze collectie wordt nu digitaal toegankelijk gemaakt voor een breed publiek. De eerste publicaties staan inmiddels
online op de nieuwe site www.cbs.nl/historisch.
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Historische collectie 2013 01-lente-relatiemagazine-pub

Alles uit de kastAuteur: Masja de Ree Fotografie: Sjoerd van der Hucht

Historische collectie CBS gaat online

De bibliotheek van het CBS heeft een unieke collectie historische statistische documenten, die vaak geraadpleegd worden. Deze collectie wordt nu digitaal toegankelijk gemaakt voor een breed publiek. De eerste publicaties staan inmiddels online op de nieuwe site www.cbs.nl/historisch.

de historische collectie van de bibliotheek van het CBS bestaat uit zo’n vijf miljoen hand­geschreven en gedrukte pagina’s met statis­tische tabellen en bijbehorende toelichtingen,

afkomstig van het CBS en haar voorgangers. Al deze docu­menten worden stapsgewijs gedigitaliseerd en beschik­baar gesteld via www.cbs.nl/historisch. ‘Dat is een meer­jarenproject’, vertelt coördinator Margriet van Stiphout. Op de CBS­website staan nu vier series: de Statistieken voor Internationale Handel (1846­1987), de Maandstatistiek

van de Bevolking (1953­1999), het Statistisch Jaarboek (1990­2006) en het Statistical Yearbook (1969­2006). De historische volkstellingen staan al sinds 2006 online op een andere website: www.volkstellingen.nl. ‘Onze kern­taak is het behouden en beschikbaar stellen van de hele CBS­collectie’, zegt teammanager Don Weijers. ‘Het digi­taliseren van de historische collectie hoort daarbij. Het is één van de grotere projecten van de bibliotheek en het heeft al een lange geschiedenis. In 1996 is de bibliotheek begonnen met het eerste digitaliseringsproject, de volkstellingen’.

uNiek MAteriAAlHet doel van de digitalisering is drieledig. Ten eerste is het een manier om de collectie te conserveren: wat digi­taal geraadpleegd wordt, kan niet kapot gaan of kwijt­raken. Ten tweede wil de bibliotheek de collectie graag toegankelijk maken voor een groter publiek. Senior informatiespecialist Henk Laloli: ‘Onderzoekers van de universiteit zijn erg geïnteresseerd in onze collectie. Ook intern is er veel vraag naar, vooral om tijdreeksen te maken. De informatie op StatLine begint rond 1990. Met behulp van onze materialen kunnen bijvoorbeeld demo­grafen statistieken ‘terugleggen’ tot honderdvijftig jaar geleden.’ Van Stiphout: ‘De CBS­collectie staat hier com­pleet bij elkaar en wordt niet meer uitgeleend. Onder­zoekers komen nu nog vanuit het hele land en soms uit het buitenland naar het CBS om een document te

CBS-project

lente 2013 37

Page 2: Historische collectie 2013 01-lente-relatiemagazine-pub

bekijken, te kopiëren of te scannen. Als zij de documenten via internet op hun eigen werkplek kunnen inzien, scheelt dat natuurlijk veel tijd en kosten. Bovendien kunnen ze de tabellen dan gemakkelijker overnemen.’ Een laatste reden voor de digitalisering is dat de Europese statistische bureaus ernaar streven hun informatie onderling een­voudiger uitwisselbaar te maken. Weijers: ‘Als alles online staat, hoeven we niet meer alle uitgaven van onze collega­bureaus in het archief te bewaren.’

uitklAPVelVijf miljoen pagina’s digitaliseren, hoe pak je dat aan? Informatiespecialist Alfred Moest is intensief betrokken bij de voorbereiding. ‘We doen het per onderwerp. Neem bijvoorbeeld de Juridische Statistieken van 1847 tot 2000. Ik pak dan alles wat bij dat onderwerp hoort uit de kast, want je weet van te voren niet welke vragen de onder­zoekers die de gegevens gebruiken zichzelf stellen. Dan bekijk ik hoe het boek in elkaar zit: staan de tabellen over één of twee pagina’s, zitten er uitklapvellen in, is de tekst horizontaal of verticaal gedrukt, etc.?’ Een extern bedrijf verzorgt de digitalisering. Van Stiphout: ‘Wij leveren het materiaal aan in pakketten van tienduizen den pagina’s, mét onze aanwijzingen erbij. De scans contro leren we vervolgens steekproefsgewijs op kwaliteit, onder andere op scherpte, kleur, vouwtjes, volgorde en volledigheid.’ Als dat gebeurd is, bewerkt het automatiserings bedrijf de bestanden met OCR­software (optische tekenherkenning).

Die software maakt van de scan een bestand dat niet alleen weinig ruimte in beslag neemt, maar dat ook te bewerken is met de tekstverwerker. ‘Dat lukt niet altijd optimaal, zeker niet met handgeschreven documenten’, zegt Laloli. Het kwaliteitsaspect is tot nu toe de lastigste hobbel die genomen moet worden. Bij de OCR­bestanden zit een toepassing die de tabellen vindbaar maakt op tabeltitel en een inhoudsopgave met paginanummers. ‘Deze metadata zijn nodig om de documenten goed toegankelijk te maken.’ Als ook dat gecontroleerd en in orde is, zijn de documenten klaar om online te gaan. Van Stiphout: ‘Maar zo’n traject duurt maanden tot een jaar. Tussentijds kunnen CBS’ers het materiaal al wel raadplegen via Kennislink op intranet.’

VolkStelliNGeNDe historische collectie van het CBS bevat documenten van het CBS én zijn voorgangers. De volkstellingen vallen onder de meest geraadpleegde historische bronnen van Nederland. De oudste publicatie in dit genre is de volks­telling uit 1795. ‘Die telling werd gehouden voor de eerste algemene verkiezingen’, vertelt Laloli. Het CBS is opgericht in 1899, maar vanaf het begin van de negen­tiende eeuw werden door de overheid statistieken gemaakt. Dit werd gedaan door verschillende commis­sies. Laloli: ‘Er was wel regie, maar die was nog niet zo strak. De aanpak verschilde dan ook per commissie.’ Tot 1932 viel het CBS onder het ministerie van Binnenlandse

diverse onderzoekenDe data uit de historische collectie van het CBS worden voor onderzoeken over uiteenlopende onderwerpen gebruikt, zowel op het gebied van bedrijven als bevolking. Soms gaat het om zeer specialistische studies. Amnon Sonnenberg van het Portland Medical Centre gebruikte de Nederlandse historische statistieken van doodsoorzaken (die overigens nog niet digitaal beschikbaar zijn), bijvoorbeeld voor zijn onderzoek naar de afname van sterfte ten gevolge van darmkanker. Ook bij het CBS zelf wordt de collectie veel-vuldig ingezet. Zo maakte CBS’er Ronald van der Bie met behulp van oude maandstatistieken van het CBS een ‘conjunctuurklok’ voor het interbellum (1922-1938). Daarmee kon heel goed de crisis in 1929 en 1930 in beeld gebracht worden en de lange duur van de depressie. Het dieptepunt was al in het najaar van 1932 bereikt en de economie begon vanaf dat moment langzaam op te krabbelen, maar in het voorjaar van 1934 viel de economie opnieuw terug. Pas diep in 1936 trok de economie definitief aan. Onderzoeken als deze kunnen alleen worden uit-gevoerd dankzij de historische collecties van het CBS.

38 cbs 01/13

Page 3: Historische collectie 2013 01-lente-relatiemagazine-pub

Zaken, daarna onder het ministerie van Economische Zaken. Laloli: ‘Het ministerie van Binnenlandse Zaken heeft de zaken heel goed overgedragen, ook de documenten uit de tijd dat het CBS nog niet bestond. Daardoor hebben wij nu een heel complete collectie.’

SubSidieBij het zeer arbeidsintensieve digitaliseringstraject maakt de bibliotheek onder meer dankbaar gebruik van de 50­plus poule van het CBS in Heerlen en Den Haag. Daarmee krijgen 50­plussers binnen het CBS de kans tijdelijk van baan te wisselen. Weijers: ‘Wij zijn blij dat we hen soms voor een aantal maanden kunnen ‘lenen’ van andere organisatieonderdelen voor bijvoorbeeld de controle­werkzaamheden.’ Het CBS betaalt overigens niet alle kosten zelf. De Koninklijke Bibliotheek verstrekt onder auspiciën van het project Metamorfoze subsidies om cultureel erfgoed uit de periode 1840 tot 1950 te digi­taliseren. Moest: ‘In die periode werd slecht, goedkoop papier gebruikt in combinatie met vrij agressieve inkt. Daardoor is het materiaal nu aan verval onderhevig. Een voorwaarde voor de subsidie is dat we de originelen niet meer gebruiken.’ Aan het eind van het project moet de gehele CBS­collectie online staan en voor iedereen beschikbaar zijn. De online collectie zal in de toekomst ook bewaard worden in het E­depot van de Koninklijke Bibliotheek. Laloli: ‘Ook digitale bestanden hebben niet het eeuwige leven. De Koninklijke Bibliotheek doet

echter veel onderzoek naar digitale duurzaamheid.’ En als het klaar is? ‘De techniek gaat steeds verder’, zegt Laloli. ‘Er lopen nu verschillende onderzoeken naar de mogelijkheden om de data van bijvoorbeeld de volks­tellingen als zogenoemde open en linked databestanden aan te bieden. Dat zou betekenen dat geïnteresseerden niet meer alleen de tabellen kunnen raadplegen, maar ook de afzonderlijke data kunnen gebruiken. Dat biedt nog meer mogelijkheden voor onderzoekers en andere gebruikers van CBS­data.’

Voor vragen over de historische collectie kunt u contact opnemen met www.cbs.nl/infoservice.

wat kan ik doen op www.cbs.nl/historisch?– Publicaties doorzoeken in de volledige tekst– Zoeken op tabeltitels – Inhoudsopgaven en registers oproepen – Een afbeelding per bladzijde downloaden – Tekst downloaden als csv-bestand

(dit onderdeel is nog experimenteel)

welke publicaties zijn online beschikbaar?– De Internationale Handelsstatistieken 1846-1987– De Maandstatistiek van de bevolking 1953-1999– Het Statistisch Jaarboek 1990-2006– Het Statistical Yearbook 1969-2006

In de komende maanden worden toegevoegd:– Het Statistisch Zakboek 1899-1988– De Jaarcijfers van het Koninkrijk der Nederlanden 1881-1968– De historische voorlopers: 19e eeuwse statistische publicaties– De Nationale rekeningen 1950-2001– De Onderwijsstatistieken 1930-2002: diverse publicaties– De Juridische statistieken 1950-2000– De Milieustatistieken 1970-2002– De Bevolking der gemeenten van Nederland 1920-2000– De statistiek van de Nederlandse energiehuishouding 1949-1976– Het Conjunctuurbericht 1985-1997– Het Maandschrift van het Centraal Bureau voor de Statistiek 1950 tot heden

CBS-project

lente 2013 39