Inleiding

Via Nederlab kunnen onderzoekers en studenten grote aantallen gedigitaliseerde Nederlandstalige teksten van ca. 800 tot heden gezamenlijk doorzoeken en analyseren met binnen Nederlab ontwikkelde, gebruiksvriendelijke tekstanalysesoftware. Zo biedt Nederlab een laboratorium voor onderzoek naar de veranderingspatronen in de Nederlandse taal en cultuur.

Stel bijvoorbeeld dat je wilt onderzoeken hoe snel het werk van de Engelse schrijver en dichter Lord Byron in de Lage Landen bekend is geraakt en hoe vaak er in de 19e eeuw naar hem wordt verwezen. En je wilt dat bijvoorbeeld vergelijken met de populariteit van zijn Russische tijdgenoot en collega Aleksandr Poesjkin. Dit lijkt een probleem dat met behulp van de grote hoeveelheid teksten die momenteel zijn gedigitaliseerd, gemakkelijk kan worden opgelost: je kijkt hoe vaak deze twee schrijvers in 19e-eeuwse fictie en nonfictie worden genoemd, en je vergelijkt de gevonden resultaten met elkaar. Helaas is een dergelijk eenvoudig en basaal onderzoek in de praktijk nog niet haalbaar. Het is namelijk niet mogelijk een totaalbeeld te krijgen van het aantal keren dat Byron en Poesjkin in de 19e eeuw worden genoemd: je kunt iedere tekstcollectie slechts apart via de websites van verschillende instellingen raadplegen, zoals Koninklijke Bibliotheek, universiteitsbibliotheken, DBNL, Huygens ING, INL, Meertens Instituut. Je kunt de gevonden zoekresultaten niet bij elkaar optellen omdat veel gedigitaliseerde werken op meerdere websites beschikbaar gesteld zijn, zodat het bij elkaar optellen een vertekend beeld geeft. Bovendien bieden niet alle websites de mogelijkheid de gegevens chronologisch te ordenen, en maken de meeste websites geen verschil in tekstsoort, zoals fictie en non-fictie. Aan dit soort problemen wil Nederlab een einde maken.