Nieuwe teksten in Nederlab

Het aantal teksten in Nederlab is aanzienlijk uitgebreid: de krantencollectie van de Koninklijke Bibliotheek is nu opgenomen tot aan het jaar 1900. Ook van de Digitale Bibliotheek voor de Nederlandse Letteren zijn nieuwe teksten beschikbaar gekomen. Nederlab bevat momenteel 18 295 boeken, ruim 2000 jaargangen van kranten en tijdschriften met in totaal 12 944 978 artikelen. De omvang van Nederlab is daarmee sinds het online gaan in maart meer dan verdrievoudigd

Lancering Nederlab

Op 13 maart wordt de beta-versie van Nederlab gelanceerd door Antal van den Bosch, leider van de toolstrack van Nederlab en hoogleraar Example-based language modelling. De lancering vindt plaats tijdens de kick-off van CLARIAH bij Beeld en Geluid in Hilversum; zie: http://www.clariah.nl/activiteiten/clariah-kick-off. Nederlab was een van de zaaigeldprojecten van CLARIAH.

Krantensymposium

Namens Nederlab houdt Martin Reynaert een presentatie tijdens het Symposium ‘Digitale historische kranten als big data’ dat de Koninklijke Bibliotheek organiseert op 24 maart, zie: http://www.kb.nl/nieuws/2015/symposium-digitale-historische-kranten-als-big-data. Martin Reynaert heeft het programma TICCL (Text-Induced Corpus Clean-up) ontwikkeld, waarmee fouten in door de computer gelezen teksten automatisch worden gecorrigeerd: zo wordt fchaap verbeterd in schaap. Een deel van de automatisch gelezen teksten die via Nederlab beschikbaar gesteld worden, zijn met TICCL verbeterd.

DHBenelux conference

Op 8 en 9 juni 2015 vindt de tweede bijeenkomst plaats van DHBenelux (Digital Humanities Benelux). Dit jaar wordt de bijeenkomst georganiseerd in Antwerpen. Voor meer informatie zie: http://dhbenelux.org/. Nederlab is via Nederlab-coördinator Nicoline van der Sijs vertegenwoordigd in het programmacomité.