Vernieuwde versie van het Nederlab portaal

Vanaf vandaag is een verbeterde versie van onze preview-release van het Nederlabportaal  rechtstreeks toegankelijk via http://www.nederlab.nl/onderzoeksportaal. De afgelopen maanden is gebleken, dat deze versie stabiel is, en zodanig veel meer functionaliteit biedt dan het oude onderzoeksportaal, dat deze laatste overbodig is geworden.

We zullen nog enkele weken met hoge frequentie verbeteringen doorvoeren, die we graag zo snel mogelijk aan gebruikers willen aanbieden, daarom handhaven we nog enige tijd de preview-status.

De belangrijkste toegevoegde functies sinds 15 juli zijn: groeperen van CQL zoekresultaten, een viewer voor geannoteerde teksten, nieuwe visualisaties (tijdverdelingen, woordtrends, alles nu ook exporteerbaar als plaatje of data), zoeken binnen door gebruikers gedefinieerde onderzoekscorpora en query-expansie met behulp van het historisch lexicon van ivdNt (in combinatie met CQL).

Daarnaast hebben we verbeteringen aan de gebruikers-interface doorgevoerd en zoekperformance aanzienlijk verbeterd.

Inmiddels bieden we 5 broncollecties aan, waaronder alle in het oude portaal beschikbare.

Preview release van vernieuwde Nederlab

Een nieuwe preview-versie van Nederlab is beschikbaar via http://www.nederlab.nl/onderzoeksportaal-v2-preview. Deze preview omvat de mogelijkheid om verschillende annotatielagen te doorzoeken en biedt een aantal nieuwe analyse-overzichten over de resultaten van uw corpus.  We maken deze preview-versie op dit moment beschikbaar op basis van één collectie om u uit te nodigen uw ideeën, suggesties of wensen met ons te delen.


In september zal de volledige set van Nederlab collecties beschikbaar komen en daarna verder worden uitgebreid. De huidige preview-versie dient mede ter ondersteuning van de uitstaande call voor wetenschappelijke projecten.

Nieuw in Nederlab: zoeken op basis van Corpus Query Language (CQL) over meerdere annotatielagen, waaronder subfeatures van part-of-speech annotaties en named entities; een instelbare keyword-in-context viewer, groeperen van zoekresultaten op basis van metadata criteria, vernieuwde visualisaties, statistieken over hits en documenten, frequentie-lijsten voor woorden, lemma’s, part of speech tags en named entities.
Bij gebruik kunt u langere wachttijden ervaren voor uw zoekopdrachten. Voor functies waar wij verwachten dat langere zoektijden op kunnen treden hebben we dat zo goed mogelijk aangegeven. Mocht u hiermee problemen ervaren of overige vragen of suggesties hebben, dan kunt u terecht bij hennie.brugman@meertens.knaw.nl.

 

Call voor onderzoekspilots binnen Nederlab

De infrastructuur van Nederlab is nu zo ver gebouwd dat getest kan worden wat de waarde ervan is voor wetenschappelijk onderzoek. Onderzoekers worden uitgenodigd een projectvoorstel te doen voor het beantwoorden van een concrete onderzoeksvraag die kan gelden als testcase voor de infrastructuur, data en tools van Nederlab. De volledige call is hier te vinden.

Voorstellen kunnen alleen worden ingediend door onderzoekers van organisaties die in aanmerking komen voor NWO-financiering. Deadline voor het indienen van voorstellen is 1 september 2016, 13:00 uur, bij Nicoline van der Sijs. Het onderzoek dient uiterlijk 1 januari 2017 te starten en moet uiterlijk 1 augustus 2017 zijn afgerond.

Meer informatie vindt u op de Open Call pagina van deze website.

Nieuwe versie onderzoeksportaal

Op 3 maart is een nieuwe release van het onderzoeksportaal online gezet. In deze nieuwe versie is een Nederlab-specifiek genresysteem toegevoegd, samengesteld in samenwerking met de redactie. De genres van de broncollecties zijn zo accuraat mogelijk gemapt op deze Nederlab-genres. Ook is in de gebruikersinterface functionaliteit toegevoegd aan het ‘zoeken op woordvarianten’: het is nu ook mogelijk groepen woordvarianten te (de)selecteren op basis van woordsoort.

Nederlab naar LREC 2016

Het abstract Nederlab: Towards a single portal and research environment for diachronic Dutch text corpora (door Hennie Brugman, Martin Reynaert e.a.) is geaccepteerd voor de 10de editie van de LREC conferentie die van 23-28 mei in Portorož in Slovenië wordt gehouden. De Language Resources and Evaluation Conference (LREC) wordt georganiseerd door The European Language Resources Association.

Het abstract van Nederlab is hier te vinden.

Nieuwe versie onderzoeksportaal

Vanaf 3 september is een nieuwe versie van het Nederlab-onderzoeksportaal beschikbaar, met een aantal zichtbare en minder zichtbare verbeteringen en uitbreidingen. De zoekprestaties zijn verbeterd en er er zijn vorderingen gemaakt in het optimaliseren van de gebruikersinterface.

Verder zijn de tijdverdelingsgrafieken overal naar eigen inzicht te configureren (bijvoorbeeld het type grafiek, het tijdvak en de intervalgrootte kunnen worden aangepast) en zijn de betreffende gegevens te exporteren. Wat de beschikbare collecties betreft: de DBNL-collectie is bijgewerkt en bevat nu meer tekstdocumenten.

Bij het zoeken in metadata kan nu onderscheid worden gemaakt tussen verschillende rollen van personen (auteur, illustrator, uitgever en dergelijke), waardoor meer specialistische selecties kunnen worden gemaakt.

Gebruik van teksten en auteursrechtelijke restricties

Voor de collecties die Nederlab op dit ogenblik bevat, en in de toekomst nog zal gaan opnemen, gelden in veel gevallen specifieke voorwaarden voor het gebruik en hergebruik van teksten en metadata, dat betreft met name auteursrechtelijke restricties. Klik hier voor een overzicht van de gebruiksvoorwaarden per collectie.

Verbeterde presentatie zoekresultaten: keyword in context

Een nieuwe versie van het onderzoeksportaal is online geplaatst. Naast een aantal verbeteringen aan werking en vormgeving zijn er enkele functionele uitbreidingen beschikbaar gekomen. De belangrijkste: zoekresultaten zijn nu niet alleen als documentlijsten en als tijdverdeling te zien, maar ook als ‘keyword-in-context- concordantie’ (kwic).

Bij openen van een document verschijnt nu een verbeterde document-pagina. Voor zover beschikbaar worden nu tekst-inhoud, automatische gecorrigeerde tekst en het originele, gescande, document naast elkaar getoond. Die scans worden zichtbaar gemaakt door middel van inbedden van delen van de websites van de aanleverende organisatie

Nieuwe teksten in Nederlab

Het aantal teksten in Nederlab is aanzienlijk uitgebreid: de krantencollectie van de Koninklijke Bibliotheek is nu opgenomen tot aan het jaar 1900. Ook van de Digitale Bibliotheek voor de Nederlandse Letteren zijn nieuwe teksten beschikbaar gekomen. Nederlab bevat momenteel 18 295 boeken, ruim 2000 jaargangen van kranten en tijdschriften met in totaal 12 944 978 artikelen. De omvang van Nederlab is daarmee sinds het online gaan in maart meer dan verdrievoudigd

Lancering Nederlab

Op 13 maart wordt de beta-versie van Nederlab gelanceerd door Antal van den Bosch, leider van de toolstrack van Nederlab en hoogleraar Example-based language modelling. De lancering vindt plaats tijdens de kick-off van CLARIAH bij Beeld en Geluid in Hilversum; zie: http://www.clariah.nl/activiteiten/clariah-kick-off. Nederlab was een van de zaaigeldprojecten van CLARIAH.