Collocaties

Help > Hulp bij Zoeken > Corpus gebruiken > Collocaties

In dit gedeelte kun je het corpus doorzoeken naar collocaties.

Een voorbeeld: “Welke werkwoorden gaan samen met het enkelvoud of meervoud van wacht?”
Hierin is wacht het uitgangspunt en de categorie werkwoorden is de collocatie die gezocht wordt.

Uitgangspunt
Het zoeken begint vanaf het uitgangspunt; in dit geval vanaf wacht. Manieren om het uitgangspunt te specificeren:

  • woord – geef alleen het woord wacht als uitgangspunt op, of definieer daarnaast ook de woordsoort N.
  • lemma – geef het lemmal wacht op (met eventueel nog de woordsoort N om ambiguïteit met het werkwoord uit te sluiten) waardoor gezocht wordt naar alle verbogen vormen die bij dit lemma horen.
  • woordsoort – het is ook mogelijk om alléén uit te gaan van een woordsoort, bijvoorbeeld N, maar dan wordt er dus niet meer gekeken naar het woord.
  • CQL – het uitgangspunt kan (door de gevorderde gebruiker) ook zelf gedefinieerd worden in CQL.

Collocatie
In de buurt (zie ‘bereik’) van het uitgangspunt wordt gezocht naar een woord en/of woordsoort: de collocatie. De manieren om deze collocatie te specificeren zijn bijna gelijk aan de specificatie van het uitgangspunt. Zie hierboven.

Om, bijvoorbeeld, naar werkwoorden te zoeken die colloceren met wacht, kan voor de collocatie woordsoort WW worden gekozen. Eventueel kan die woordsoort nog verder worden gespecificeerd (zo kan bijvoorbeeld aan worden gegeven dat het om een persoonsvorm gaat door het kenmerk (feature) wvorm als pv in te stellen.

Bereik
Het bereik waarbinnen naar een collocatie met het uitgangspunt gezocht wordt kan op verschillende manieren gespecificeerd worden:

  • woorden in een zin – het aantal woorden, gerekend vanaf het uitgangspunt, voor en/of na de gezochte collocatie, maar alleen wanneer de woorden in dezelfde zin zitten.
  • woorden voor en na – het aantal woorden, gerekend vanaf het uitgangspunt, voor en/of na de gezochte collocatie.
  • hele zin – de gezochte collocatie moet voorkomen in dezelfde zin als het uitgangspunt.
  • paragraaf – de gezochte collocatie mag ergens voorkomen in de paragraaf waar het uitgangspunt zich bevindt.
  • entiteit – de collocatie bevindt zich in een ‘named entity’ (een locatie, bedrijfsnaam, persoonsnaam, etc.).

Resultaten
Het verkrijgen van de resultaten kan even duren, zeker als het corpus erg groot is of de zoekopdracht teveel hits heeft. De resultaten worden gepresenteerd in een tabel, gesorteerd op frequentie en het aantal documenten waarin de gevonden collocaties voorkomen. Uiteraard is ook deze tabel te exporteren als CSV.