Standaardtaal

26-11-2019


Digitale taalbronnen

Het Nederlands beschikt over vele digitale taalbronnen. Dat zijn corpora van gesproken en geschreven taal, digitale woordenlijsten en woordenboeken, lexica, frequentielijsten, databases en terminologieverzamelingen. Deze digitale taalbronnen zijn open beschikbaar voor onderzoek, onderwijs en ontwikkeling.

Digitale taalinfrastructuur

De Taalunie draagt bij aan de totstandkoming van veel digitale taalbronnen voor het Nederlands. Bijvoorbeeld door financiële ondersteuning te bieden of door samen te werken met het Instituut voor de Nederlandse Taal (INT), andere partners, onderzoekers, professionals en bedrijven. Daarbij wordt bekeken hoe de beschikbare infrastructuur ingezet kan worden in relevante domeinen zoals onderwijs en zorg, en of er uitbreidingen noodzakelijk zijn. De Taalunie stimuleert onderzoekers, bedrijven en organisaties om de taalbronnen ook daadwerkelijk te gebruiken in allerlei toepassingen voor het Nederlands. Daarnaast geeft ze advies over de inzet en verdere ontwikkeling van de digitale taalinfrastructuur.

Recente trajecten

Voorbeelden van recente trajecten zijn:

  • Haalbaarheidsstudie naar de mogelijkheden van het gebruik van digitale materialen voor het NVT-onderwijs.
  • Mogelijkheden verkennen van het inzetten van digitale materialen voor mensen met een visuele beperking, samen met de Braille Autoriteit en NOTaS
  • Onderzoek naar de mogelijkheden op het gebied van automatische conversie van gebarentaal naar schrift en spraak.

Instituut voor de Nederlandse Taal

De taalbronnen zijn toegankelijk via het Instituut voor de Nederlandse Taal (INT). Het INT speelt in het Nederlands taalgebied een centrale rol in het wetenschappelijk verantwoord ontwikkelen, bewaren en duurzaam beschikbaar stellen van digitale taalmaterialen voor het Nederlands.

Verzameling digitale taalbronnen

De taalbronnen voor taalkundig onderzoek en taal- en spraaktechnologie (TST) zijn ondergebracht bij het Instituut voor de Nederlandse Taal (INT). Het gaat onder andere om tekstverzamelingen, woordenlijsten, wetenschappelijke woordenboeken, spraakcorpora en taal- en spraaktechnologische software. Daar worden ze duurzaam beheerd, onderhouden en voor gebruik beschikbaar gemaakt als open data.

Digitale infrastructuur

De Taalunie heeft, samen met andere overheidsorganisaties uit Nederland en Vlaanderen, financieel of inhoudelijk bijgedragen aan drie grote projecten om een digitale taalinfrastructuur voor het Nederlands te realiseren.

Dat zijn:

  • Het Corpus Gesproken Nederlands (CGN); een databank voor het hedendaags Nederlands zoals dat door volwassen sprekers in Nederland en Vlaanderen wordt gesproken.
  • Spraak- en Taaltechnologische Essentiële Voorzieningen In het Nederlands (STEVIN); een meerjarig onderzoeks- en stimuleringsprogramma voor Nederlandstalige taal- en spraaktechnologie.
  • Common Language Architecture Research Infrastructure Network (CLARIN); een Europees programma dat in 2009 is gestart om een duurzame gemeenschappelijke infrastructuur op te zetten voor onderzoek in de geesteswetenschappen. Daarbij gaat het om de softwaretools en om de inhoud, de digitale materialen. In 2012 is European Research Infrastructure Consortium aan de naam toegevoegd, waardoor het project nu CLARIN ERIC heet. Inmiddels zijn er 19 deelnemende landen.