Computationele taalkunde
Computationele taalkunde is een specialisatie op het grensvlak van taalkunde en informatica/kunstmatige intelligentie waarin de computationele modellering van taalkundige verschijnselen centraal staat. Computationele taalkunde beperkt zich niet tot een specifiek domein binnen de taalkunde (syntaxis, semantiek, pragmatiek, fonetiek, fonologie, sociolinguïstiek). Het vakgebied is sterk interdisciplinair: onder meer taalkundigen, informatici, KI'ers, cognitief psychologen en logici houden zich hiermee bezig. Computationele taalkunde wordt soms wel computertaalkunde genoemd, maar die term is ambigu omdat hij ook de wetenschap van computertalen zou kunnen aanduiden.
Voorbeelden van onderzoeksgebieden binnen de computationele taalkunde zijn:
- het detecteren en corrigeren van spelfouten,
- automatische syntactische ontleding met parsers en taggers, inclusief het toekennen van semantische rollen tussen werkwoorden en zinsdelen,
- het bepalen van de betekenis van ambigue woorden uit hun context, en het bepalen van onderwerpen van (passages in) spraak en tekst, en
- het uitspreken van tekst met spraaksynthese,
- het bepalen van de pragmatische bedoeling van een uiting in een dialoog,
- automatisch samenvatten, en
- automatisch vertalen.
Inhoud |
[bewerk] Grammaticamodellen en parsing
Enkele grammaticamodellen die binnen de computationele taalkunde belangrijk zijn geweest, zijn de unificatiegrammatica's en verwante theorieën zoals Generalized Phrase Structure Grammar (GPSG), Head Driven Phrase Structure Grammar (HPSG), Lexical Functional Grammar (LFG), PATR en PATR-II. Verder is er bijvoorbeeld binnen de categoriale grammatica's (CG) vruchtbaar computationeel taalkundig onderzoek gedaan. Chomskyaanse theorieën zoals het Government and Binding (GB) model of - meer recent - het minimalistisch programma, wordt wel verweten, dat ze mathematisch niet rigoureus genoeg zijn, en dat ze de semantiek te sterk loskoppelen van de syntaxis, alsof dit losse modules zouden zijn die totaal onafhankelijk van elkaar behandeld kunnen worden. Vanuit het Chomskyaanse kader worden theorieën als CG en HPSG daarentegen weer beschouwd als een technische benadering, waarbij de analyse van taalkundige verschijnselen en de verklaring daarvan ondergeschikt is.
[bewerk] Semantiek
In de computationele semantiek worden de de boomstructuren die een automatische ontleder produceert vertaald naar logische formules. Deze kunnen vervolgens gekoppeld worden aan bijvoorbeeld automatische redeneerprogramma's die conclusies uit de logische formules trekken.[1]
[bewerk] Dialectologie
Een jong deelgebied van de computationele taalkunde is de computationele dialectologie. In dit vakgebied worden technieken als Levenshteinafstand en clustering gebruikt om een gekwantificeerde vergelijking van dialecten te maken. Met deze technieken is een nieuwe dialectkaart van Nederland opgesteld, en er is onderzoek gedaan naar de verwantschap tussen Italiaans, Latijn en Sardijns.[2]
[bewerk] Zie ook
Bron(nen): |
|