Elaborazione del linguaggio naturale
Da Wikipedia, l'enciclopedia libera.
L'Elaborazione del linguaggio naturale, detta anche NLP (dall'inglese Natural Language Processing), è il processo di estrazione di informazioni semantiche da espressioni del linguaggio umano, scritte o parlate, tramite l'elaborazione di un calcolatore elettronico.
Questo processo è reso particolarmente difficile e complesso a causa delle caratteristiche intrinseche di ambiguità del linguaggio umano. Per questo motivo il processo di elaborazione viene suddiviso in fasi diverse, tuttavia simili a quelle che si possono incontrare nel processo di elaborazione di un linguaggio di programmazione:
- analisi lessicale: scomposizione di un'espressione linguistica in token (in questo caso le parole)
- analisi sintattica: arrangiamento dei token in una struttura sintattica (ad albero: parse tree)
- analisi semantica: assegnazione di un significato (semantica) alla struttura sintattica e, di conseguenza, all'espressione linguistica