Računalna lingvistika
Izvor: Wikipedija
Računalna lingvistika, ili računalno jezikoslovlje, (engl. Computational Linguistics (CL) ili Natural Language Processing (NLP)) znanost je koja se bavi razvojem kompjuterskih programa koji omogućavaju računalnu obradu ljudskog (prirodnog) jezika. Dio je znanstvene discipline pod nazivom umjetna inteligencija te ujedinjuje u sebi jezikoslovlje i računalstvo.
Najvažniji je programski jezik u računalnoj lingvistici Prolog. Pomoću Prologa mogu se relativno jednostavno opisati različiti formalizmi s područja lingvistike tako da se jezik može strojno obraditi.
Pod obradom jezika podrazumijeva se ispravljanje tekstova, ekstrakcija informacija, prijevod, interakcija izmedju čovjeka i kompjutera itd.
Sadržaj |
[uredi] Poddiscipline
Računalna lingvistika može se podijeliti na više područja s obzirom na to obrađuje li sr govoreni ili pisani jezik te pokušava li se jezik analizirati (parsing) ili generirati.
- Prepoznavanje govora i jezična sinteza proučavaju načine na koje računalo može prepoznati i razumijeti te generirati (stvoriti) ljudski jezik.
- Parsing i generacija jezika poddiscipline su računalne lingvistike koje proučavaju na koji način je sastavljen govoreni jezik.
- Strojno prevođenje dio je računalne lingvistike koje se bavi razvojem programa za prevođenje jezika.
[uredi] Upotreba u praksi
Glavni zadatak računalne lingvistike jest razvoj računalnih programa koji obavljaju različite zadatke povezane s ljudskim jezikom.
U to spada npr:
- Potpora korisnika računala pri obradi tekstova kao npr. ispravak pismenih grešaka, provjera gramatičke ispravnosti i sl.
- Automatsko traženje određenih mjesta u tekstovima i to ne samo prema njihovom obliku nego i značenju (Information-Retrieval i tražilice)
- Potpora pri (potpunom) prevođenju tekstova iz jednog jezika u drugi
- Obrada govora kod npr. telefonskih informativnih službi ili sprava za čitanje za slijepe
- Pronalaženje informacija poput navoda literarnih djela te odgovaranje na pitanja koje se temelji na postojanju velikih baza podataka (Information Extraction)
- Potpora autora pri pisanju tekstova kao npr. traženje odgovarajućeg izraza i terminologije
- Interakcija između čovjeka i kompjutera u prirodnom jeziku tako da se računalima mogu služiti i one osobe koje ne poznaju posebne naredbe
[uredi] Problemi u računalnoj lingvistici
Neki od problema koje računalna lingvistika mora riješiti su:
- određenje značenja riječi: neke riječi imaju ovisno o kontekstu različita značenja (homonimi - riječi istog oblika, ali različitog značenja). U tom se slučaju mora odabrati značenje koje odgovara određenom kontekstu. S druge strane su potrebni formalizmi za reprezentaciju značenja riječi
- sintaktičko višeznačje: u ponekim slučajevima se jedna rečenica može na više načina analizirati i tumačiti. Odabir točne analize zahtjeva semantičku informaciju o načinu govora i namjeri govornika. Primjer: "Petar vidi Mariju s dalekozorom" - u ovom slučaju računalu nije jasno vidi Petar Mariju koja drži dalekozor ili Petar vidi Mariju pomoću dalekozora.
- neke rečenice izražavaju preneseno značenje (pragmatika)
Kako i da li se ovi problemi daju riješiti ovisi uvelike o posebnostima jezika. Štoviše, nastoje se razviti postupci primjenjivi na sve jezike, ali detalji se moraju za svaki jezik posebno obraditi. Jedan program za npr. rastavljanje riječi za engleski ne može se primjeniti za Hrvatski.
Računalno jezikoslovlje radi i na razvoju programa koji omogućuju provjeru različitih lingvističkih hipoteza. Uvjet koji treba biti ispunjen da bi takvo provjeravanje bilo moguće jest mogućnost računala da simulira radnje koje čovjek riječima jednog jezika vrši.
No ovakav pristup razvoju kompjutera koji mogu pričati i razumijeti ljudski jezik otvara i poneka psihološka i filozofska pitanja. Hoće li računala jednog dana biti sposobni samostalno misliti i, s druge strane, da li su ljudski um i duh poput stroja?? No upravo je zanimljivost ovih tema ta koja tjera mlade ljude da studiraju računalnu lingvistiku i pri tome uoče razlike između ljudske komunikacije i računalnih programa.
[uredi] Vanjske Poveznice
- Diplomski studij lingvistike — Smjer računalna lingvistika
- The Association for Computational Linguistics