Automatic Speech Recogniser

Wikipedia

ASR Automatic Speech Recogniser, elektronisk eller datateknisk anordning för igenkänning av tal. Moderna ASR bygger oftast på statistiska metoder där man igenkänner språk i flera nivåer med hjälp av hypoteser och grammatiker som definierar troliga/kända kombinationer av språkelement.

Taligenkänning bör inte blandas ihop med röstigenkänning (igenkänning av vem som talar).

Det bedrivs omfattade forskning kring förståelsen av naturligt tal. Ofta är ASR för naturligt tal adaptiva och tillåter för inlärning av nya grammatikelement, genom att man halvautomatiskt analyserar vilka fraser som misslyckas att bli korrekt förstådda, och korrigerar datorns gramatiska och akustiska modeller. Naturligt tal är ett viktigt steg för att få mänskliga gränssnitt till datorer.

Nivåer i ASR:

akustik - identifiering av fonemer, dvs ljudstyrka för frekvenserkombinationer och akustiskt förlopp
ord - ihopsättning av fonemer
ordföljder - urval av troligaste ordföljder jämfört med en stor databas med talat språk
grammatik - verifiering av hypotetiska ordföljder mot grammatik som gäller för det specifika domänen (till exempel en grammatik för biljettbokningar innhåller vanliga fraser och meningar som har med biljetter att göra, men det finns ingen anledning att till exempel ha med grammatik för fotbollsammanhang)
semantik - uttydning av informationsbärande element

Enklare ASR förväntar sig enkla svar på frågor, till exempel

Fråga: Vart vill du åka? Ange orten! Svar: Malmö Fråga: Varifrån vill du åka? ange orten! Svar: Kiruna

ASR som kan hantera fritt tal kan under optimala omstämdigheter klara av komplicerade utsagor som till exempel:

Fråga: Beskriv din resa! Svar: Jag vill ta tåget från Kiruna till Malmö, andra klass.

Då folk inte talar grammatisk, och ofta stackar sig så måste man kunna filtrera bort harklingar, upprepade ord, otydliga ord, ord utan betydelse, till exempel

Svar: Hmmm Ja just det, vi tar tåget, ta tåget från.. från öööö Kiru.. Kiruna var det till Skåne, till Malmö, ja just det till öööö Malmö skall jag åka.

Se även Text_to_Speech

Den här artikeln är hämtad från http://sv.wikipedia.org../../../a/u/t/Automatic_Speech_Recogniser_4786.html

Kategorier: Talteknologi | Teknologi | Datorteknik | Människa-datorinteraktion

Automatic Speech Recogniser

Wikipedia

Views

Navigering

Sök

Andra språk