Automatic Speech Recogniser
Wikipedia
ASR Automatic Speech Recogniser, elektronisk eller datateknisk anordning för igenkänning av tal. Moderna ASR bygger oftast på statistiska metoder där man igenkänner språk i flera nivåer med hjälp av hypoteser och grammatiker som definierar troliga/kända kombinationer av språkelement.
Taligenkänning bör inte blandas ihop med röstigenkänning (igenkänning av vem som talar).
Det bedrivs omfattade forskning kring förståelsen av naturligt tal. Ofta är ASR för naturligt tal adaptiva och tillåter för inlärning av nya grammatikelement, genom att man halvautomatiskt analyserar vilka fraser som misslyckas att bli korrekt förstådda, och korrigerar datorns gramatiska och akustiska modeller. Naturligt tal är ett viktigt steg för att få mänskliga gränssnitt till datorer.
Nivåer i ASR:
- akustik - identifiering av fonemer, dvs ljudstyrka för frekvenserkombinationer och akustiskt förlopp
- ord - ihopsättning av fonemer
- ordföljder - urval av troligaste ordföljder jämfört med en stor databas med talat språk
- grammatik - verifiering av hypotetiska ordföljder mot grammatik som gäller för det specifika domänen (till exempel en grammatik för biljettbokningar innhåller vanliga fraser och meningar som har med biljetter att göra, men det finns ingen anledning att till exempel ha med grammatik för fotbollsammanhang)
- semantik - uttydning av informationsbärande element
Enklare ASR förväntar sig enkla svar på frågor, till exempel
Fråga: Vart vill du åka? Ange orten! Svar: Malmö Fråga: Varifrån vill du åka? ange orten! Svar: Kiruna
ASR som kan hantera fritt tal kan under optimala omstämdigheter klara av komplicerade utsagor som till exempel:
Fråga: Beskriv din resa! Svar: Jag vill ta tåget från Kiruna till Malmö, andra klass.
Då folk inte talar grammatisk, och ofta stackar sig så måste man kunna filtrera bort harklingar, upprepade ord, otydliga ord, ord utan betydelse, till exempel
Svar: Hmmm Ja just det, vi tar tåget, ta tåget från.. från öööö Kiru.. Kiruna var det till Skåne, till Malmö, ja just det till öööö Malmö skall jag åka.
Se även Text_to_Speech