تشخیص گفتار
از ویکیپدیا، دانشنامهٔ آزاد.
فناوری تشخیص گفتار به رایانهای که توانایی دریافت صدا را دارد (برای مثال به یک میکروفن مجهز است) این قابلیت را میدهد که صحبت کاربر را متوجه شود. این فناوری در تبدیل گفتار به متن و یا به عنوان جایگزینی برای صفحه کلید یا ماوس برای وارد کردن دستورات مورد استفاده قرار می گیرد. سیستم های تشخیص دهنده گفتار انواع مختلفی دارند، بعضی قادرند گفتار پیوسته را شناسایی نمایند، بعضی دیگر فقط می توانند گفتار گسسسته (که بین کلمات سکوت وجود دارد) را تشخیص دهند. همچنین سیستم ها قادرند کلمات بیان شده توسط افراد مختلف و یا فقط توسط یک گوینده تشخیص دهند. بهر حال ایده آل ترین سیستم آن است که بتواند گفتار پیوسته غیر وابسته به گوینده را در محیط نویزی شناسایی نماید. این سیستم ها با بکار گیری روش های مختلف طبقه بندی و شناسایی الگو قادرند به تشخیص کلمات هستند که البته برای افزایش دقت در شناسایی از یک فرهنگ لغات نیز در انتهای سیستم استفاده می شود. روشهایی مانند Hidden Markov Model یا Neural Network در بسیاری از سیستم های تشخیص گفتار مورد استفاده قرار می گیرند و در بخشهای انتهایی سیستم از هوش مصنوعی کمک گرفته می شود. امروزه با داشتن میکروفن و کارت صوتی در کامپیوتر و بکار گیری نرم افزار تشخیص گفتار میتوان دستورات یا کلمات را به صورت صوتی به کامپیوتر وارد کرد. حتی در بعضی از گوشی های تلفن همراه از این سیستم ها جهت دریافت دستورات بصورت صوتی استفاده می شود.