Rozpoznávání řeči

Z Wikipedie, otevřené encyklopedie

Rozpoznávání řeči je postup, kdy se podle určitých zaznamenaných vzorků zvuku rozpoznává, co bylo řečeno. Metoda je zatím velmi citlivá na rozdíly v intonaci i výslovnosti. Nejvíce propracovaná je tato medota zatím pro anglicky mluvící populaci.

I když mají mluvčí stejný jazyk, liší se jejich hlasový projev právě v různé intonaci, zabarvení atd. Tyto rozdíly se snaží překonat složité výpočetní operace, takže proces rozpoznání řeči je velmi výpočetně náročný, zvláště jde-li o rozpoznávání plynulé řeči.

Už dnes však existují programy, které reagují na jednoduché hlasové povely. Existují dokonce textové editory, kterým lze text diktovat. V současnosti nejrozšířenějším software v této oblasti je Dragon Naturally Speaking a IBM ViaVoice. V prográmku jménem JetVoíce můžete ovládat hlasem některé činnosti počítače. Hlasové záznamy jsou v něm vidět v obrazové podobě, kde můžete rozpoznat jak vaše intonace závratně mění způsob, jakým počítač zvuk vnímá.