Technológia rozpoznávania reči od Microsoftu je presnejšia než kedykoľvek predtým
Technológia rozpoznávania reči od Microsoftu dosiahla svoje doterajšie maximum. Výskumný tím spoločnosti Microsoft oznámil, že systém rozpoznávania reči od Microsoftu dosiahol 5,1% slovnú chybovosť (WER).
Posledná hranica tohto systému sa pohybovala na úrovni 5,9%. Celý systém sa s vyspelejšou technológiou posúva dopredu každým rokom. V septembri minulého roku sa chybovosť pohybovala na úrovni až 6,3%, čiže systém rozpoznávania bol za jeden rok vylepšený a hranica chybovosti klesla až o 1,2%.
Posledné výskumy zistili, že slovná chybovosť sa u ľudí pohybuje tiež na úrovni 5,1%. Tým pádom môžeme povedať, že systém od Microsoftu spravil veľký krok a konečne dosiahol ľudskú hranicu. Výborné výsledky slovnej chybovosti sú dosiahnuté kombináciou konvolučnej neurónovej siete s obojsmernou dlhodobo-krátkodobou pamäťou. Inžinieri v Microsofte v poslednej dobe pracovali na vylepšení zvukových a jazykových modelov, taktiež založených na neurónových sieťach. Microsoft taktiež tvrdí, že nízku chybovosť ma na svedomí aj cloud business. Vďaka ich investícií do cloudu bol „tréning“ zvukových a jazykových modelov ešte rýchlejší a jednoduchší.
Technológia rozpoznávania reči od Microsoftu je používaná v samotnom Windowse, ale aj Cortane, Office aplikáciách a kognitívnych službách. Vylepšená technológia bude v priebehu nasledujúcich mesiacov do všetkých spomenutých oblastí aplikovaná a používatelia tento technologický posun určite zaznamenajú.
Neprehliadnite
Zdroj: Microsoft, úvodný obrázok (Pexels.com)
Komentáre