Umelá inteligencia od Googlu dokáže rozpoznávať hlasy ľudí v dave | Windowscentrum.sk | Portál o technológiách a Windowse
Connect with us

Umelá inteligencia od Googlu dokáže rozpoznávať hlasy ľudí v dave

Novinky

Umelá inteligencia od Googlu dokáže rozpoznávať hlasy ľudí v dave

Roboty a pokročilé technológie už vo viacerých oblastiach prekročili ľudské schopnosti. Najlepším príkladom je zrejme umelá inteligencia, ktorej schopnosti sú takmer nekonečné a nevyrovná sa jej už žiadny žijúci človek na tejto planéte. Umelá inteligencia ale nie je dokonalá v úplne všetkých oblastiach a jednou z takýchto oblastí je práve rozpoznávanie hlasov v dave ľudí. Pre nás sa nejedná o žiadnu náročnú úlohu a z davu ľudí sa viete celkom bezproblémovo zamerať na jednu vybranú osobu. Práve s touto problematikou sa momentálne zaoberajú výskumníci v spoločnosti Google, ktorí sa pýšia ďalším úspechom v oblasti umelej inteligencie.

Výskumníkom sa podarilo naučiť AI rozpoznávať hlasy v dave ľudí

Tím výskumníkov v Googli dokázal “vycvičiť” model neurónovej siete s cieľom rozpoznať jednotlivé hovoriace osoby a následne vytvorili model virtuálnych hovoriacich “strán”, ku ktorým pridali hluk s pozadia. Týmto spôsobom vytvárania virtuálnych situácií naučili umelú inteligenciu izolovať viaceré hlasy od odlišných zvukových stôp. Výsledky tohto projektu môžete vidieť vo videu nižšie. Umelá inteligencia dokázala identifikovať hlasy aj napriek tomu, že sa dané osoby snažili navzájom prekrikovať. AI sa jednoducho zamerala na danú tvár osoby a následne dokázala identifikovať, čo táto osoba hovorí a akú zvukovú stopu ku nemu priradiť. V niektorých situáciách bola osoba na videu zakrytá, či už rukami alebo mikrofónom, no AI sa aj s týmto problémom vysporiadala.

Potencionálne využitie tejto technológie je naozaj rozsiahle

Spoločnosť Google už v súčastnosti rozmýšľa nad implikáciou tejto technológie do svojich služieb, napríklad do aplikácií Hangouts alebo Duo. Táto technológia by výrazne vylepšila video-komunikáciu medzi osobami v prípade, že sa jedna z nich nachádza vo veľkej miestnosti s veľkým počtom ľudí. Aplikácia by na základe rozpoznávania tváre mohla zvyšovať audio rozprávajúceho, alebo by mohla vytvárať titulky. Využitie tejto technológie je naozaj rozsiahle a určite sa jedná o ďalší zásadný technologický posun, čo sa umelej inteligencie týka.

TIP  Je autopilot Tesly dokonalý? Nie a toto video je toho jasným dôkazom

Zdroj: engadget.com, úvodný obrázok (Youtube)

Podel sa o svoj názor v komentároch

Mohlo by ťa tiež zaujímať Novinky

Mohlo by Ťa zaujímať

Naše najnovšie videá

Tvoj prehľad najnovších správ

Štítky

Mohlo by Ťa zaujímať

To Top
Pre účely prispôsobenia obsahu, reklám, analýzy návštevnosti a zabezpečenie fungovania stránky využívame súbory cookies a iné technológie . V prípade, že máte menej ako 16 rokov a chcete využívať naše služby tak musíte požiadať vášho zákonného zástupcu (rodiča) o súhlas so spracovaním osobných údajov.