Umelá Inteligencia Sa Naučila Správne Rozpoznávať Reč Medzi Hlukom - Alternatívny Pohľad

Umelá Inteligencia Sa Naučila Správne Rozpoznávať Reč Medzi Hlukom - Alternatívny Pohľad
Umelá Inteligencia Sa Naučila Správne Rozpoznávať Reč Medzi Hlukom - Alternatívny Pohľad

Video: Umelá Inteligencia Sa Naučila Správne Rozpoznávať Reč Medzi Hlukom - Alternatívny Pohľad

Video: Umelá Inteligencia Sa Naučila Správne Rozpoznávať Reč Medzi Hlukom - Alternatívny Pohľad
Video: 101 отличный ответ на самые сложные вопросы интервью 2024, Smieť
Anonim

Virtuálni asistenti a systémy rozpoznávania hlasu sa naučili „rozpoznať“to, čo im niekto hovorí, a riadiť sa jeho príkazmi. Ale pre správnu funkciu rovnakých Siri a Cortana môže byť cudzí hluk veľkým problémom. Odborníci spoločnosti Mitsubishi Electric môžu pomôcť vyrovnať sa s touto technickou chybou, ktorá predstavila novú technológiu na oddelenie reči jednej osoby od všeobecného hluku.

Technológia japonskej spoločnosti sa nazýva Deep Clustering, ktorej fungovanie je založené na princípoch strojového učenia. Na začiatku sa umelá inteligencia naučila nezávisle oddeľovať reč jednej osoby od všeobecného prúdu rôznych zvukov a zvukov. Neurónová sieť rozdeľuje prichádzajúce zvukové údaje na rôzne prvky a každý analyzuje osobitne, po ktorom už môže spracovať ľudský hlas. Podobná práca sa pozoruje, keď sú dvaja alebo viacerí účastníci spojenia „spojení“.

Počas demonštrácie technológie od japonskej spoločnosti bol systém schopný úspešne rozdeliť reč dvoch ľudí hovoriacich rovnakou vetou v rôznych jazykoch na jeden mikrofón. Všetky spracovanie sa uskutočňovalo v reálnom čase a oneskorenie nepresiahlo tri sekundy. Presnosť rozpoznávania bola 90 percent a keď traja ľudia začali hovoriť do mikrofónu, percento „zásahov“kleslo na 80, čo je tiež dobrý výsledok. Podľa autorov projektu Anthony Vetro a Yohei Okato, „Na rozdiel od oddeľovania reči od zvukov v pozadí je oddeľovanie reči jednej osoby od„ hlasového “hluku ľudí hovoriacich súčasne veľmi náročnou úlohou, pretože zvuky hlasu rôznych ľudí majú veľa zvláštností. Vo väčšine systémov sa problém s oddelením hlasu rieši inštaláciou dvoch alebo viacerých mikrofónov, ale v prípade použitia iba jedného mikrofónu môže úlohu oddelenia hlasu zvládnuť iba umelá inteligencia. Táto technológia sa dá použiť všade tam, kde sa vyžaduje vysoká presnosť rozpoznávania hlasových správ. Napríklad v systémoch hlasového ovládania automobilov, výťahov, domácich a iných elektronických zariadení. ““

VLADIMIR KUZNETSOV