Ako Funguje Umelá Inteligencia: Rozpoznávanie Reči - Alternatívny Pohľad

Obsah:

Ako Funguje Umelá Inteligencia: Rozpoznávanie Reči - Alternatívny Pohľad
Ako Funguje Umelá Inteligencia: Rozpoznávanie Reči - Alternatívny Pohľad

Video: Ako Funguje Umelá Inteligencia: Rozpoznávanie Reči - Alternatívny Pohľad

Video: Ako Funguje Umelá Inteligencia: Rozpoznávanie Reči - Alternatívny Pohľad
Video: Umelá inteligencia - stvoríme Boha, ktorý nás zničí? 2024, Septembra
Anonim

Každý z nás čelí tak záhadnému fenoménu, ako je umelá inteligencia v každodennom živote - je to on, kto umožňuje hlasovým asistentom a vyhľadávacím nástrojom rozpoznať ľudskú reč a uhádnuť túžby používateľov. Dnes budeme hovoriť o tom, ako presne je táto technológia usporiadaná a aké vyhliadky očakávajú túto oblasť rozvoja v blízkej budúcnosti.

Umelá inteligencia je veľmi široký pojem, v rámci ktorého už existuje mnoho algoritmov, ktoré sa stále vyvíjajú a ktorých cieľom je vykonávať širokú škálu praktických úloh. Čo sú však moderné programy umelej inteligencie skutočne schopné a za akých zásad sa pri svojej práci riadia? Dnes budeme hovoriť o jednej z kľúčových čŕt strojovej mysle, s ktorou sa každý z nás pravidelne stretáva v každodennom živote - schopnosti hlasových asistentov rozpoznávať ľudskú reč.

Rozpoznávanie hlasu

Na meranie hlasu program používa množstvo zvukových parametrov: frekvenciu a dĺžku zvukovej vlny v určitom časovom okamihu. Napríklad, keď chatujete s obľúbeným hlasovým asistentom Alexom, softvér rozdelí váš hlas na 25 milisekundové snímky a potom každý zo segmentov skonvertuje na digitálne podpisy. Potom sa bloky podpisov porovnávajú s interným katalógom zvukov programu, až kým počet zhôd nie je dostatočne vysoký na to, aby AI „preložil“čísla do abecedného dotazu, ktorému rozumie.

Image
Image

Pri používaní Siri alebo Google Assistant sledujte obrazovku svojho telefónu a počas vyslovovania slov uvidíte, ako sa slovník mení. Je to spôsobené skutočnosťou, že pri každom ďalšom „kroku“softvér porovnáva aj výsledok získaný s internou databázou a vytvára slová v závislosti od zhody. Podľa Rohita Prasada, hlavného vedca Amazonskej divízie Alexa, „jazykový model sa učí veľa miliárd slov vo forme textu“. Dôležitú úlohu hrá aj poradie slov: to si môžete všimnúť aj pomocou zvyčajného vyhľadávacieho nástroja Google, ktorý niekedy poskytuje odlišné údaje pre rovnaké dotazy, v ktorých bolo len niekoľko slov preusporiadaných.

Propagačné video:

Perspektívy rozpoznávania reči

Alan Black z Carnegieho inštitútu pre jazykové technológie tvrdí, že pre všetkých odborníkov vo veľkých spoločnostiach je najzaujímavejšou otázkou nájsť limit svojho vlastného systému. „Keď program hovorí:„ To nemôžem urobiť, “potom sa situácia stane skutočne zaujímavou,“žartuje. Je to však pravda: reakcia na nepredvídateľné požiadavky používateľov je dokonca jednou z hlavných úloh, ktoré skúmajú študentské kruhy, ktoré súťažia o cenu Alexa - a to je neuveriteľných 2,5 milióna dolárov. Ich úlohou je vytvoriť chatbot určený na komunikáciu s ľuďmi, ktorí kladú konzistentné a zmysluplné otázky. Informácie v tomto prípade sa aktualizujú každých 20 minút. Znie to ako celkom ľahká úloha aj pre priemerného programátora,ale v praxi je komunikácia programu so skutočnými ľuďmi vždy spojená s odchýlkami od témy dialógu, spontánnych fráz a iných porušení. Program, ktorý sa naučí s nimi pracovať, ako aj so skutočnou osobou, bude obrovským prielomom pre celé odvetvie AI.

Vasily Makarov