Vedci Vyškolili Neurónovú Sieť Na Určovanie Pohlavia Osoby Z Písaného Textu - Alternatívny Pohľad

Vedci Vyškolili Neurónovú Sieť Na Určovanie Pohlavia Osoby Z Písaného Textu - Alternatívny Pohľad
Vedci Vyškolili Neurónovú Sieť Na Určovanie Pohlavia Osoby Z Písaného Textu - Alternatívny Pohľad

Video: Vedci Vyškolili Neurónovú Sieť Na Určovanie Pohlavia Osoby Z Písaného Textu - Alternatívny Pohľad

Video: Vedci Vyškolili Neurónovú Sieť Na Určovanie Pohlavia Osoby Z Písaného Textu - Alternatívny Pohľad
Video: How To Fix a Broken or Separated Zipper 2024, Smieť
Anonim

Tím vedcov z Národnej výskumnej jadrovej univerzity "MEPhI", Národného výskumného centra "Kurchatovský inštitút" a Voronezhskej štátnej univerzity vyvinul metódu, ktorá učí počítač rozpoznávať pohlavie osoby z textu, ktorý napísal, s presnosťou 80 percent. Vedecký rozvoj patrí do oblasti výpočtovej lingvistiky. Výskum sa uskutočnil s grantom Ruskej vedeckej nadácie. Výsledky sú publikované v časopise Procedia Computer Science.

Početné vedecké štúdie ukazujú, že písomný text nevyhnutne odráža charakteristiku autora - pohlavie, psychologické charakteristiky, úroveň vzdelania. Reč je cenným psychodiagnostickým nástrojom, ktorý používajú odborníci na ľudské zdroje veľkých spoločností, ako aj bezpečnostné služby.

Na základe analýzy reči je možné diagnostikovať prítomnosť určitých chorôb u človeka (demencia, depresia) a tendenciu k samovražednému správaniu. Potreba stanoviť charakteristiky autora textu tiež rastie s rozvojom internetovej komunikácie: je dôležité, aby spoločnosti vedeli, ktoré skupiny ľudí majú radi svoje výrobky a služby.

Vedci pracujúci týmto smerom (lingvisti, psychológovia, špecialisti na informačné technológie), na základe číselných hodnôt rôznych parametrov textu, zostavujú matematické modely na diagnostiku určitých parametrov osobnosti.

Tím expertov analyzoval efektívnosť rôznych technológií strojového učenia pomocou neurónových sietí na analýzu textu.

V priebehu štúdie porovnávali presnosť riešenia problému rodovej identifikácie textov na základe dvoch prístupov k modelovaniu založenom na údajoch: na jednej strane algoritmy strojového učenia (podpora vektorového stroja a zosilnenie gradientu), na druhej strane, hlboké učenie neurónových sietí (konvolučných neurónových sietí a opakujúce sa neurónové siete s dlhodobou krátkodobou pamäťou).

„Vďaka vyspelým modelom neurónovej siete sme dosiahli vysoké výsledky pri určovaní pohlavia autora textu v podmienkach, keď autor svoje pohlavie nezakryje. Ďalšou úlohou je určiť pohlavie z hľadiska jeho úmyselného utajenia, “hovorí Alexander Sboev, docent NRNU MEPhI.

V nasledujúcich textoch, ktoré boli pôvodne zverejnené na zoznamovacej stránke, neurónová sieť ľahko nájde úlovok v desiatich z desiatich prípadov, pričom autor úmyselne do podpisu vloží meno opačného pohlavia.

Propagačné video:

Text napísalo dievča: „Som pekný, svalnatý muž 30 rokov. Pracujem pre veľkú ropnú a plynárenskú spoločnosť v dobrej pozícii so slušným platom. Bývam vo svojom vlastnom byte v Moskve. Táto nehnuteľnosť má malý, ale pekný dom v jednej z dedín v Taliansku. Mám rád šport, najmä futbal. Milujem ísť na víkend, neznášam pobyt doma. Dievča, ktoré by mi vyhovovalo, by malo mať skromnú dispozíciu, dobrý vzhľad a atraktívnu postavu podľa moderných štandardov. Mala by zdieľať moje záujmy, nemala by žiarliť a nemala by sa snažiť, aby som sa cítila žiarliť. Nepodporím to dievča, pretože som presvedčený, že obaja by mali pracovať v rodine. Taktiež dávam prednosť zachovaniu rozpočtu osobitne. Nebudem tolerovať zradu. ““

Text napísal muž: „Ahoj! Som nesmierne nešťastný! Prečo sa s nami správate takto? Aj my sme ľudia, všetci sme si rovní! Si sexista? Už to nebudem brať! Rozbijem tvoje auto všade, maľuj to. Počkajte, neľudské. Týmto dokončím. ““

Výsledky tejto štúdie ukázali, že prístup založený na použití konvolučných neurónových sietí a metód hlbokého učenia na rozpoznanie pohlavia osoby, ktorá text napísala, je najoptimálnejší.

Teraz skupina výskumníkov pracuje na probléme rozpoznávania veku.