Anonim

Disneyův systém rozpoznávání řeči pro děti rozděluje rozhovor

Počítače

Michael Irving

7. září 2016

2 obrázky

Disney Research vyvinul systém rozpoznávání řeči specificky pro řečové vzory dětí a vyzkoušel si je s hrou, která umožňuje dětem ovládat krtka pomocí jednoduchých hlasových příkazů (Credit: Disney Research)

Barking hlasové příkazy u telefonu, auta, počítače nebo dedikovaný hlasový asistent, jako je Alexa, je v dnešní době poměrně běžné, ale tyto systémy jsou obvykle navrženy s myšlenkou pro dospělé. Děti mají velmi odlišné řečové vzory a společnost Disney Research vyvinula systém, který uspokojuje mladší dav, vybírá klíčová slova z rozrušeného chvění a překrývající se řeči a umožňuje dětem hrát videohru se svým hlasem.

Mole Madness je název hry a děti ovládají postavu pouze dvěma jednoduchými hlasovými příkazy. Hraje se ve dvojicích (buď s jiným dítětem nebo s robotem jménem Sammy), jeden hráč říká "jít ", aby dostal molu pohybující se po obrazovce, zatímco jeho partner řídí nahoru tím, že říká "skok ". Jak jednoduché, jak se zdá v systému rozpoznávání řeči k identifikaci, děti hodily pár klíčů v dílech se sklonem k chitchat a mluvit nad každým jiný.

"Kluci nemusí nutně vyslovovat slova jako dospělí a když hrají společně, jak se jim líbí, často se zabývají bočními výkřiky nebo výkřiky vzrušení nebo prostě si povídají o sobě navzájem, " říká Jill Fain Lehman, vedoucí výzkumný pracovník projektu. "To je těžké pro systém založený na řeči, dokonce i ten, který prostě musí rozpoznat slova" jít "a " skok "jako v Mole Madness . "

Nejprve měl systém rozpoznávání hlasů nějaké lidské tréninkové kolečka ve formě "čaroděje" v jiné místnosti, která by stiskla tlačítko na regulátoru, když slyšel buď "skok" nebo "jít" příkaz. Poté, co hráli 62 dětí ve věku pěti až deseti let, vědci měli k dispozici dostatek údajů, aby mohli systém rozpoznat klíčová slova, jednotlivě či společně, a odlišit je od hluku v pozadí a jiných bity banteru.

Jakmile byl systém automatizován a průvodce byl z rovnice odstraněn, vědci oznámili, že klíčová slova mohou vybrat 85 procent času. Není to špatné, jelikož 40 procent těchto povelů se překrývalo, když dvě děti hrály a 32 procent bylo řečeno rychleji než obvykle.

Pro srovnání byl komerčně dostupný systém rozpoznávání řeči proveden pomocí kroků a dokázal rozpoznat jen 50 procent příkazů a potýkal se s překrývajícím se a rychlým projevem.

Automatizovaný systém byl také považován za mnohem více zaujatý hráči, než kdyby výzkumník zadával příkazy ručně. Podle rodičů, kteří sledují video později, děti byly bližší k pocitu, že by se "mohli vzít nebo opustit", než aby si sami sebe užívali. Jakmile byla hra automatizována a dokázala zpracovat příkaz do 150 milisekund, děti ukázaly více známky angažovanosti ve hře.

Systém se setkal s některými problémy s příkazem "jump", když se nová skupina dětí, někteří mladí jako čtyři, pokusila o hru, ale vědci zjistili, že účastníci brzy změnili své řečové vzorce, aby pomohli systému, opakování příkazů nebo opatrnější řeč.

"Aplikace pro rozpoznávání řeči se stávají čím dál častější, když technologie zesílí, ale pochopení toho, co děti říkají, když hrají, zůstává obtížné, " říká Jessica Hodgins, viceprezidentka společnosti Disney Research. "Tato nejnovější práce našich výzkumných pracovníků by nám umožnila navrhnout libovolný počet herních nebo zábavních aplikací pro děti, včetně interakcí s roboty."

Vědci prezentují studium na Workshopu o interakci s dětmi v počítači tento týden a na mezinárodní konferenci o inteligentních virtuálních agentů koncem tohoto měsíce.

Zdroj: Disney Research prostřednictvím Eurekalert

Dvě děti ovládají Mole Madness se svými hlasy (Credit: Disney Research)

Disney Research vyvinul systém rozpoznávání řeči specificky pro řečové vzory dětí a vyzkoušel si je s hrou, která umožňuje dětem ovládat krtka pomocí jednoduchých hlasových příkazů (Credit: Disney Research)

Doporučená Redakce Choice