Neuron soundware: česká umělá inteligence umí rozpoznávat zvuky

26. 5. 2016

Doba čtení: 4 minuty

Pavel Konečný (vlevo) a Filip Sedlák z Neuron soundware.

Neuron soundware využívá neuronové sítě. Pomocí analyzování zvuků lze totiž odhalovat třeba poruchy ve strojích.

Americký časopis Wired tento měsíc přišel s titulní stranou a tématem, kde hlásá, že nastává konec tradičního kódu a programování a že brzy začneme stroje trénovat. Reflektuje rychlý vývoj v oblasti strojového učení, neuronových sítí, umělé inteligence a cloudů. „Je to tsunami, která se blíží,“ pokyvuje v rozhovoru pro Lupu spoluzakladatel společnosti Neuron soundware Pavel Konečný. „My v té tsunami budeme takovou malou vlnkou.“

Že mohou na základech AI a učícího se softwaru vzniknout černé skřínky, kterým nemusíme přesně rozumět? „Takových skříněk teď po světě chodí několik miliard,“ říká Konečný s odkazem na lidi a fungování mozku, které stále rovněž nechápeme. „Věcí postavených na AI bude přibývat. My bychom chtěli mít poměrně úzkou specializaci kolem zvuku.“

Pavel Konečný poslední tři roky strávil v Sydney, kde pracoval pro tamní pobočku společnosti Accenture. Tam se dostal k zajímavým projektům, stál u první australské implementace big data platformy Hadoop, dělal na technologii rozpoznávání hráčů kriketu a hodně také pracoval s technologií Watson od IBM. Poté se vrátil do Česka s tím, že chtěl rozjet něco kolem umělé inteligence a příbuzných oblastí.

Spojil se s kolegy Filipem Sedlákem a Pavlem Klingerem a v říjnu loňského roku rozjeli práci na technologii, která dnes vystupuje právě pod názvem Neuron soundware. Ta zjednodušeně řečeno umí rozeznat zvuky a odhalit případné odchylky, nálady a tak dále.

Učení na zvukových nahrávkách

V Praze na těchto základech prozatím nevzniká univerzální systém. Neuron se namísto toho soustředí na specifické implementace u zákazníků. V praxi to funguje tak, že se vezmou nahrané zvukové soubory, na základě kterých se pak trénují takzvané neuronové sítě. Je to princip podobný tomu, jak třeba Facebook poznává tvary na fotkách – stroj se na základě hromady vzorků naučí poznat to, co má.

Aktuální praktické projekty se realizují zejména v automobilovém průmyslu a 3D tisku, slibně se jeví také internet věcí. Stroje vydávají zvuky a na jejich základě lze odhalit například jejich poruchy a podobně. „Řešíme teď zrovna třeba praskající serva,“ vysvětluje Konečný.

Zkušený člověk mohl u starších automobilů poznat problém i podle zvuku, dnes by to měl zvládnout i stroj. S tím, že jeho možnosti mají narůstat a jít mnohem dále. „Nejvíce nás zajímají stroje, které se vyrábějí v sériích, nebo k něčemu takovému mají potenciál,“ říká Konečný. Teoretické možnosti jsou značné, od automobilů až třeba po větráky.

Neuron soundware si jednotlivé zvukové záznamy nejraději pořizují sami přímo u zákazníků, možná je ale i vzájemná spolupráce. Využívají se i poměrně levné mikrofony. Zvuky je lepší dodat v nekomprimovaném formátu WAV, systém si ale poradí i s MP3, když kvůli komprimaci nezmizí základní zvukové údaje.

Nahrávek může být poměrně dost. Konkrétně u 3D tiskárny se nasbírané množství pohybuje okolo čísla 100 tisíc záznamů. Nejde ovšem o nijak dlouhé stopy, třeba i o sekundové. Výsledný záznam tak může mít celkově řádově hodiny.

Trénování neuronových sítí

Jakmile jsou nahrávky pohromadě, soubory se nahrají do cloudu a náležitě popíšou či otagují. Cloudů Neuron používá několik, aktuálně nejvíce Azure od Microsoftu – mimo jiné i díky tomu, že začínající startupy od firem mohou výhodně získat kredity. Firma se do budoucna dívá zejména na cloudové výpočty pomocí grafických karet (GPU), které se na neuronové sítě a spol. hodně hodí.

Na základě souborů se pak v cloudu natrénuje neuronová síť a vytvoří se hotové modely s velikostí řádově jednotek MB. Vše se pak nahraje na vytvořenou základní desku a umístí do strojů.

U takového typu byznysu tak prozatím není možné „jet“ nějaké větší sériové dodávky. Neuron soundware musí každému zákazníkovi věnovat dost času a software nelze prodávat hotový v „krabicích“. Vyžadováno je i poměrně velké zapojení zákazníků samotných. Je ovšem možné, že jakmile se sejde mnoho různých vzorků dat, bude možné vytvořit univerzální platformu.

Český Pied Piper

Neuron v současné době dělá na dodávkách prvních projektů. Licence se prozatím prodávají na každé zařízení zvlášť, do budoucna se to ale může hýbat jiným směrem. Tříčlenná firma spolupracuje s několika externími pracovníky a úvodní fázi mimo jiné financuje z peněz, které získala od StartupYardu, jehož nedávným kolem prošla. „Bavíme se také s prvními možnými investory, ale to má čas a čekáme na první dokončená nasazení,“ říká Konečný.

Vedle průmyslového využití by Neuron šel rozšířit také do dalších oblastí. Pavel Konečný hodně mluví o call centrech, kde lze pracovat s automatizací na základě historických nahrávek lidí. Mohli by tak vzniknout třeba digitální asistenti na telefonu a podobně. Tam už se ostatně algoritmy k některým úkolům používají. „Životnost lidí v call centrech je ohromně nízká, nikdo tam nechce moc pracovat. To jsou přesně oblasti, kde technologie mohou pomoci.“

Myšlenka Neuron soundware se úplně původně točila kolem videa. Zvuk se nakonec zdál být jednodušší, ale i zde se nápady ještě utvářejí. Česká firma měla – tak trochu po vzoru fiktivní společnosti Pied Piper ze seriálu Silicon Valley – dělat lepší kompresi hudby. „Tam by ale asi nebylo takové množství zákazníků,“ popisuje šéf Neuronu. Zejména průmysl se tak jeví zajímavě. Například první český výrobce 3D tiskáren už nasazení připravuje.

Vstoupit do diskuse (7 názorů)