Hlavní navigace

Sezname, přehraj Lajnu. Seznam.cz spouští hlasového asistenta ve stylu Siri

27. 10. 2020
Doba čtení: 5 minut

Sdílet

 Autor: Jan Sedlák
Veřejná testovací verze pro Android je zatím omezená, základy pro další rozvoj jsou ale dobré.

Seznam.cz začal pracovat na vlastním digitálním asistentovi a obdobě zahraničních služeb Apple Siri, Google Now nebo Amazon Alexa. Jako maskot opět slouží pes Krasty, služba se však nejmenuje po něm, ale nese označení Seznam hlasový asistent. V současné době je k dispozici veřejná testovací verze, a to pouze pro chytré telefony s Androidem 10 (nikoliv s nejnovější jedenáctou edicí).

„Vyhledávání hlasem je celosvětovým trendem. Statistiky říkají, že poměr hledání hlasem na mobilních telefonech je celosvětově mezi 20 až 30 procenty. Některá čísla ze Spojených států již hovoří o podílech nad 40 procent. To jsou pro nás zatím těžko představitelná čísla. Trend je však jasný, neustále roste a v některých skupinách je dokonce růst rok od roku exponenciální. Češtině zatím asistenti globálních značek nerozumí, a to nám dává příležitost být u zrodu tohoto trendu v ČR a mít možnost ho spoludefinovat,“ vysvětluje pro Lupu motivaci vzniku asistenta produktový manažer Adam Raška.

Seznam s hlasovým asistentem přichází do doby, kdy se zejména Google, Apple a Amazon snaží uživatele naučit ovládat elektroniku a služby na ní navázané hlasovými povely. Podobně Microsoft delší dobu budoval asistentku Cortana, postupně ji ale spíše utlumuje. Velká trojka každopádně vedle samotných softwarových/cloudových pozadí těchto služeb postupně vypouští nový hardware (HomePod, Echo a spol.), aby adopci podpořil.

Česko je malý trh a lokalizace těchto nástrojů k nám prozatím nedorazila. Paradoxní je, že v zemi existuje několik zajímavých aktivit, které se v oboru řadí na světovou úroveň. Bot Alquist z ČVUT napojený na Alexu například pravidelně boduje na světové soutěži Amazonu. IBM v Praze vyvíjí jazykové kapacity Watsona, Phonexia v Brně vyvíjí pokročilý systém pro rozpoznávání hlasu a existují i fanouškovské aktivity typu Hello Emma, která do iOS přidává hlasové ovládání v češtině, kompletně vytvořené v nástroji Zkratky.

Je možné, že Apple už na počeštění Siri pracuje, do Irska totiž začal hledat lidi na přepis nahrávek. Seznamu se nicméně otevírá prostor doručit na trh hlasového asistenta v češtině a podobně jako s jeho jinými službami si tak ještě před příchodem velkých hráčů obsadit pozici na trhu.

Služby Seznamu a Spotify

Hlasového asistenta Seznamu si může vyzkoušet každý. V Google Play Store je třeba si stáhnout aplikaci Seznam.cz, jít do nastavení a v sekci „Vychytávky“ službu aktivovat (ve verzi pro Huawei AppGallery jsem tuto možnost nenašel). Aplikace si vyžádá přístup k mikrofonu a také je třeba v nastavení povolit aplikaci Seznam.cz chod nad dalšími programy. Následně se totiž po stranách displeje začne zobrazovat ikona psa Krastyho, který čeká na hlasové povely. Krastyho lze po okrajích přesouvat podobně jako chatové bubliny.

Jak vypadá Seznam hlasový asistent:

Hlasový asistent se pak aktivuje povelem „Sezname“. Místo Krastyho se objeví kruh aplikací, se kterými asistent aktuálně spolupracuje. Jde o Seznam.cz, Mapy.cz, Jízdní řády, Email.cz, Novinky.cz, Sport.cz, TV Seznam, Pohádky, Super.cz, TV program a Spotify.

Množina povelů, se kterými hlasový asistent dokáže pracovat, je prozatím omezená. Krasty například umí otevřít aplikaci Mapy.cz, prozatím ale nezvládne pomocí hlasu vyhledat adresu či nastavení navigace. Tyto možnosti přibudou až v budoucnu. Dále lze přehrávat hudbu ze Spotify („Sezname, přehraj Children of Bodom“), ukazovat zprávy, přehrávat videa ze služeb Seznamu („Sezname, přehraj Lajnu“), dodávat základní informace nebo nastavovat věci jako budík. Povelem „Sezname, zavři se“ lze asistenta ukončit.

„Pracujeme na dalších platformách, na rozšiřování příkazů i odpovědí asistenta na bázi Text-to-Speech. Budeme také rozšiřovat portfolio aplikací, které bude možné hlasem spustit i ovládat. Mohu prozradit, že například s kolegy z týmu vývoje Mapy.cz zkoumáme propojení s navigací a ovládání skrze Android Auto,“ nastiňuje Raška ze Seznamu další plány.

Česká internetová jednička asistenta vypustila po sérii interních a uzavřených testů. S pomocí uživatelů v rámci veřejného testování chce zrychlit učení celého systému a službu průběžně zlepšovat.

Se základy z Pittsburghu

„Myšlenka hlasového asistenta vznikla již před nějakou dobou. Prošli jsme si mentálně různými cestami ve fázi designování a hledání takzvaný product market fit. V určité fázi jsme se poměrně seriózně zabývali i vytvořením fyzického produktu. Po ověření našich hypotéz, zájmu a preferencí uživatelů a dalšího učení našich modelů se nakonec ukázalo vydání asistenta jako doplňkové služby k aplikaci Seznam.cz jako nejrychlejší a nejjednodušší cesta,“ navazuje Raška.

Adam Raška, seniorní produktový manažer Seznam.cz
Autor: Seznam.cz

Adam Raška, seniorní produktový manažer Seznam.cz

V Seznamu byl na vývoj asistenta vytvořen samostatný tým, který má zkušenosti s vývojem jiných aplikací a služeb společnosti. Součástí jsou mimo jiné kapacity v oblastech fonetiky či sémantiky.

Akustický model „seznamáckého“ hlasového asistenta vychází ze standardů vyvinutých na Carnegie Mellon University v Pittsburghu (tato škola mimo jiné soupeřila s Alquistem z ČVUT v soutěži Amazonu). Originální verze neumí pracovat s češtinou, model se ale postupně ladil a v současné době už řešení využívá vlastní český akustický model.

„Seznam má díky vlastní robustní CDN a technologiím běžícím v pozadí nepřeberné množství obsahu, v mnoha případech i s titulky. Zde vstupuje do hry strojové učení pro tvorbu tezauru, mapování na fonematický slovník a kontinuální vylepšování modelu. Díky těmto technologiím máme předpoklady udělat našeho asistenta opravdu kvalitně,“ věří v Seznamu.

Tip Root školení

Moje testování hlasového asistenta od Seznamu bylo z pohledu rozpoznávání povelů bezproblémové – a to huhňám. Testování s veřejností má firmě pomoci v dalším odlaďování.

„V interních testech se nám podařilo snížit míru nesouvisejících reakcí na velmi nízkou úroveň, stejně jako ukazatel WER (Word Error Rate). Rádi bychom si na větším vzorku uživatelů tato čísla ověřili. Naši uživatelé budou službu určitě rovněž využívat v prostředích a situacích, které lze těžko nasimulovat. Až následná analýza dat nám ukáže, jak se dané metriky daří držet a zda je potřeba přemýšlet nad úpravami. Přesnost reakcí se bude kontinuálně zlepšovat se zlepšováním vlastního akustického modelu, na kterém asistent běží,“ dodává Raška.

Autor článku

Reportér serveru Lupa.cz, dříve redaktor deníku E15, týdeníku Euro a webu Connect.cz. O technologiích píše také do zahraničních médií.