Wolfram Alpha proti Google a s médii

Média pasovala nově spuštěnou službu Wolfram Alpha na googlebijce. Z části z pohodlnosti, z části pragmaticky. Ve skutečnosti se Wolframu podařilo hlavně získat pozornost k novému druhu služby.

Zatímco Tn.cz soudí, že převratný vynález slibuje revoluci v Internetu, mezinárodní International Business Time použil lákavý titulek Wolfram Alpha: A potential ‚Google Killer‘?

Obecným i ekonomickým titulům lze podobné úskoky odpustit. Běžný čtenář zná Google, chápe, že to má něco společného s vyhledáváním a Internetem, tedy jeho potenciální zabiják bude také něco na Internetu a s vyhledáváním. Což je zhruba pravdivá informace a asi maximum informací, které by si měl o Wolframu odnést běžný uživatel. Titulek Wolfram Alpha se pokouší aplikovat AI dotazovou vrstvu nad sémanticky analyzovanou databází by sice byl věcně správnější, ale o jeho obecné srozumitelnosti lze s úspěchem pochybovat.

Wolfram Alpha je webovou službou, která obsahuje vlastní databáze a vlastní analýzu dotazů. Lze mu položit otázku zhruba přirozeným jazykem (anglicky) a výsledkem není změť stránek, ale konkrétní informace představená v přehledné formě. Tedy zjednodušeně řečeno něco mezi Googlem a Wikipedií.

Už z tohoto popisu cítíme dva maličké zádrhele, které spoludefinují použitelnost takové služby:

  • analýza přirozeným jazykem položené otázky,
  • aktuálnost, rozsáhlost a schopnost kombinování informací uložených v databázi.

S první nástrahou se pokouší Wolfram Alpha vyrovnat především pomocí testovacího provozu, kdy má být zkoumáno, jaké skutečné otázky lidé pokládají a jak je formulují. Podle toho mají být rozpoznávání a analýza dotazů upraveny. Názory recenzentů ale většinou připouštějí, že WA v analýze dotazů příliš neexceluje, a to i za předpokladu, že mu nepokládáte složité otázky, souvětí, ale jen jednoduché věty.

Druhá nástraha zvláště nepříjemná. Zatímco syntaxi pro dotazy se lze naučit, důvodem k učení musí být udržovaná databáze. Na té měl tým Wolframu pracovat pět let a naplnil ji informacemi z řady oborů, jenže otázka zní, jak to bude s udržováním databáze? Již dnes se objevují námitky, že například dotazy na HDP vyřizuje WA s daty za rok 2006 (v případě ČR za rok 2007), zatímco Googlem lze dohledat data za první čtvrtletí roku 2009. To je samozřejmě nemilá výtka.

Wolfram Alpha HDP pro ČR

Vcelku slušný ekonomický přehled na dotaz o HDP České republiky. Zdroj: Wolfram Alpha

O tom, jakým způsobem WA databáze udržuje, je známo pramálo. Pravděpodobně jde o jednorázové importy od partnerů jednou za čas spojené s postprodukcí dat. Nikoliv tedy o modlu moderního webu: sémantické vyhledávání zajištěné analýzou na webu dostupných dat a jejich taxonomizaci v rámci databáze.

Sémantické vyhledávače

Sémantický vyhledávač se pokusí pochopit otázku a pokusí se na ni předat konkrétní výsledek získaný analýzou prohledávaných stránek. Tedy nikoliv výslovně stránku, ale rovnou odpověď. I proto je často WA zaměňován za sémantický vyhledávač, ačkoliv v čistém pojetí tohoto výrazu by taková služba měla pracovat nad množinou dat na Internetu, nikoliv v interní databázi, kde se takové psí kusy dělají podstatně snáze. Záměnu je ale zatěžko vyhledávat, jak skutečně WA získává data, není známo.

Sémantických vyhledávačů na Internetu už pár je, většinou ve stádiu technologického dema (=výstavka pro potenciální investory). Příkladem může být Powerset, jenž kýženého dosáhl – nevyhledává sice nic moc, ale koupil jej Microsoft. Hakia takové štěstí ještě neměla. Zkuste jim položit jednoduchou otázku, například „What is the actual progress in 4G LTE?“ – jednoduché odpovědi se nedočkáte.

Jinak na to jde například Cognition. Ten dobrovolně rezignoval (alespoň prozatím) na všeobjímající vědomosti a vybral si tři témata, kterým rozumí: Právo, Medicínu a Bibli. Plus dotazovací rozhraní nad Wikipedií. Se specializací se to lépe táhne.

Google Squared

Google se málokdy nechá vyprovokovat k uspíšení plánů. Zdá se, že Wolfram Alpha mu hnul žlučí, či spíše mediální pozornost a přízviska, jakých se projektu WA dostalo. Nepřekvapuje to, vyhledávání je hlavní aktivum Google a kdyby přišel do řečí, že mu ujíždí vlak, mohlo by se to nepříjemně odrazit třeba na kurzu akcií. A tak se ven prosákly (na akci Searchology) informace o projektu Google Squared (GS), což má být firemní testovací verze sémantického vyhledávače. Ta se v Labs objeví v nejbližší době.

Squared odpovědi na otázky zabalíčkuje do tabulky. Pokud mu dáte dotaz small dog, odpoví vám tabulkou s charakteristikou malých psů, viz příklad níže.

Google Squared

Výsledek dotazu small dog do Google Square, klikněte pro větší obrázek.

Pokud by vás zajímalo, co si pod dotazem malý pes představuje Wolfram Alpha: ten briskně odhadne, že jste měli na mysli souhvězdí Canis Minor, Malý pes – a zobrazí informace o něm.

Problém samozřejmě je v použitelnosti takové služby. I proto zůstane zatím v rámci Google Labs, protože najdete jen málo praktických případů, kdy byste mohli potřebovat tabulku nějakých nepredikovatelně vybraných malých psů a ovlivnit, zda chcete psy štěkací, nebo souhvězdní, je zatím těžké. K tomu je zapotřebí zpracování přirozeného jazyka (NLP) – a k němu i u WA i v případě GS ještě povede dlouhá cesta.

Přínos Wolfram Alpha

Projektu WA se podařilo na sebe na pár dní strhnout pozornost médií. Přispěl k tomu charismatický zakladatel společnosti Stephen Wolfram, jehož předchází pověst někdejšího geniálního dítěte a nynějšího geniálního fyzika a matematika, specialisty na celulární automaty. Jeho program Mathematica je pro většinu matematiků a fyziků jednou ze základních pomůcek, která nahradila logaritmické pravítko. Mathematica je také jedním z pilířů WA – její obrovská báze vzorců, výpočetních postupů, její architektura a způsob generování reportů.

EBF16

S takovou pověstí byste pozornost médií získali i na triviálnější věc, než nový typ vyhledávače. Wolfram Alpha totiž není ani sémantický vyhledávač, ani ten klasický. Vytvořil svoji vlastní skupinu, znalostní vyhledávač, takový vyhledávač, který pracuje s předpřipravenými, naučenými bázemi dat. A jak v jednom z rozhovorů prohlásil Stephen Wolfram, nyní už je to stejné, jako u člověka: naučit ho se učit.

O učení se učit bude další krok. Bez něj se Wolfram Alpha stane zajímavou pomůckou pro matematiky, fyziky, ekonomy a geeky, dveře do ostatních pater internetových uživatelů mu pak ale zůstanou zavřeny. Což nutně nemusí znamenat neúspěch ani obchodní, ani faktický. Mathematica se také velmi dobře prodává a svého autora skvěle uživí, aniž by ji používaly široké vrstvy obyvatelstva…

Anketa

Co říkáte na Wolfram Alpha?

8 názorů Vstoupit do diskuse
poslední názor přidán 21. 5. 2009 19:54

Školení: Právo vs. online marketing

  •  
    Jak chránit vlastní značku a obsah.
  • Jak využívat cizí díla pro svoje prezentace.
  • Na co si dát pozor při tvorbě reklamy na internetu.

Více o školení Právo vs. online marketing »