Hlavní navigace

Wolfram Alpha proti Google a s médii

 Autor: 21971
Patrick Zandl

Média pasovala nově spuštěnou službu Wolfram Alpha na googlebijce. Z části z pohodlnosti, z části pragmaticky. Ve skutečnosti se Wolframu podařilo hlavně získat pozornost k novému druhu služby.

Zatímco Tn.cz soudí, že převratný vynález slibuje revoluci v Internetu, mezinárodní International Business Time použil lákavý titulek Wolfram Alpha: A potential ‚Google Killer‘?

Obecným i ekonomickým titulům lze podobné úskoky odpustit. Běžný čtenář zná Google, chápe, že to má něco společného s vyhledáváním a Internetem, tedy jeho potenciální zabiják bude také něco na Internetu a s vyhledáváním. Což je zhruba pravdivá informace a asi maximum informací, které by si měl o Wolframu odnést běžný uživatel. Titulek Wolfram Alpha se pokouší aplikovat AI dotazovou vrstvu nad sémanticky analyzovanou databází by sice byl věcně správnější, ale o jeho obecné srozumitelnosti lze s úspěchem pochybovat.

Wolfram Alpha je webovou službou, která obsahuje vlastní databáze a vlastní analýzu dotazů. Lze mu položit otázku zhruba přirozeným jazykem (anglicky) a výsledkem není změť stránek, ale konkrétní informace představená v přehledné formě. Tedy zjednodušeně řečeno něco mezi Googlem a Wikipedií.

Už z tohoto popisu cítíme dva maličké zádrhele, které spoludefinují použitelnost takové služby:

  • analýza přirozeným jazykem položené otázky,
  • aktuálnost, rozsáhlost a schopnost kombinování informací uložených v databázi.

S první nástrahou se pokouší Wolfram Alpha vyrovnat především pomocí testovacího provozu, kdy má být zkoumáno, jaké skutečné otázky lidé pokládají a jak je formulují. Podle toho mají být rozpoznávání a analýza dotazů upraveny. Názory recenzentů ale většinou připouštějí, že WA v analýze dotazů příliš neexceluje, a to i za předpokladu, že mu nepokládáte složité otázky, souvětí, ale jen jednoduché věty.

Druhá nástraha zvláště nepříjemná. Zatímco syntaxi pro dotazy se lze naučit, důvodem k učení musí být udržovaná databáze. Na té měl tým Wolframu pracovat pět let a naplnil ji informacemi z řady oborů, jenže otázka zní, jak to bude s udržováním databáze? Již dnes se objevují námitky, že například dotazy na HDP vyřizuje WA s daty za rok 2006 (v případě ČR za rok 2007), zatímco Googlem lze dohledat data za první čtvrtletí roku 2009. To je samozřejmě nemilá výtka.

Wolfram Alpha HDP pro ČR

Vcelku slušný ekonomický přehled na dotaz o HDP České republiky. Zdroj: Wolfram Alpha

O tom, jakým způsobem WA databáze udržuje, je známo pramálo. Pravděpodobně jde o jednorázové importy od partnerů jednou za čas spojené s postprodukcí dat. Nikoliv tedy o modlu moderního webu: sémantické vyhledávání zajištěné analýzou na webu dostupných dat a jejich taxonomizaci v rámci databáze.

Sémantické vyhledávače

Sémantický vyhledávač se pokusí pochopit otázku a pokusí se na ni předat konkrétní výsledek získaný analýzou prohledávaných stránek. Tedy nikoliv výslovně stránku, ale rovnou odpověď. I proto je často WA zaměňován za sémantický vyhledávač, ačkoliv v čistém pojetí tohoto výrazu by taková služba měla pracovat nad množinou dat na Internetu, nikoliv v interní databázi, kde se takové psí kusy dělají podstatně snáze. Záměnu je ale zatěžko vyhledávat, jak skutečně WA získává data, není známo.

Sémantických vyhledávačů na Internetu už pár je, většinou ve stádiu technologického dema (=výstavka pro potenciální investory). Příkladem může být Powerset, jenž kýženého dosáhl – nevyhledává sice nic moc, ale koupil jej Microsoft. Hakia takové štěstí ještě neměla. Zkuste jim položit jednoduchou otázku, například „What is the actual progress in 4G LTE?“ – jednoduché odpovědi se nedočkáte.

Jinak na to jde například Cognition. Ten dobrovolně rezignoval (alespoň prozatím) na všeobjímající vědomosti a vybral si tři témata, kterým rozumí: Právo, Medicínu a Bibli. Plus dotazovací rozhraní nad Wikipedií. Se specializací se to lépe táhne.

Google Squared

Google se málokdy nechá vyprovokovat k uspíšení plánů. Zdá se, že Wolfram Alpha mu hnul žlučí, či spíše mediální pozornost a přízviska, jakých se projektu WA dostalo. Nepřekvapuje to, vyhledávání je hlavní aktivum Google a kdyby přišel do řečí, že mu ujíždí vlak, mohlo by se to nepříjemně odrazit třeba na kurzu akcií. A tak se ven prosákly (na akci Searchology) informace o projektu Google Squared (GS), což má být firemní testovací verze sémantického vyhledávače. Ta se v Labs objeví v nejbližší době.

Squared odpovědi na otázky zabalíčkuje do tabulky. Pokud mu dáte dotaz small dog, odpoví vám tabulkou s charakteristikou malých psů, viz příklad níže.

Google Squared

Výsledek dotazu small dog do Google Square, klikněte pro větší obrázek.

Pokud by vás zajímalo, co si pod dotazem malý pes představuje Wolfram Alpha: ten briskně odhadne, že jste měli na mysli souhvězdí Canis Minor, Malý pes – a zobrazí informace o něm.

Problém samozřejmě je v použitelnosti takové služby. I proto zůstane zatím v rámci Google Labs, protože najdete jen málo praktických případů, kdy byste mohli potřebovat tabulku nějakých nepredikovatelně vybraných malých psů a ovlivnit, zda chcete psy štěkací, nebo souhvězdní, je zatím těžké. K tomu je zapotřebí zpracování přirozeného jazyka (NLP) – a k němu i u WA i v případě GS ještě povede dlouhá cesta.

Přínos Wolfram Alpha

Projektu WA se podařilo na sebe na pár dní strhnout pozornost médií. Přispěl k tomu charismatický zakladatel společnosti Stephen Wolfram, jehož předchází pověst někdejšího geniálního dítěte a nynějšího geniálního fyzika a matematika, specialisty na celulární automaty. Jeho program Mathematica je pro většinu matematiků a fyziků jednou ze základních pomůcek, která nahradila logaritmické pravítko. Mathematica je také jedním z pilířů WA – její obrovská báze vzorců, výpočetních postupů, její architektura a způsob generování reportů.

S takovou pověstí byste pozornost médií získali i na triviálnější věc, než nový typ vyhledávače. Wolfram Alpha totiž není ani sémantický vyhledávač, ani ten klasický. Vytvořil svoji vlastní skupinu, znalostní vyhledávač, takový vyhledávač, který pracuje s předpřipravenými, naučenými bázemi dat. A jak v jednom z rozhovorů prohlásil Stephen Wolfram, nyní už je to stejné, jako u člověka: naučit ho se učit.

O učení se učit bude další krok. Bez něj se Wolfram Alpha stane zajímavou pomůckou pro matematiky, fyziky, ekonomy a geeky, dveře do ostatních pater internetových uživatelů mu pak ale zůstanou zavřeny. Což nutně nemusí znamenat neúspěch ani obchodní, ani faktický. Mathematica se také velmi dobře prodává a svého autora skvěle uživí, aniž by ji používaly široké vrstvy obyvatelstva…

Anketa

Co říkáte na Wolfram Alpha?

Našli jste v článku chybu?

21. 5. 2009 19:54

flukas (neregistrovaný)
Mathematica ty data taky nabízí (a rovnou s nima může počítat). Ta oblast dat je zatím bohužel dost omezená.

20. 5. 2009 16:04

marast (neregistrovaný)
bude propojeni google a wolframu, respektive kombinaci nalezenych G stranek a odpovedi z W.

preji hodne stesti singularite!

Podnikatel.cz: Zařízení pro EET zbytečně, vrátí vám peníze

Zařízení pro EET zbytečně, vrátí vám peníze

DigiZone.cz: Zdeněk Gerlický: nový ředitel nangu.tv

Zdeněk Gerlický: nový ředitel nangu.tv

DigiZone.cz: Sat novinky: Je tu Sky Sport News HD

Sat novinky: Je tu Sky Sport News HD

Vitalia.cz: Potvrzeno: Pobyt v lese je skvělý na imunitu

Potvrzeno: Pobyt v lese je skvělý na imunitu

Root.cz: Firefox hodí za rok přes palubu stará rozšíření

Firefox hodí za rok přes palubu stará rozšíření

120na80.cz: Popraskané rty? Některé balzámy stav zhoršují

Popraskané rty? Některé balzámy stav zhoršují

Root.cz: Kamery Sony se dají ovládnout na dálku

Kamery Sony se dají ovládnout na dálku

Root.cz: Telegram spustil anonymní blog Telegraph

Telegram spustil anonymní blog Telegraph

Vitalia.cz: To nejhorší při horečce u dětí: Febrilní křeče

To nejhorší při horečce u dětí: Febrilní křeče

120na80.cz: Stoná vaše dítě často? Upravte mu jídelníček

Stoná vaše dítě často? Upravte mu jídelníček

120na80.cz: Co všechno ovlivňuje ženskou plodnost?

Co všechno ovlivňuje ženskou plodnost?

DigiZone.cz: Vedení ČRo: personální změny od ledna

Vedení ČRo: personální změny od ledna

Lupa.cz: Teletext je „internetem hipsterů“

Teletext je „internetem hipsterů“

Měšec.cz: U levneELEKTRO.cz už reklamaci nevyřídíte

U levneELEKTRO.cz už reklamaci nevyřídíte

Podnikatel.cz: Chaos u EET pokračuje. Jsou tu další návrhy

Chaos u EET pokračuje. Jsou tu další návrhy

Podnikatel.cz: Vládu obejde, kvůli EET rovnou do sněmovny

Vládu obejde, kvůli EET rovnou do sněmovny

DigiZone.cz: Mňam TV splnila slib a odešla z DVB-T

Mňam TV splnila slib a odešla z DVB-T

Root.cz: Nová třída SD karet A1 s vysokým výkonem

Nová třída SD karet A1 s vysokým výkonem

Měšec.cz: Air Bank zruší TOP3 garanci a zdražuje kurzy

Air Bank zruší TOP3 garanci a zdražuje kurzy

Měšec.cz: Vklad na cizí účet je draze zpoplatněn (přehled)

Vklad na cizí účet je draze zpoplatněn (přehled)