Hlavní navigace

Kam směřují vyhledávače?

26. 11. 2004
Doba čtení: 6 minut

Sdílet

Všichni umíme používat fulltextové vyhledávače. Průměrně dvakrát položíme různé dvouslovné dotazy. Mezi výsledky (ne)najdeme odpověď podle toho, jestli jsme uhodli, jak se zeptat, nebo jestli vyhledávač uhodl, jak nám odpovědět. Připomíná to hádání z křišťálové koule. Jak se tedy hádá dnes a jak tomu bude zítra?

Možná jste zaznamenali, že se Googlu nedávno podařilo překonat krásně kulaté číslo, když rozšířil svůj index na osm miliard různých stránek. (Kdo má raděj kulatá čísla dvojkové soustavy, ať si přečte článek Dušana Janovského Skrytá změna architektury Google.) Není náhoda, že to bylo ve stejný den, kdy Microsoft zpřístupnil vylepšenou betaverzi nového vyhledávače msn Search. Ta má zatím v šuplíku pět miliard stránek, což je docela slušný pokrok v porovnání s červencovou jednou miliardou. Pro zajímavost, u obrázků jsou čísla následující: Yahoo – jedna miliard, Google – 880 milionů a msn Search 400 milionů.

Na velikosti přece nezáleží

Většina lidí ale tuší, že hlavní kouzlo vyhledávání není v počtu prohledávaných (robotem indexovaných) stránek. Pomůže při hledání málo publikovaných informací a přesných frází (třeba jména osoby, o které se potřebujeme něco dozvědět). Naopak ale může být na škodu, když zhorší relevanci odpovědí a rychlost hledání. Dnes platí, že hledání je věda. Jen ten, kdo se umí zeptat, dostane lepší sadu stránek, mezi kterými se skrývá odpověď. Jednou bude kouzlo objeveno, vyhledávače porozumí dotazu a odpovídajícím způsobem připraví odpovědi. Pak se budou umět ptát všichni – malá sci-fi vsuvka –, nebude-li ovšem sdílení vědomostí natolik kolektivní, že otázek vůbec nebude třeba.

V bližší budoucnosti se o co nejlepší výsledky, uživatele a hlavně příjmy z reklamy poperou tři hlavní soupeři. Microsoft prozatím spolupracuje s jedním ze svých budoucích konkurentů, do června 2005 by měl využívat vyhledávacích algoritmů firmy Yahoo. Ta k výsledkům přidává sponzorované odkazy zprostředkované svou dceřinou společností Overture. (Je to trošku zamotané: Yahoo podle všeho vydělává jak prodejem vyhledávací technologie, tak zobrazováním reklamních odkazů, z nichž některé si kupuje Microsoft (dále jen MS), který tak platí za svoji propagaci na vlastních stránkách.) Dominantní postavení na trhu se bude snažit udržet Google s pomocí AdWords a AdSense.

Výhrou bude ovládnutí desktopu

Věřím, že MS – jako už mnohokrát – využije svého výjimečného postavení, vyhledávání začlení do Windows a získá tím velké procento uživatelů. Firmu Lookout software, která vyvíjela vyhledávací program integrovaný s MS Outlookem, koupil MS už před časem a pravděpodobně jej asimiluje do připravovaného nástroje MSN Toolbar Suite. Ten zpřístupní vyhledávání na několika místech Windows (Internet Explorer (dále jen IE), nabídka Start, Outlook). Zatím z Redmondu unikl jen popis a několik screenshotů, ale do konce roku bychom se mohli dočkat betaverze. Konkurence je o krok napřed a učí uživatele používat svoje nástroje.

Začalo to různými toolboxy pro IE, rozšířeními a integrací vyhledávání do moderních prohlížečů a pokračuje k udělátkům, jakým je Googlův Desktop search nebo blinkx. Pro počítače Apple je vyvíjen vyhledávač Spotlight, kterému usnadňuje práci existence metadat, která Mac OS X pro soubory udržuje. Představitelé Yahoo se nechali slyšet, že na desktop míří také, a koupili firmu Statalabs, která vyvíjela poštovního klienta s detekcí spamu a vyhledáváním. AOL integruje podobnou službu do webového prohlížeče, který připravuje. Zůstanou-li tyto programy pro běžné uživatele snadno použitelné, máme před sebou zajímavý souboj.

Zkoumání našich zájmů bude v pozadí této bitvy. Když necháme prohlížeče nahlížet do svého soukromí, ať už jsou to dokumenty v našem počítači, nebo pošta na freemailu, odmění se nám cílenou reklamou a lepším hledáním. Když budou vědět, že používám Linux, zohlední to, až budu hledat recenze počítačových komponent. Jak naloží se jménem mé tchýně za svobodna, si zatím nedovedu představit.

Klíčem je inovace

Mezitím se bude bojovat na dalších frontách vylepšujících uživatelský prožitek (user experience). Vylepšení by měla přesvědčit i ty lidi, kteří dnes neradi hledají (lépe řečeno neradi vymýšlí dotazy), oblíbili si adresáře a stačí jim přístup k informacím klasickým procházením stránek. Některá vylepšení a nové přístupy se testují už dnes:

  • vyhledávání omezené podle geografického umístění, jehož oblíbenost vzrůstá se zvyšováním mobility,
  • personalizované hledání (slovy klasika „podle chuti každého soudruha“), např. eurekster odhaduje zájmy vaše a vašich kamarádů („social network“).
  • hledání nových informací („news alert“ a „new relevant pages“), k otestování na Google Alerts i u serverů s vlastním obsahem (News.com),
  • interaktivní hledání s kontrolou výsledků v reálném čase (jak to zkouší Orase).

Zároveň neustává boj proti „search engine spamu“, který produkují SEO šílenci a změny samotných vyhledávacích algoritmů. Při výhledu do vzdálenější budoucnosti se můžeme těšit na zemětřesení, které přinese vizualizace výsledků, ovládání počítače hlasem a pokrok ve zpracování přirozeného jazyka.

Porozumění dotazu

Když zatím není vidět hledajícím lidem do hlavy přímo, musí se přibližovat výsledky jejich zájmům oklikou přes jazyk, kterým komunikují. Výzkumu v této oblasti se věnuje i laboratoř NLP, na Fakultě informatiky MU. Nedávno mě nadchl jeden z projektů, který je testován také na vyhledávání v univerzitním Informačním systému. Dialogového systému UOI se zeptáte „Kdo učí sítě?“ a dostanete odpověď. Dotazy se mohou týkat různých oblastí, od rozvrhů přes kontakty až k poště. Kvůli ochraně osobních údajů se většiny odpovědí dočkáte, jen pokud máte přístup k informačnímu systému.

V praxi si můžete povídat s vyhledávačem Ask Jeeves. Zkuste zadat „What does something mean?“, „Ask Jeeves stock quote“, „Address of John Smith in New York“ nebo „Prague flight delays“. Šikovný je seznam souvisejících dotazů, který přidává k výsledkům (třeba pro výraz „web“ nabídne deset slovních spojení, mezi nimi Spider Web, World Wide Web nebo Web Hosting).

Ofenzíva portálů

Přidávání hodnotného obsahu k výsledkům vyhledávání nasazují portály. AOL po dvou letech vývoje představila Snapshots. Pokud se dotaz shoduje s některým z 2,2 mil. vybraných výrazů, k výsledkům se přidají relevantní informace. Někdy jsou připraveny ručně a jindy využívají propojení s oblastí, které se věnuje některá ze sesterských „média společností“, vlastněná konglomerátem Time Warner. Jde hlavně o zábavní průmysl (desítky webů), ale i zprávy (CNN) nebo informace o firmách (burzovní zprávy, žluté stránky). Yahoo provozuje Search Shortcuts, což jsou klíčová slova, jejichž přidáním k dotazu se ve výsledcích zobrazí extra informace před běžnými výsledky hledání.

WT100

I když to není jeho záměrem, začínají lidé díky rozšiřování služeb Google vnímat jako zvláštní portál. Kromě variací zažitých služeb (Gmail, katalog) má v repertoáru i několik specialit (Answers, Groups, Alerts). Šušká se, že se chystá i na instant messaging. Zajímavé jsou nástroje a programy, které Google koupil a podporuje jejich vývoj a integraci do svých služeb (jen výčtem: Blogger, Keyhole, Picasa). Pod pokličku MS je možné nahlédnout na jejich pískovišti, kde kromě zmíněného Lookoutu je zajímavý nástroj pro komunikaci malých komunit.

A malá perlička na závěr. Ve čtvrtek uspořádal Google párty při příležitosti otevření nové vývojové kanceláře v Kirklandu. Podle různých blogů asi 20 zaměstnanců hostilo stovky lidí, z nichž snad polovina byli zaměstnanci MS, včetně těch, kteří se podílí na vývoji MSN Search. Nemají to z Redmondu daleko, jen něco přes 10 km. Proslulé pracovní prostředí, které si z části mohli během večera prohlédnout, je možná přiměje uvažovat o změně zaměstnavatele a následovat tak několik bývalých spolupracovníků. Však také místo si Google zvolil právě s ohledem na koncentraci IT odborníků – v dosahu washingtonské univerzity a nedaleko firem jako Amazon.com (vyhledávač A9) nebo RealNetworks.

Podaří se konkurenci překonat dominantní postavení Googlu?

Byl pro vás článek přínosný?

Autor článku

Autora baví grafický design, analýza a implementace webových aplikací. Má nechutný smysl pro detail a špatnou paměť. Po praktické střední škole. Se zaměřil na aplikovanou informatiku.
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).