Hlavní navigace

Google se vrací, tentokrát na Seznam

Marek Antoš 6. 11. 2002

Poněkud překvapivá zpráva přišla tento týden ze Seznamu, který provedl zásadní změnu svého fulltextu. Ten i nadále zůstává v jeho barvách, "vnitřnosti" jsou však od Google. Na tom by nebylo nic tak překvapivého -- kdyby to ovšem nebylo sotva pár měsíců, co se Seznam na tomtéž domluvil se společností Empyreum.

Fulltextové prohledávače kráčely v českém Internetu poněkud spletitou cestou. Na počátku českých portálů totiž stály především katalogy – U Zdroje i Seznamu zpočátku fulltextové vyhledávání chybělo. První zástupcem svého druhu se tak stal až Atlas, kterému zas pro změnu v první fázi chyběl katalog. Postupem času však provozovatelé všech portálů došli k závěru, že bez fulltextu, resp. bez katalogu nelze žít, a svá portfolia doplnili.

V případě Seznamu se jednalo o službu Kompas, kterou napsal Lukačovičův spolužák z FEL ČVUT. K dokreslení koloritu tehdejších dřevních dob snad poslouží historka, která se traduje už léta. Ivo Lukačovič si prý programátorské znalosti svého spolužáka nejprve vyzkoušel tak, že jej nechal zpracovat svůj semestrální program do školy, a když všechno dopadlo dobře, pustil ho i ke Kompasu. Také ten dopadl docela slušně a v rámci Seznamu pak běžel několik let, byť poněkud stranou hlavního zájmu – uživatelé stále hledali především prostřednictvím katalogu. Postupem času se Kompas dočkal nové verze, „držet prst na tepu doby“ však vzhledem k nízké prioritě nezvládl. Postupem času tedy dosti morálně zastaral, což se nepříznivě podepsalo na výsledcích hledání, které byly oproti konkurenci podstatně horší.

Podobně jako jiné portály se Seznam rozhodl řešit tento problém formou out-sourcingu. Volba padla na společnost Empyreum, která podobným způsobem spolupracuje i s jinými velkými servery, a letos na jaře mohly zaznít slavnostní fanfáry. Na první pohled se nezměnilo takřka nic, vyhledávání bylo stále v barvách Seznamu, uvnitř však tepala samostatná technologie. V porovnání s předchozí podobou Kompasu šlo nepochybně o výrazný posun vpřed, což uživatelé museli ocenit. Seznam se však současně postavil do jedné řady s dalšími významnými servery, které vyhledávání od Empyrea používají (především iDnes a – tehdy ještě – Atlas), což je podle mého názoru poněkud sporný krok.

Uplynulo přesně sedm měsíců a všechno je jinak. Za zvuku neméně slavných fanfár Seznam oznámil svou spolupráci s Googlem, a tím také jaksi v tichosti ukončil využívání služeb Empyrea. Tisková zpráva neskrývá radost z toho, že se Seznamu podařilo získat velmi kvalitní technologii. Nadšení tryská i z formulace, že ji Seznam používá „jako první a jediný v České republice“, což okamžitě vyvolalo nesouhlasnou reakci z Contactelu. Jako první jej totiž ve svých barvách nabízel RedBox, který však posléze v rámci úsporných opatření spolupráci omezil a k hledání v českém Internetu nyní také využívá fulltext od Empyrea. Pro hledání v zahraničním Internetu je však na RedBoxu Google stále dostupný.

Nepovažuji se za velkého odborníka ve světě vyhledávání, takže dost dobře nemohu porovnat kvality obou vyhledávačů a zhodnotit krok Seznamu z tohoto odborného pohledu. Často se uvádí argument, že české fulltexty mají k českému Internetu „blíž“, takže mohou nabídnout lepší a aktuálnější výsledky než „světový“ Google. Čistě na základě svých vlastních zkušeností bych si však dovolil s tímto názorem polemizovat – výsledky Google jsou i při hledání českých stránek často relevantnější. Důkazem je ostatně i to, že jej pro hledání v českém Internetu používá velká část uživatelů, kteří díky jeho české mutaci ovládání nemají důvod sahat po žádném z českých fulltextů. Velmi oblíbený byl ostatně i Google na RedBoxu, kterému přinášel slušné množství uživatelů.

Výhodou Google proti Empyreu nebo jiným českým řešením může být také větší databáze zdrojů, pravidelné indexování, ochrana před zahlcováním a propracovaná pravidla zodpovídání dotazů. Proti AllTheWeb (který využívá i české Tiscali) a další zahraniční konkurenci má navíc Google v kapse velmi silnou zbraň, které se říká Google Page Rank – tedy hodnocení relevance stránek podle počtu odkazů z jiných serverů. Přirozenou výhodou je také to, že se neomezuje na českou doménu, ale na český jazyk, ať už jsou česky psané stránky uložené kdekoliv – v tom mu lokální vyhledavače dost dobře nemohou konkurovat.

Funkční priority však nepochybně nebyly tím hlavním, co Seznam vedlo k rozhodnutí o změně – kdyby tomu tak bylo, měl by Google už od jara. Jak mi potvrdil Roman Hloušek ze Seznamu, hlavní příčinou byla změna postoje ze strany Google. Přeloženo do češtiny: po mnohaměsíčním vyjednávání nakonec Google přistoupil na podmínky, které jsou pro Seznam přijatelné. Vzhledem ke kontextu se patrně jedná především o finanční otázky – oproti tomu, jak vypadá standardní ceník Googlu, prý Seznam podle Hlouška získal výrazně nadstandardní podmínky.

V českém Internetu už se v této souvislosti objevily spekulace o tom, že se tímto způsobem Seznam snaží řešit své finanční problémy a dražší technologii od Empyrea nahrazuje levnějším řešením. Tento směr uvažovaní je podle mého názoru poněkud zavádějící: Seznam už přinejmenším rok ukazuje celému trhu, jak se dá prodávat internetová reklama, a odčerpává nemalou část celkového koláče příjmů. Kromě toho je dost pochybné, zda je Google doopravdy levnější než Empyreum – úsporný krok RedBoxu, který směřoval přesně opačným směrem než Seznam, o těchto relacích naznačuje něco jiného.

Pokud jde o oficiální ceníky, v základním měsíčním poplatku se Empyreum a Google neliší (v obou případech je to za současného kurzu dolaru 60.000 korun měsíčně), avšak ceny za vyhledání dotazu jsou údajně u Google vzdor posílení kurzu koruny stále o něco vyšší. „Ceníkový“ Google Gold nyní přijde na 240 Kč za tisíc obsloužených dotazů, u Empyrea nejsou ceny veřejné. S ohledem na slevu, kterou Seznam podle Hlouška dostal, však výsledná cena může vypadat výrazně odlišně – a nikdo neví, jak moc.

Zajímavé teď bude sledovat vývoj fulltextů u dalších serverů. Vedle Empyrea, které svoji službu dodává především již zmíněnému iDnesu a RedBoxu, je v českém Internetu dostupná také technologie WebFast, kterou vyvinulo Centrum a v současné době funguje i na Atlasu. Do hry by však mohl promluvit i nový vyhledávač Jyxo, který po svém odchodu z Empyrea spustil jeho někdejší společník Michal Illich, dosud se však u žádného portálu neprosadil. Vzdor kvalitní indexaci je poněkud mimo také Megatext, který funguje jen na Quicku. V neposlední řadě je však třeba počítat i s Googlem – smlouva se Seznamem totiž není exkluzivní a jeho obchodníci by určitě uvítali úspěch i u dalších českých portálů.

Spoluautorem tohoto článku je Martin Kopta.

Anketa

Komu prospěje implementace Google na Seznamu nejvíc?

Našli jste v článku chybu?

12. 11. 2002 18:21

Marek Turnovec (MaT) (neregistrovaný)
No, ja kdysi zjistil, ze s php je jeste jeden zpusob... :-) Nikde jsem to pak tedy nezrealizoval, jen jako takovou testovaci hracku, ale kdyz to tady tak ctu, tak to asi pouzivat zacnu. :-)

O co tedy jde - mel jsem skript, pojmenovany treba index.php - no a URL pak treba takhle:

http://server.cz/index.php/1234

Co to delalo? Pustilo to skript index.php. No a v nem jsem si z nejake promene vytahl, jake bylo puvodni URL a z nej vytahl to, co bylo za nazvem skriptu... Mel jsem tam nejdriv n…





12. 11. 2002 1:22

Martin Kopta (neregistrovaný)
Jenže on tam není jen lanius. :-( Když napíšu -url:lanius, zůstane mi tam clavius. Přidám i -url:clavius, ale stejně při vyhledávání "Otokar Chlup" -url:lanius -url:clavius zůstane ve výsledcích spousta knihoven. Nejlepším řešením by bylo něco jako "Otokar Chlup" -source:library. Zkuste si najít něco o prvním děkanovi naší fakulty, aby to nebyla jen jeho bibliografie. :-((
Měšec.cz: Vklad na cizí účet je draze zpoplatněn (přehled)

Vklad na cizí účet je draze zpoplatněn (přehled)

Měšec.cz: Kdy vám stát dá na stěhování 50 000 Kč?

Kdy vám stát dá na stěhování 50 000 Kč?

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

DigiZone.cz: Česká televize mění schéma ČT :D

Česká televize mění schéma ČT :D

Vitalia.cz: Znáte „černý detox“? Ani to nezkoušejte

Znáte „černý detox“? Ani to nezkoušejte

Podnikatel.cz: Babiše přesvědčila 89letá podnikatelka?!

Babiše přesvědčila 89letá podnikatelka?!

DigiZone.cz: Recenze Westworld: zavraždit a...

Recenze Westworld: zavraždit a...

Podnikatel.cz: 3, 2, 1..EET startuje. Na co nezapomenout?

3, 2, 1..EET startuje. Na co nezapomenout?

Měšec.cz: Air Bank zruší TOP3 garanci a zdražuje kurzy

Air Bank zruší TOP3 garanci a zdražuje kurzy

DigiZone.cz: Milan Kruml: procházka TV historií

Milan Kruml: procházka TV historií

Root.cz: Telegram spustil anonymní blog Telegraph

Telegram spustil anonymní blog Telegraph

Lupa.cz: Google měl výpadek, nejel Gmail ani YouTube

Google měl výpadek, nejel Gmail ani YouTube

Podnikatel.cz: Na poslední chvíli šokuje vyjímkami v EET

Na poslední chvíli šokuje vyjímkami v EET

Lupa.cz: UX přestává pro firmy být magie

UX přestává pro firmy být magie

Lupa.cz: Babiš: E-shopů se EET možná nebude týkat

Babiš: E-shopů se EET možná nebude týkat

120na80.cz: Rovnátka, která nejsou vidět

Rovnátka, která nejsou vidět

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

Podnikatel.cz: Zavře krám u #EET Malá pokladna a Teeta?

Zavře krám u #EET Malá pokladna a Teeta?

Podnikatel.cz: Přivýdělek u Airbnb nebo Uberu? Čekejte kontrolu

Přivýdělek u Airbnb nebo Uberu? Čekejte kontrolu

Vitalia.cz: Chtějí si léčit kvasinky. Lék je jen v Německu

Chtějí si léčit kvasinky. Lék je jen v Německu