Seznam přichází na Atlas, co bude dál?

Atlas minulý týden oznámil, že pro fulltextové vyhledávání nasadil technologii svého konkurenta - Seznamu. Média pak věnovala události poměrně velikou pozornost, hovořilo se dokonce o „spojení proti vyhledávači Google“. Zeptali jsme se zúčastněných na některé detaily a přinášíme i odpovědi na otázky, jaké bude vyhledávací Seznam API i jeho nový fulltext pod názvem „1G“.

Jyxo z Atlasu neodešlo úplně

Atlas si vybral Seznam v řádném výběrovém řízení. Jak Lupě sdělil manažer marketingu Atlasu Martin Březina, tohoto řízení se zúčastnily, vedle Seznamu, též společnosti Google a Jyxo, která dodávala technologii vyhledávání do konce čevence 2007. Michal Illich, majoritní vlastník Jyxa, však nevidí nynější pozici jako odchod z Atlasu. Jyxo dodávalo do konce července Atlasu pět služeb hledání: českých stránek, zboží, obrázků, databázových záznamů a slovenských stránek. Od počátku srpna dodává jen čtyři služby – všechny jmenované kromě hledání českých stránek, sdělil Lupě Michal Illich.

Jyxo, fungující přímo na adrese www.jyxo.cz a vyřizující nyní podle Illichových slov řádově miliony vyhledávání měsíčně, předvedlo kdysi kvality svého fulltextu i na Seznamu, kde bylo nasazeno pro vyhledávání od prosince 2003, když vystřídalo Google, byť výměna neprobíhala zcela hladce (viz článek Marka Prokopa Seznam mění Google za Jyxo, Jyxo za Google). Na Seznamu se dodnes setkávají (oprava: 6. srpna, Aleš Miklík) do 30. dubna 2006 uživatelé setkávali s technologií firmy Jyxo při vyhledávání zboží v e-shopech a Jyxo je podepsáno i pod technologií pro seznamácký kontextový PPC (pay-per-click) reklamní systém Sklik.cz. Seznam není soběstačný ani při hledání obrázků, pro které využívá švédskou technologii Picsearch.

Technologická, či mediální firma?

České i světové vyhledávače, které si časem, jak na sebe nabalovaly další služby, začaly říkat portály, můžeme podle jistých atributů rozdělit do dvou skupin. V první skupině jsou ty, které mají své vlastní vyhledávací technologie. Těch se drží a do jejich vývoje investují nemalé prostředky. Z českých mezi ně patří dvojka našeho trhu, společnost NetCentrum, a její fulltextový vyhledávač Morfeo, dříve poskytovaný pod jménem WebFast. Pro týdeník Euro, který vyšel 16. června 2003, řekl Ondřej Tomek z NetCentra, že každoročně budou investovat do dalšího vývoje Morfea částku pohybující se kolem deseti milionů korun. NetCentrum je dnes jediným českým portálem, který v celé své historii používal jen vlastní fulltextový vyhledávač.

Při uvedení nového vyhledávače v březnu 2005 Seznam oznámil, že do vývoje (včetně technické infrastruktury) investoval přes osm milionů korun. Vývojový tým čítal minimálně 15 lidí a vývoj mu trval jeden a půl roku, prozradil na svém blogu Ivo Lukačovič. Ze světových vyhledávačů, které mají v Česku významný tržní podíl, pak vlastní technologií disponuje vyhledávač Google, jehož investice do fulltextu lze těžko oddělit od jeho ostatních investic, ale s jistotou překračuje sto milionů dolarů ročně (samozřejmě včetně odhadovaných desítek až stovek tisíc přidávaných serverů každý rok).

Nejen Atlas, ale i Seznam v minulosti používal cizí vyhledávací technologii. Prvních pět let to byla jeho vlastní fulltextová technologie Kompas. Jakmile Seznamu začal kvalitou konkurovat především WebFast a na výsluní se začal drát i Google, poohlédl se Seznam jinam a přesedlal na vyhledávací technologii firmy Empyreum (z té pak odešel zaměstnanec Michal Illich a začal pracovat na Jyxu). Společnost Yahoo, která je dnes velikým rivalem společnosti Google, kdysi používala vyhledávání právě od Googlu. Pak si Yahoo koupilo společnosti, provozující další kvalitní vyhledávače (akvizicí společnosti Overture se dostal i ke kdysi velice oblíbenému vyhledávači AltaVista).

Portály a jejich fulltexty na časové ose

České portály (a Google) a jejich fulltexty na časové ose

Pro ty z portálů, které se časem začaly řadit spíše mezi „mediální společnosti“, však není používání cizích vyhledávacích technologií rozhodně tabu. Staví spíše na zpravodajském či zábavním obsahu a dalších službách. Ostatní společnosti, kteří se zařadily mezi „technologické“, stojí zejména na vlastních silných vyhledávacích technologiích a těch se drží, navíc je začaly poskytovat dalším. Příklon k technologické společnosti veřejně deklaroval Ivo Lukačovič, majoritní akcionář a hlavní vizionář Seznamu, během své červnové přednášky na Masarykově Univerzitě v Brně (609 MB videozáznam ke stažení ve formátu AVI je na http://video.fi­.muni.cz/). Při přednášce Ivo Lukačovič navíc prozradil, že v Seznamu vyvinuli nový fulltext s pracovním označením 1G, který má indexovat ještě více stránek z domény .cz, doslova (…) indexovat miliardy stránek a skutečně chceme v Čechách mít naindexovanou každou pitomou diskusní skupinu (jde o pasáž kolem 59. minuty odkazovaného videa). Fulltextu však zatím stále chybí robot (crawler), který by tyto miliardy stránek postahoval.

Mediální Atlas.cz

Generální ředitel společnosti Atlas.cz David Duroň při ohlášení spolupráce se Seznamem prohlásil: Atlas si vybral cestu, která je postavena na kvalitních obsahových a portálových službách. Dosavadní služby Žena, Pikant.cz, nově spuštěný e-mail či unikátní Amapy.cz jsou ukázkou toho, že se nám daří naši vizi plnit. Stejnou kvalitu chceme nabídnout i v oblasti vyhledávání. Zde jsme zvolili cestu partnerské spolupráce, která našim uživatelům nabídne produkt, který je oceňován pro svou důvěryhodnost. Jsem rád, že tímto krokem podpoříme český produkt a zároveň poskytneme našim uživatelům kvalitní vyhledávání. Martin Březina k tomu pro Lupu dodal: Na fulltext jsme si vybrali partnera se silnou značkou a důvěrou uživatelů. O důvěryhodnosti a kvalitě se dá usuzovat jak z absolutního, tak z vývoje relativního tržního podílu jednotlivých technologií.

David Duroň pak 2. srpna v diskuzi na ČT24 zmínil, že téměř polovina uživatelů Atlasu využívala vyhledávání Seznamu. Atlas tedy může očekávat, že část z této poloviny si nebude muset „odskakovat“ z Atlasu vyhledávat jinam. Naopak utečou ti (z druhé poloviny), kteří si oblíbili Jyxo, které jim může nadále posloužit mimo Atlas. Seznam, kromě peněz za poskytnutí technologií a posílení prestiže značky, získá zajímavý přehled o chování uživatelů svého konkurenta.

Za kolik je kvalitní vyhledávání?

Seznam nynější cenu, za kterou poskytuje služby Atlasu, považuje za smluvní tajemství, čemuž se nelze divit. Nezúčastněným není známo, nakolik hrála cena roli při výběru nového dodavatele. Kolik mohlo stát v minulosti vyhledávání od společnosti Jyxo, však lze celkem kvalifikovaně odhadnout. Odhad můžeme získat, pokud se podíváme na tržby společnosti Jyxo a počet jejích zákazníků (technologie nedodával jen jednomu, ale i dalším, především menším portálům). V internetovém obchodním rejstříku jsou dostupné nejčerstvější údaje pro rok 2004, kdy tržby společnosti Jyxo dosáhly 2,7 milionu Kč. Jde o období, kdy Jyxo poskytovalo technologii i Seznamu, který měl vždy řádově větší provoz, než kterého dosahovaly menší portály. Pokud je správný předpoklad, že cena roste s objemem provozu vyhledávání (takto stavěl před lety ceny např. Google), pak nám zhruba vychází, že u velikého zákazníka typu Seznam mohlo jít o maximálně 200.000 korun měsíčně.

Na počátku roku 2004 na Seznamu probíhalo cca 600.000 vyhledávání denně, nyní, v srpnu 2007, je to již přibližně 10 milionů denně. Atlas v červnu 2007 použilo dle NetMonitoru 542.602 uživatelů, když jich vyhledávalo 41.698 denně. Konkrétní počty tak lze stěží odhadnout, patří mezi obchodní tajemství Atlasu. Kdyby ale každý uživatel vyhledával 15krát denně, dostává se dnes Atlas na provoz, který vyřizovalo Jyxo pro Seznam právě v roce 2004, pro který jsme spočetli odhad. Samozřejmě tvorba cen je zcela tržní a nemůžeme srovnávat pouze podle dotazů, náročnější je spíše častá „sklizeň“ a následná indexace webu, který za tuto dobu také značně povyrostl.

Nakročeno na vyhledávací API pro každého

S příchodem Seznamu na Atlas se liší i technické řešení. Zatímco technologie Jyxa měla více instalace – běžela separátně např. pro Atlas a pro vwww.jyxo.cz -, nyní bude Atlas přebírat pouze výsledky vyhledávání ze serverů Seznamu a k nim přibírat i reklamu Skliku. U té se pro inzerenty plánuje, že dostanou možnost vybrat si servery, na kterých se mají jejich inzeráty zobrazovat, kromě vyhledávání na Seznamu, kde se budou zobrazovat vždy. Tedy možná časem půjde Sklik pro výsledky na Atlasu vypnout. K technickému řešení prostřednictvím tiskové mluvčí Rity Gabrielové ze Seznamu napsali: Aplikace se dotazují přes Internet pomocí metody HTTP GET. Výsledek pak dostávají jako XML dokument, který si dále zpracovávají. Rozhraní běží na stejných serverech jako náš hlavní vyhledávač, takže dostupnost služby i velikost databáze je prakticky stejná jako u našeho vyhledávání.

Jelikož jsem předem tušil, že má Seznam nakročeno k vyhledávacímu API, zeptal jsem se i na něj. Seznam byl s odpovědí celkem sdílný: Plánujeme vydat bezplatnou verzi Search API, která bude samozřejmě v některých ohledech oproti ‚profi‘ verzi limitována, nicméně i přesto bude velmi vhodná pro weby s nižší návštěvností nebo nekomerční projekty. Jelikož Seznam nyní pracuje i na nové verzi fulltextu, uvidíme, kdy se API dočkáme. Nový „fulltext 1G“ je podle Rity Gabrielové zatím stále ve vývoji, jde o celkově novou dimenzi vyhledávání a na té budeme ještě celý podzim pracovat.

Rozdíl ve výsledcích zde přeci jen je

Pozorní uživatelé však přišli na jeden rozdíl. Na jednom z blogů zde na Lupě se v pátek objevilo zjištění, že na Seznamu se pro některé dotazy (např. „reality“) liší výsledky vyhledávání s těmi, které poskytuje Atlas. Seznam nad všechny přirozené výsledky vyhledávání dává nerozlišitelný odkaz na svůj projekt, pro zmíněné „reality“ na Sreality.cz, pro slovo „autobazar“ na Sauto.cz (viz autobazar na Seznamu a autobazar na Atlasu).

U několika webmasterů a lidí zabývajících se SEO občas panovaly pochybnosti, zda náhodou ti inzerenti, kteří utrácejí na Seznamu hodně peněz, nemohou být jaksi „popostrčeni“ v přirozených výsledcích fulltextového vyhledávání více nahoru. Dušan Janovský (v Seznamu již od května 2007 jako zaměstnanec nepůsobí) ještě jako člen fulltextového týmu Seznamu svého chlebodárce hájil a tyto obavy rozptyloval.

CIF16

Nutno podotknout, že když k podobnému sebepropagačního kroku sáhl Google a začal na vlastních stránkách na některé rešeršní dotazy propagovat vlastní projekty (a to dokonce vizuálně odlišitelně od přirozených výsledků vyhledávání – viz např. anglicky psaný příspěvěk Does Google play fair? včetně ilustrujících screenshotů), uživatelé se ozvali tak hlasitě, že Google přestal takovou sebepropagaci praktikovat.

Manipulaci s fulltextovými výsledky a zvýhodňování některých firem, které Seznam podporují (výraz použitý v dotazu z publika), popřel i sám Ivo Lukačovič v již zmíněné přednášce (kolem 58. minuty). Jak však kdosi poznamenal v diskusi na odkazovaném blogu na Lupě, Seznam si může svým stránkám interně přidělit například zcela nadstandardní a maximální Srank, podle kterého se, mimo jiné, pořadí výsledků vyhledávání řadí. I tak by ale šlo o manipulaci, protože by Seznam pro vlastní projekty obešel výpočetní algoritmus. Nadržoval by tak jen sobě, nikoliv platícím firmám, pro které takový krok nepřipouští.

Anketa

Manipuluje Seznam s výsledky vyhledávání?

60 názorů Vstoupit do diskuse
poslední názor přidán 14. 8. 2007 9:58

Workshop: UX design v návrhu webu

  •  
    Rychlý a efektivní návrh rozhraní.
  • Metoda Design Studio.
  • Prototypy - proč a jak prototypujeme.

Detailní informace o workshopu UX designu »