Hlavní navigace

Vyhledávání Seznamu poskytuje nové, relevantnější výsledky

[Tisková zpráva] Významná technologická změna ve fulltextu Seznamu se dotkla relevance výsledků hledání. Změnila způsob vyhodnocování uživatelských dotazů a poskytuje lepší výsledky hledání na běžné dotazy.

Fulltextové hledání v rámci českého internetu je jednou z klíčových služeb Seznamu. V jeho databázi je přes 350 milionů českých stránek a během jediného dne zpracovává až 17 milionů uživatelských dotazů. Ve špičce uživatelé na Seznamu vyhledávají až 300 dotazů za sekundu. Podobně velké vylepšení fulltextového vyhledávání proběhlo v roce 2007.

Změna ve vyhodnocování relevance
Relevance, přesněji souvislost výsledku hledání se zadaným dotazem, patří mezi základní kvality vyhledávače. Nové vyhledávání na Seznamu relevanci významně zvyšuje a to jak na krátké, tak na víceslovné dotazy. Nová verze algoritmu pro výpočet relevance také poskytuje větší potenciál pro další úpravy v budoucnu.

„Algoritmy pro výpočet relevance bylo nutné zcela přepracovat, protože nebyly kompatibilní s novým způsobem vyhodnocování relevance“, vysvětluje produktový manažer fulltextu Štěpán Škrob. „Rozdíl mezi starou a novou verzí je asi jako mezi parním strojem a spalovacím motorem. Oba dělají ve výsledku totéž, ale každý jiným způsobem.“

Příklady
Významně přesnější výsledky hledání poskytuje nová verze vyhledávání na běžné, tedy krátké dotazy. Příkladem může být slovo „STEM“ kde stará verze fulltextu hledala různé varianty slova „sto“. Podobně je tomu při hledání slova „Peru“. Výsledky nové a staré verze ukazují screenshoty v příloze.

Změna výsledku hledání na dvouslovné dotazy je pak vidět třeba na příkladu slov „Milada Horáková“. Zatímco stará verze hledání nabídla několik základních škol se jménem Milady Horákové v názvu, v nové verzi hledání jsou odkazy přímo na osobnost Milady Horákové.

Výhledy do roku 2010
Na novém vyhledávání pracuje v Seznamu tým zkušených specialistů pod vedením Dušana Janovského. Pro příští rok se jeho pozornost soustředí na úpravu robota a na další vylepšování relevance u složitějších dotazů.

Root.cz: Mirai má nový cíl 5 milionů routerů

Mirai má nový cíl 5 milionů routerů

DigiZone.cz: Recenze Westworld: zavraždit a...

Recenze Westworld: zavraždit a...

Měšec.cz: Stavební spoření: alternativa i pro seniory

Stavební spoření: alternativa i pro seniory

Vitalia.cz: Vychytané vály a válečky na vánoční cukroví

Vychytané vály a válečky na vánoční cukroví

Měšec.cz: Vklad na cizí účet je draze zpoplatněn (přehled)

Vklad na cizí účet je draze zpoplatněn (přehled)

Vitalia.cz: Nahradí sluch, ale zvuk je zcela jiný

Nahradí sluch, ale zvuk je zcela jiný

Vitalia.cz: Jmenuje se Janina a žije bez cukru

Jmenuje se Janina a žije bez cukru

Root.cz: 250 Mbit/s po telefonní lince, když máte štěstí

250 Mbit/s po telefonní lince, když máte štěstí

DigiZone.cz: Co chtějí operátoři při přechodu na DVB-T2?

Co chtějí operátoři při přechodu na DVB-T2?

Měšec.cz: Jak levně odeslat balík přímo z domu?

Jak levně odeslat balík přímo z domu?

Vitalia.cz: Když přijdete o oko, přijdete na rok o řidičák

Když přijdete o oko, přijdete na rok o řidičák

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

DigiZone.cz: Vedení ČRo: personální změny od ledna

Vedení ČRo: personální změny od ledna

Root.cz: Kamery Sony se dají ovládnout na dálku

Kamery Sony se dají ovládnout na dálku

Podnikatel.cz: K EET. Štamgast už peníze na stole nenechá

K EET. Štamgast už peníze na stole nenechá

Vitalia.cz: To nejhorší při horečce u dětí: Febrilní křeče

To nejhorší při horečce u dětí: Febrilní křeče

Podnikatel.cz: Chtějte údaje k dani z nemovitostí do mailu

Chtějte údaje k dani z nemovitostí do mailu

Měšec.cz: Sleva na dítě a manželku pro OSVČ je zpět. Ale..

Sleva na dítě a manželku pro OSVČ je zpět. Ale..

Root.cz: Telegram spustil anonymní blog Telegraph

Telegram spustil anonymní blog Telegraph