![Seznam.cz](https://i.iinfo.cz/images/416/seznam-cz-1.jpg)
Seznam v rámci vyhledávání rozjel údajně největší technologickou změnu za deset let a nasadil hledání pomocí významových vektorů. Ty jsou u nás i ve světě známé, například za populárním word2vec totiž stojí Tomáš Mikolov, viz náš rozhovor.
Vektory se na Seznamu používají od pátku 29. ledna 2021. Vyhledávané stránky, které obsahují konkrétní slova, jsou nyní rozšířeny o hledání stránek obsahujících podobný výraz uvedený v dotazu.
“Vyhledávání na Seznamu dosud fungovalo převážně tak, že dotaz od uživatele opravíme, analyzujeme a přidáme k němu další slova, která by mohla pomoci najít to, co uživatel hledal. Takovými slovy mohou být skloňované tvary zadaných slov, synonyma, rozvinuté zkratky apod. Tato slova pak hledáme v zaindexovaných webových stránkách, nalezené stránky řadíme a vydáváme uživatelům. Vždy tedy zatím bylo potřeba na webové stránce (nebo ve zpětných odkazech) najít nějaký textový ekvivalent toho, co uživatel napsal do dotazu,” popisuje na seznamáckém blogu Martina Pomikálková, vedoucí zpracování dotazu a vektorového hledání v Seznamu.
“Je však řada dotazů, u kterých tato strategie nebyla dostatečně úspěšná. Těžké je třeba najít odpověď na dotaz zadaný v přirozeném jazyce. Čím víc slov uživatel do dotazu zadá, tím menší je pravděpodobnost, že se budou v nějakém tvaru vyskytovat všechna na jedné stránce. Každý si někdy nepamatujeme přesný název toho, co hledáme, nebo se nám povede zcela originální překlep. To všechno komplikuje práci vyhledávače, který se snaží slova z dotazu najít na webové stránce,” doplňuje.