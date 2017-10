Na internetovém obchodu Amazon se vyšší desítky procent nákupů uskuteční přes zabudovaný vyhledávač. Prodejci na Amazonu řeší vlastní SEO tak, aby v rámci hledání byli co nejvíce vidět, což uživí i konzultanty. Do vývoje hledání výrazně investuje samotná firma, která pro posílení spouští i projekty typu digitální asistentky Alexa.

Toho, aby se z vyhledávacího políčka stal mocný prodejce, chce docílit také tuzemský obchod Mall.cz. Ten letos v září najal Romana Duška, který předtím dva roky šéfoval internetovému vyhledávání v Seznamu. Dušek nyní staví technický tým, jehož rolí je současné hledání na Mallu ve všech zemích, kde obchod působí, výrazně inovovat.

„S vyhledáváním míříme někam tam, kde je Amazon. Ze searche by se měl stát silný salesman,“ popisuje Petr Novotný, který se k vyhledávacímu týmu Mallu připojil. Novotný patří k prozatím ne úplně početné komunitě lidí, kteří se v Česku věnují technologii nazvané Elasticsearch.

Sílící Elastic

A právě Elastic je novým základem vyhledávání Mallu. Firma už ho sice nasadila v roce 2014, ještě se ale nezačal vytěžovat naplno. V původní fázi se spíše řešily starosti jako „hlavně, ať to není horší než předchozí hledání“. A také se podařilo dát data z obchodu na jedno místo. Nyní se tento základ začíná rozšiřovat. „Elasticsearch je nyní komponenta kritická pro byznys,“ navazuje Novotný.

Elasticsearch je open source projekt, do něhož lze „naházet“ hromadu dat a nad nimi pak fulltextově vyhledávat. Elasticsearch se rychle vyvíjí a vedle přibývajících analytických nástrojů přidává také funkce pro strojové učení. Ty například umí automaticky hledat odchylky.



Autor: Mall.cz Roman Dušek, šéf vyhledávání v Mall.cz

Elasticsearch je v základu zdarma, za nadstandardní funkce a podporu si už ale firma Elastic, která nad touto technologií staví, nechává dobře zaplatit a vlastně se v tomto ohledu ani moc neliší od jiných firem operujících v oblasti enterprise IT.

Sehnat lidi na Elasticsearch u nás není úplně jednoduché. Tato technologie se ale v projektech objevuje čím dál více. Aktivity běží ve velkých korporacích typu Česká spořitelna, Komerční banka nebo T-Mobile. Na Elasticu staví i další zdejší e-commerce projekty, třeba Zoot.cz nebo Rohlík.cz a DámeJídlo.cz.

Docker a další

V případě Mallu má být pomocí vyhledávače možné zjistit, co přesně uživatelé během svého hledání vlastně chtějí, o co se zajímají, jaké produkty jim co nejpřesněji předkládat. Pracuje se tedy například se sémantikou, jednotlivé dotazy se rozkládají na slova a hledá se jejich kořen.

Mall do Elasticu ukládá produkty ze všech zemí, kde operuje. Celkově jsou těchto produktů stovky tisíc. Každý zákazník, který na Mallu vyhledává, se tak „dívá“ do Elasticu. Ten ale zároveň není samostatně operující komponentou. Mall standardně běží na SAPu, který má pod sebou databázi Oraclu, odkud se informace berou.

Mall má na Elastic postaveny dva clustery. V jednom jsou uloženy produkty a co do velikosti je řádově na gigabajtech. Ukládají se informace o produktech (cena, dostupnost, váha a tak dále), což nejsou objemné informace.

Druhý cluster už běží na asi šestnácti serverech a v současné době má kolem 300 TB. Na něm se zpracovávají logy. Taková práce s Elasticem vyžaduje rychlé SSD disky a hodně operační paměti. Nad samotným Elasticsearch je pak ještě postaveno API, přes které se pak dotazují například produktové týmy.

Nově budovaný vyhledávací tým Mallu na nových možnostech vyhledávání aktuálně pracuje a hledá další lidi. Elasticsearch jako takový není jedinou technologií, která se v obchodu nasazuje. Do produkce půjde stále populárnější Kubernetes, používá se Docker nebo jazyk Go. V Mallu také na back-endu postupně nasazují vlastní OpenStack.