Hlavní navigace

Aaron Brown (Google): Diagram znalostí nabízí rychlé odpovědi už i v češtině

 Autor: Google
David Slížek

Knowledge Graph, pokus Googlu o porozumění tomu, co lidé hledají, dorazil po roce i do České republiky. Jak změní vyhledávání? Má dopady na SEO? Mluvili jsme s produktovým manažerem služby.

Knowledge Graph do Česka dorazil pod názvem Diagram znalostí. Ve výsledcích vyhledávání se bude uživatelům nová funkce objevovat postupně, v průběhu několika následujících dní.

Navenek se projeví zejména dvěma způsoby: kromě klasických výsledků vyhledávání se v pravé části obrazovky objeví karta, která nabídne související informace o hledaném objektu – o známých osobnostech, místech, uměleckých dílech, filmech a dalších pojmech.

A nad výsledky se budou uživatelé při některých dotazech setkávat s carouselem („kolotočem“ s fotografiemi a daty), obsahujícím další související data. Googe přitom využívá hlavně volně dostupná data, například z Freebase, Wikipedie, CIA World Factbook a dalších služeb.

Vyhledávač se bude snažit odhadnout, jaký objekt uživatel hledá, a pokud ho nalezne v databázi, přidá k němu kontext. Pokud tak třeba budete hledat Petra Čecha, zobrazí se v kartě úryvek z Wikipedie, jeho výška, stručná životopisná data nebo odkaz na klub, ve kterém hraje. 

Díky databázi objektů a vztahů mezi nimi by měl Google rozeznat i kontext u slov, která mají více významů. Míří tak o krok blíže k sémantickému rozpoznávání dotazů.

Jak Diagram znalostí v češtině vypadá se můžete podívat v této galerii:

O tom, jaké další dopady bude Diagram znalostí mít a jak změní vyhledávání Googlu, jsme těsně před spuštěním služby v Česku mluvili s produktovým manažerem služby Aaronem Brownem:

Mění se Google z vyhledávače v encyklopedii? 

Diagram znalostí (Knowledge Graph) není encyklopedie, je to spíš soubor odpovědí. Kdybyste si například o Měsíci četl v encyklopedii, bylo by v ní hodně textu s mnoha detailními údaji. A tento obsah můžete i nadále na Internetu najít a Google vám na něj nabídne odkazy. My se jej nesnažíme nahradit, jen sbíráme jednoduchá fakta, která lidé často hledají, a dáváme jim je k dispozici co nejjednodušším způsobem. Uživatelé pak zbytečně neztrácejí čas hledáním jednoduchých odpovědí v encyklopediích, pokud ale potřebují detailnější data, stále je na Internetu najdou. Nechceme nahrazovat web v celé jeho šíři. 

V databázi máte dnes na 570 milionů položek s více než 18 miliardami vztahů mezi nimi. Jak tuto databázi udržujete a rozšiřujete? Jde o úplně automatizovaný proces, nebo je stále potřeba lidský editor? 

Používáme řadu různých mechanismů. Velkou část práce dělají naše algoritmy využívající volně dostupné zdroje na webu. Ale do procesu zasahují také lidé, kteří pomáhají s čištěním dat, některé údaje také pocházejí z licencovaných zdrojů. Celé to začíná tím, že sledujeme, jaké dotazy lidé nejčastěji kladou. A na jejich základě pak Diagram znalostí naplníme daty, která na tyto otázky odpovídají. 

Jak se vypořádáváte s dotazy, kterou jsou specifické pro konkrétní zemi nebo jazyk?

O ty se většinou starají algoritmy. Google se vyhledáváním zabývá poměrně dlouhou dobu, takže máme poměrně dobrou představu, jaké dotazy lidé kladou v různých zemích a různých jazycích. Když službu lokalizujeme do nového jazyka, vytvoříme si seznam entit, které lidé nejčastěji vyhledávají. A k nim pak nejdříve vyhledáváme související data na webu – například v české Wikipedii. A pokud nenajdeme potřebné odpovědi v otevřených zdrojích, začneme je hledat jinde. 

Jak Google pozná, že pokud do vyhledávače zadám Petra Čecha, hledám zřejmě fotbalového brankáře a ne někoho jiného se stejným jménem? 

Strávili jsme hodně dlouho dobu laděním algoritmů, které dokáží rozlišit, jaké entity se dotaz nejspíš týká, a na základě dostupných dat na Internetu pak umí otázku co nejpřesněji interpretovat. Někdy samozřejmě existuje více možných výkladů – například v USA by výsledek hledání slova „Kings“ mohl znamenat hokejový tým Los Angeles Kings, basketbalový tým Sacramento Kings nebo třeba televizní seriál Kings. V takovém případě Diagram znalostí nabízí uživateli výběr ze všech tří možností, a ten si může vybrat, který výsledek lépe odpovídá jeho otázce. 

Používáte k upřesnění odpovědí také údaje uživatelů z jejich historie vyhledávání na Googlu nebo z profilu na Google+? 

Ne, Diagram znalostí je postaven pouze na veřejně dostupných (a z části licencovaných) informacích. Výsledky hledání nepersonalizujeme. 

Ani to v budoucnu neplánujete dělat? 

V současné době nemáme v tomto směru žádné aktuální plány. Ale nemůžu komentovat, co by Google mohl nebo nemohl dělat někdy v budoucnosti. 

Využívá Diagram znalostí nějakým způsobem tagy z oblasti popisu strukturovaných dat (structured markup)? Například ty podporované v rámci Schema.org

Ano, jde o jeden z potenciálních zdrojů informací. V USA (jinde tato funkce zatím není dostupná) jsme nedávno například do Diagram znalostí zahrnuli recenze filmů. A právě tato data – například počet hvězdiček – se dají z webů dobře čerpat prostřednictvím tagů Schema.org. 

V USA jste nedávno do Diagramu znalostí přidali také informace z Local Search, takže když lidé hledají například restauraci, zobrazí jim Google carousel s fotografiemi a informacemi o podnicích v jeho okolí. Kdy bude tato funkce dostupná také v Česku? 

Nové funkce chceme postupně spustit ve všech zemích. Přesné datum pro Českou republiku ale neznám. 

Využije Google Diagram znalostí pro reklamní účely? Budou si zadavatelé moci koupit místo nebo odkazy v jeho výsledcích? 

S Diagramem znalostí zacházíme velmi podobně jako s organickým vyhledáváním. Není to reklamní produkt. Snažíme se jen dodat uživatelům co nejpřesnější informace. Takže – ne, firmy si nemohou koupit místo v jeho výsledcích. 

SEO experti v USA už déle než rok diskutují o tom, jestli má Diagram znalostí nějaký vliv to, kolik lidí na webovou stránku přijde. Ovlivňuje nějak ranking webů ve výsledcích vyhledávání? 

Do oblasti rankingu webů Diagram znalostí žádné změny nepřinesl. Jde o samostatnou sadu informací, která obklopuje organické výsledky vyhledávání. Obecně vzato nám hlubší poznání světa v budoucnu může pomoci k tomu, že naše algoritmy pro ranking webů budou lepší a budou dávat přesnější výsledky, ale zatím mezi nimi a Diagramem znalostí žádné konkrétní spojení není. Co se týče SEO, vím, že se experti snaží porozumět tomu, jestli Diagram znalostí něco změnil a jak s ním pracovat. Nejsem SEO expert, takže vám přesně neřeknu, jestli se Diagram znalostí dá při optimalizaci webů využít. Z mého pohledu se prostě snažíme dávat lidem relevantní odpovědi na jejich otázky. A pokud SEO experti vytvářejí weby, které tyto odpovědi nabízejí, určitě jim to může pomoci.

Bude Diagram znalostí znamenat nějaké vylepšení hlasového vyhledávání Googlu? 

Ano, tady se nabízí hodně možností. Když jsou uživatelé v pohybu a používají smartphone, nebo časem nová zařízení jako Google Glass, často hledají rychlé souhrny informací. A Diagram znalostí bude velmi důležitým nástrojem, jak jim je budeme dodávat. Chystáme v této oblasti celou řadu novinek.

Našli jste v článku chybu?

25. 6. 2013 12:54

Petr (neregistrovaný)

Jde o pomyslnou hranici soužití webů jednotlivců a Googlu který na jejich obsahu vydělává. Jenže když si takhle začíná automaticky "vyzobávat" obsah z těch webů a nechává ho pěkně u sebe to podle mě začíná být trochu problém.

Jediný důvod proč proti tomu podle mě neprotestuje i jinak ativistická Wikipedia je docela známý fakt, že ji Google "ručně" zvýhodňuje oproti ostatním.

A pro ni je pořád výhodnější být vlevo na prvním místě i když je v pravo vykraden její obsah, než mít vykradený obsah v …

25. 6. 2013 14:23

Nemyslim si, ze to tak je. Vse se tam dat neda a pokud chci ty informace, tak si tam kliknu, pokud potrebuju vedet pocasi, tak tak me to jedno kliknuti celkem otravuje, kdyz portebuju jen vedet, jestli si svetr vzit, nebo ne.

DigiZone.cz: Optimedia: hybridní kampaň Nescafé

Optimedia: hybridní kampaň Nescafé

Vitalia.cz: Znáte „černý detox“? Ani to nezkoušejte

Znáte „černý detox“? Ani to nezkoušejte

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

Měšec.cz: Zdravotní a sociální pojištění 2017: Připlatíte

Zdravotní a sociální pojištění 2017: Připlatíte

Měšec.cz: Kdy vám stát dá na stěhování 50 000 Kč?

Kdy vám stát dá na stěhování 50 000 Kč?

120na80.cz: Popraskané rty? Některé balzámy stav zhoršují

Popraskané rty? Některé balzámy stav zhoršují

120na80.cz: Co všechno ovlivňuje ženskou plodnost?

Co všechno ovlivňuje ženskou plodnost?

Vitalia.cz: To nejhorší při horečce u dětí: Febrilní křeče

To nejhorší při horečce u dětí: Febrilní křeče

Root.cz: Telegram spustil anonymní blog Telegraph

Telegram spustil anonymní blog Telegraph

Vitalia.cz: Pravda o přibírání na zimu

Pravda o přibírání na zimu

Podnikatel.cz: Udávání kvůli EET začalo

Udávání kvůli EET začalo

Měšec.cz: Europlatby: někde bez poplatku, jinde i 350 Kč

Europlatby: někde bez poplatku, jinde i 350 Kč

Vitalia.cz: Jmenuje se Janina a žije bez cukru

Jmenuje se Janina a žije bez cukru

DigiZone.cz: Perspektivy TV v roce 1939 podle časopisu Life

Perspektivy TV v roce 1939 podle časopisu Life

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

DigiZone.cz: Recenze Westworld: zavraždit a...

Recenze Westworld: zavraždit a...

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

Měšec.cz: Vklad na cizí účet je draze zpoplatněn (přehled)

Vklad na cizí účet je draze zpoplatněn (přehled)

DigiZone.cz: ČT má dalšího zástupce v EBU

ČT má dalšího zástupce v EBU

Měšec.cz: Air Bank zruší TOP3 garanci a zdražuje kurzy

Air Bank zruší TOP3 garanci a zdražuje kurzy