Hlavní navigace

Jak měřit pravdu? Výzkumníci Googlu zkoušejí posuzovat weby podle faktů

 Autor: Isifa
David Slížek 2. 3. 2015

Nejpopulárnější stránky zhusta nejsou ty, které obsahují nejlepší obsah. Jak by vypadal algoritmus Googlu, kdyby řadil weby podle pravdivosti faktů?

Kvalita webů – a jejich umístění ve výsledcích vyhledávání – se dnes (zjednodušeně) měří hlavně podle toho, jak často na ně odkazují další weby. Dobře utajovaný algoritmus Googlu sice zahrnuje i řadu dalších signálů, ale většina se týká vnějškových atributů.

Nehodnotí přitom pravdivost obsahu a přesnost faktů, které se na webech nachází. Stránky s virálními články plnými vymyšlených zábavných „zpráv“, drbů a fám tak často mívají vyšší hodnocení (PageRank) než weby nabízející suché, ale pravdivé informace.

Co kdyby to bylo jinak? Co kdybychom weby posuzovali podle toho, zda obsahují pravdivé a přesné informace? Skupina výzkumníků Googlu publikovala zajímavou studii, ve které právě takovou metriku testují. O jejich výzkumu napsal New Scientist.

Jak měřit pravdu?

Nový ranking má měřit důvěryhodnost webu a experti jej nazývají Knowledge-Based Trust (KBT). Čím méně nepravdivých údajů na webu je, tím je důvěryhodnější, říká. Základem algoritmu jsou fakta, která ze stránek vytěží metodami založenými na nástrojích databáze Knowledge Vault – obřím skladu údajů, které Google už hezkou dobu těží z internetu.

Na základě získaných faktů se pak výzkumníci pokoušejí posoudit, zda jsou data pravdivá – a zda je tedy zdrojový web možné považovat za důvěryhodný. Pokud vás zajímají podrobnosti jejich pravděpodobnostního modelu, najdete je v detailně popsané v odkazované studii (PDF v angličtině).

Svou metriku pak experimentátoři testují jak na syntetickém datasetu, u kterého přesně znají pravdivost jednotlivých údajů, tak na reálných datech z více než dvou miliard stránek. 

Co jsou vlastně fakta?

Jak sami autoři přiznávají, jejich metoda má samozřejmě řadu otazníků – algoritmus neumí zohlednit, která fakta na stránce jsou důležitější a která mají jen okrajový význam, problematické je i správné vytěžování dat z webů nebo rozlišování, zda je stránka skutečným zdrojem informace, nebo ji jen přepublikovala z jiného zdroje. 

Není také jasné, co vlastně označují za fakta, ani to, jak se dá zajistit zcela bezpečné ověřování jejich pravdivosti – opravdu je možné za nezpochybnitelný zdroj považovat Google Knowledge Vault?

Autoři každopádně nemají ambici, že by jejich metoda – byť je zajímavá – měla nahradit současný algoritmus Googlu. Zatím zůstává v rovině teoretického výzkumu a možná tam i – stejně jako řada dalších pokusů, jak strojově posuzovat kvalitu informací – zůstane.

Našli jste v článku chybu?

3. 3. 2015 10:43

Mysel (neregistrovaný)

Dnes? Ono tomu nekdy v historii lidstva bylo jinak? :o)

3. 3. 2015 12:41

Ano (neregistrovaný)

Tohle je velmi potrebny projekt, budu rad, kdyz uspeje.

Kdo je hoden pravdy, sam si ji najde, zbytek lidi jen prekazi a je potreba je necim zabavit - treba 50% novin jsou prohlaseni Bohuslava Sobotky a 50% rozhovory s tenisty, fotbalisty a hokejisty.

Je to jako s detma, kdyz chce mit tatinek klid na praci, musi je dat do jesli.

Měšec.cz: Kdy vám stát dá na stěhování 50 000 Kč?

Kdy vám stát dá na stěhování 50 000 Kč?

Root.cz: Nová třída SD karet A1 s vysokým výkonem

Nová třída SD karet A1 s vysokým výkonem

Vitalia.cz: To není kašel! Správná diagnóza zachrání život

To není kašel! Správná diagnóza zachrání život

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

DigiZone.cz: Mňam TV splnila slib a odešla z DVB-T

Mňam TV splnila slib a odešla z DVB-T

Podnikatel.cz: Babiše přesvědčila 89letá podnikatelka?!

Babiše přesvědčila 89letá podnikatelka?!

Měšec.cz: U levneELEKTRO.cz už reklamaci nevyřídíte

U levneELEKTRO.cz už reklamaci nevyřídíte

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

120na80.cz: 5 poporodních problémů a jejich řešení

5 poporodních problémů a jejich řešení

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

Podnikatel.cz: Víme první výsledky doby odezvy #EET

Víme první výsledky doby odezvy #EET

Vitalia.cz: Chtějí si léčit kvasinky. Lék je jen v Německu

Chtějí si léčit kvasinky. Lék je jen v Německu

Podnikatel.cz: K EET. Štamgast už peníze na stole nenechá

K EET. Štamgast už peníze na stole nenechá

Podnikatel.cz: Na poslední chvíli šokuje vyjímkami v EET

Na poslední chvíli šokuje vyjímkami v EET

Měšec.cz: Vklad na cizí účet je draze zpoplatněn (přehled)

Vklad na cizí účet je draze zpoplatněn (přehled)

Vitalia.cz: Naučí vás péct kváskový chléb bez lepku i s lepkem

Naučí vás péct kváskový chléb bez lepku i s lepkem

Podnikatel.cz: Zavře krám u #EET Malá pokladna a Teeta?

Zavře krám u #EET Malá pokladna a Teeta?

DigiZone.cz: Digi CZ výrazně zlevnila balíček HBO

Digi CZ výrazně zlevnila balíček HBO

Podnikatel.cz: Přivýdělek u Airbnb nebo Uberu? Čekejte kontrolu

Přivýdělek u Airbnb nebo Uberu? Čekejte kontrolu

Vitalia.cz: Pravda o přibírání na zimu

Pravda o přibírání na zimu