Hlavní navigace

Detektiv hlubokého webu

16. 8. 2008
Doba čtení: 2 minuty

Sdílet

Mezi hledanými výrazy ve vyhledávačích se často vyskytují jména lidí – hledáme staré kamarády, obchodní partnery, celebrity. Většina z nás využívá Google, ale jsou tu i jiné možnosti, jak se k lidem dostat.
Jan Handl

Ilustrace: Nenad Vitas

Čistě náhodou jsem narazil na vyhledávač lidí pipl.com. Je to šikovná záležitost, slouží sice pouze k vyhledávání lidí, ale je o to přesnější.

Co je na pipl.com zvláštního? Hledá prý jinou metodou než běžné vyhledávače. Zaměřuje se i na obsah takzvaného „deep webu“ (více na anglické Wikipedii nebo v článku Robot Google se zkouší ponořit do hlubokého webu, zůstává ale na povrchu), tedy na obsah, který bývá běžným vyhledávačům skryt. Dokumenty v online databázích přitom často obsahují právě ty údaje, které hledáme a potřebujeme. „Deep web“ je prý asi pětsetkrát obsáhlejší než „povrch“ webu. Dost personálních profilů je skryto v databázích (tedy v nestatickém obsahu), které jsou nezaindexované. Robot služby pipl.com prý umí proniknout do „deep webu“ a tím pádem zmapuje zastrčený obsah, který vyhledávače neprobádaly.

Jak tedy vypadá taková stránka s výsledky? Pokud máte štěstí a jméno neobsahuje českou diakritiku (třeba o Romanovi Šebrlem se nic nedozvíte, asi kvůli tomu, že jeho jméno obsahuje znak s háčkem), dostanete tři druhy výsledků vyhledávání. Při zadání „Karel Gott“ pipl.com najde jednak profily (například na MySpace nebo v Internet Movia Database), dále běžné webové stránky a také výsledky ve vyhledávání mezi články. Vše přehledně seřazeno, jednotlivé podsekce výsledků je možné klikem rozbalit a zkoumat podrobněji. Pokud si na tento systém zvyknete, je to praktické a šikovné, mít výsledky rozdělené do tří kategorií.

Pikantní je, že dvě posledně jmenované kategorie vyhledává Google, možná proto se autoři projektu pipl.com neprohlásili za konkurenty Googlu, tak jako to udělali zakladatelé nového vyhledávače Cuil.com (více v glose Cuil se zas tak moc cool nezdá). Autoři pipl.com tedy takto nepřímo přiznali, že Google je jednička ve hledání a oni že se zaměří na neprobádané končiny sítě a lidi.

KL24

Trochu potíží způsobí našinci česká diakritika, ale stačí zadat jméno bez čárek a háčků, i takto získané výsledky jsou relevantní. Jde o slušnou alternativu ke Googlu, zejména v případě, pokud hledáme bez diakritiky. Dále nabízí pipl.com statistiky o uživatelích Internetu, což může být také užitečná věc.

Pokud se tedy chcete hrabat v zastrčených koutech Internetu a zjišťovat informace o svých známých, máte možnost. Škoda, že pro naše prostředí se pipl.com až zase tak moc nehodí. Srovnání výsledků vyhledávání s těmi z Googlu ukazuje, že skrytých dat „deep webu“ snad ani nemůže být pětsetkrát víc, než běžného zaindexovaného obsahu. Jinak to může být při vyhledávání mezi Američany, reference hovoří o tom, že tam pipl.com může slavit úspěchy. Našinci nezbude nic než pátrat po webu klasickém způsobem, případně si najmout detektivní kancelář…

Byl pro vás článek přínosný?

Autor článku

Autor je kromě jiného publicista, více informací najdete na LinkedIn. Na stránkách iNazor.net odkazuje na své články pro Lupu a další média. Ze všech vymožeností moderní doby má nejraději Twitter, zajímá ho historie a píše HistorieBlog.cz.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).