Internetový vyhledávač totiž funguje podobně jako skener. Každou stránku na Internetu si projde, uloží, prozkoumá odkazy na ní a zařadí si je do fronty. Tuto frontu postupně zpracovává, až má dostatečně velkou databázi. Cyklus je uzavřen a začíná se opět od začátku. Aktualizuje se databáze a zjišťují změny stránek a nové přírůstky.
Při takovém prohledávání serverů vyhledávač lehce narazí na zapomenutý odkaz. Odkaz vedoucí na nezabezpečený intranet nebo na neveřejný obsah, který není dostatečně chráněn. Nelze poznat, že se jedná o obsah, který měl zůstat utajen. Je přístupný na Internetu a vede na něj odkaz. Lze tedy předpokládat, že informace na stránce mohou být zpracovány a nabídnuty vyhledávajícím uživatelům.
Pokročilé techniky vyhledávání
Stránky jsou v paměti vyhledávače. Stačí se jen správně zeptat a získáme libovolné informace. Pro položení správné otázky musíme formulovat přesný dotaz. Využít voleb pokročilého vyhledávání. Musíme si zjistit přesnou syntaxi zadávání dotazu, protože existují volby, které nelze zadat ani přes rozšířené vyhledávání. Většinu najdete při podrobném prozkoumání nápovědy. Ale pro kompletní výpis budete muset na stránku fanoušků vyhledávače.
Pozornosti nesmí uniknout například následující operátory:
- intitle – vyhledávání v titulku stránek,
- inurl – vyhledávání v adrese stránky,
- site – omezení na doménu,
- cache – zobrazení stránky, jak si ji vyhledávač pamatuje.
Příklady zneužití vyhledávače
V následujícím textu bych rád nastínil, jakou cestou se dá ubírat při zneužívání vyhledávačů, a uvedl několik konkrétnějších příkladů. Pro ilustraci se zaměřím na vyhledávač s momentálně největším indexem stránek – Google. Zneužití je však možné na libovolném webovém vyhledávači – pokud vám bude vadit angličtina, klidně zkuste některý z českých.
Specializace na citlivé údaje
Základním postupem může být zaměření na nějakou informačně zajímavou doménu. V zahraničí si můžete vyhlédnout například domény .gov (vládní instituce), .mil (vojenské) a podobně. Ve spojitosti s nějakým vybraným slovem již můžete získat zajímavých výsledků.
site:.gov secret agent
Prohledá vládní stránky, kde je zmiňována fráze tajný agent.
Adresářová struktura
Mnoho serverů nabízí volně ke stažení adresářovou strukturu celého serveru, ale jen většina z nich je tak nastavena úmyslně. Když se podíváme na typický vzhled stránky, která obsahuje výpis adresářů, zjistíme několik charakteristických znaků. V titulku stránky je klíčové slovo Index of
a ve stránce se často objevuje odkaz s textem na rodičovský adresář – Parent directory. Pak již jen stačí promluvit řečí vyhledávače a položit například takový dotaz:
site:gov intitle:index.of inanchor:"Parent Directory"
Se zaměřením na vládní domény se pustí do vyhledávání všech volně přístupných adresářových výpisů. Struktura adresářů může být nabízena i záměrně, ale z výpisu lze někdy zjistit i další informace.
Zjištění jména webového serveru a jeho verze z výpisu adresářů
Tato doplňková informace je totiž většinou zobrazována v dolní části stránky. Pokud přidáme do dotazu typickou frázi Server at
, můžeme se opět těšit na výsledky.
site:gov intitle:index.of inanchor:"Parent Directory" "Server.at"
Tyto informace sice mohou být podvržené, ale omezí nám okruh našich potenciálních cílů. Pokud se objeví nějaká bezpečnostní díra v určité verzi Apache, jednoduše najdeme konkrétní cíle.
intitle:index.of "Apache/1.3.0 Server.at"
Po zadání tohoto dotazu se nám zobrazí v řadě zranitelné servery a můžeme se pustit do dalšího zkoumání jednotlivých kandidátů.
Hledání webserverů bez obsahu
Stejně, jako je možné hledání adresářového výpisu, si můžete nechat vyhledat i servery bez obsahu. Takové, kde je zatím zobrazena pouze výchozí stránka generovaná při instalaci. Správce nemá čas na umístění vlastního obsahu. Pravděpodobně nebude mít dostatek času ani na aktualizaci bezpečnostních záplat. V horším případě nemusí o běžícím webserveru ani vědět.
Servery Apache
Apache 1.3.0 – 1.3.9
Intitle:Test.Page.for.Apache It.worked! this.web.site!
Apache 2.0
Intitle:Simple.page.for.Apache Apache.Hook.Functions
Servery IIS
IIS 5.0
allintitle:Welcome to Windows 2000 Internet Services
IIS 6.0
allintitle:Welcome to Windows XP Server Internet Services
Další zdroje o zneužívání vyhledávačů
Mnoho dalších možností, jak lze internetový vyhledávač Google zneužít, najdete v Google Hacking Database. O tom, že se občas objeví i velmi netradiční využití vyhledávače, svědčí i sledování kancelářských kopírek, které jsou připojené přes firemní síť do celého světa. Pokud pochopíte základní princip, zůstává jen na hranicích vaší nápaditosti, co si necháte vyhledávačem najít.
Ochrana před „napadením“
Jste-li vlastníkem internetového serveru, možná jste se při čtení zapotili. Teď máte strach svůj server dál provozovat, ale nebojte se. Pokud nebudou citlivé informace dostupné z Internetu, žádný vyhledávač se k nim nemůže samovolně dostat. Neobchází žádné zaheslované stránky ani nezkouší webové formuláře náhodně vyplňovat, aby se přes ně dostal. Proto se mu nemůže ani náhodou podařit vyplnit správné jméno a heslo do vašeho administračního systému.
Jestliže si kvůli pohodlnosti dáte na své stránky odkaz do adminu a tento odkaz bude obsahovat i vyplněné přístupové jméno a heslo, tak se nedivte. Nedivte se, že se k vám vyhledávač podívá. Prozkoumá celé administrační rozhraní a při procházení výpisu stránek si zkusí navštívit i každý odkaz. Ráno to poznáte hned při přihlašování. A pokud nemáte ani zálohované stránky, může se některý z vyhledávačů stát i posledním návštěvníkem vašich stránek…
Máte přehled o všech parametrech pokročilého hledání ve vašem oblíbeném vyhledávači?