Hlavní navigace

CZ.NIC spouští DNS crawler, bude sbírat veřejná data z internetových domén

1. 6. 2020

Sdílet

CZ.NIC datový sál

Laboratoře CZ.NIC společně s bezpečnostním týmem CSIRT.CZ spouští nástroj DNS crawlerK dispozici je jako open source na GitHubu, napsán je v Pythonu. Záměrem crawleru je periodicky procházet všechny domény druhé úrovně pod TLD .cz, získávat o nich veřejně dostupné údaje a ty zpracovávat.

„I když to jeho jméno přímo nenapovídá, DNS crawler bude kromě sběru dat z DNS také komunikovat s webovým a e-mailovým serverem každé domény. Počítáme s pravidelnými běhy ve dvou periodách: většina datových položek se bude sbírat každý týden, pouze obsah hlavních webových stránek <doména>.cz nebo www­.<doména>.cz se bude stahovat jen jednou měsíčně. Zvláštnímu dohledu budou navíc podrobeny nově zaregistrované domény, u nichž je větší pravděpodobnost výskytu nějakého problému – jejich data se budou po dobu prvních dvou týdnů jejich existence stahovat denně. Software i režim jeho použití jsou navrženy tak, aby dopady na provoz domén druhé úrovně a síťovou infrastrukturu obecně byly prakticky zanedbatelné,“ popisuje Ladislav Lhotka z CZ.NIC.

Nasbíraná data mají sloužit ke třem hlavním účelům:

  • pro různé statistiky a analýzy, které budou pravidelně i jednorázově zveřejňovány a poslouží mimo jiné k efektivnější správě a plánování dalšího rozvoje služby DNS, kterou sdružení provozuje
  • pro včasné odhalování problémů a anomálií v DNS, které mohou být způsobeny jak poruchami zařízení nebo chybami v konfiguraci a zónových datech, tak i zlovolnými aktivitami
  • pro klasifikaci webových stránek metodami strojového učení, především s cílem zvýšení bezpečnosti zóny .cz (např. odhalováním falešných e-shopů nebo domén využívaných malwarem).

CZ.NIC dále ujišťuje, že bude zveřejňovat kompletní soupis všech dat, která sbírá, včetně interní pravidel pro použití. Zveřejňovat bude i IP adresy serverů, které skenování provádí. Informace jsou k dispozici na oficiálním webu.

IP adresy serverů, na kterých DNS crawler běží, jsou tyto:

  • crawler-1.labs.nic.cz (IPv4: 217.31.192.34, IPv6: 2001:1488:ac15:ff40::34)
  • crawler-2.labs.nic.cz (IPv4: 217.31.192.35, IPv6: 2001:1488:ac15:ff40::35)
  • crawler-3.labs.nic.cz (IPv4: 217.31.192.36, IPv6: 2001:1488:ac15:ff40::36)
  • crawler-4.labs.nic.cz (IPv4: 217.31.192.37, IPv6: 2001:1488:ac15:ff40::37)
Našli jste v článku chybu?
  • Aktualita je stará, nové názory již nelze přidávat.

Byl pro vás článek přínosný?

Autor aktuality

Reportér Lupa.cz a E15. O technologiích píše také do zahraničních médií.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).