Skoro 90 GB dat, 773 milionů unikátních e-mailů, 21 milionů unikátních hesel a celkem 2,7 miliardy záznamů – to je tzv. Collection #1, databáze uniklých informací o uživatelských účtech na řadě různých webů. Na své službě Have I Been Pwned o ní informoval Troy Hunt.
Rychle se ukázalo, že jde o souhrn řady různých úniků staršího data, která někdo pospojoval do jedné databáze. Podle českého bezpečnostního experta Michala Špačka jde dokonce o součást ještě větší databáze BigDB, která má 595 GB.
Špaček také na svém blogu publikoval seznam stovky českých webů, jejichž uniklá data se (nejen) v Collection #1 vyskytují. „U každého webu uvádím způsob uložení hesel, resp. tak jak byla v ‚BigDB‘ zveřejněna, a počet záznamů. Pokud daný web používal nějaké ‚nečitelné‘ uložení hesel, tak přidám i informaci o tom, kolik cracknutých hesel v čitelné podobě z toho konkrétního webu databáze obsahuje,“ popisuje. Celkem podle něj jde o necelých 450 tisíc hesel v čitelné podobě.
Upozorňuje také na to, že k záznamům o webech je potřeba přistupovat s určitou dávkou nedůvěry: „Nutno podotknout, že všechny jsou již obsaženy v ‚BigDB‘, některé dokonce vícekrát s různým počtem záznamů, a že to neznamená, že data v každém jednotlivém případu opravdu pochází z uvedených domén.“
Obdobný seznam Špaček sestavil také pro slovenské weby v (nejen) Collection #1.