Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia Tuesday TopDrive KupDnes Navrcholu Bomba NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Proč kleknul NIX?

Výpadek NIXu z minulého týdne nebyl způsoben útokem ale závadou, která dala vzniknout jevu zvanému "broadcast storm". Přesná příčina není známa, stejně jako zařízení. Podobné příhody se bohužel stávají i jinde a nejde je úplně vyloučit. Náš NIX chce čelit možnému opakování přehodnocením pravidel pro připojování k peeringovému segmentu.

Přesně před týdnem, v úterý 11. května v podvečer, se v českém peeringovém centru NIX odehrálo něco velmi nestandardního. Statistiky, ukazující vytížení přípojek jednotlivých členů, mezi 16 a 18 hodinou vylétly do závratných výšin.

Část statistik
1188

Zatímco statistiky ukazovaly takto extrémně zvýšený provoz, „užitečný“ provoz skrze NIX naopak téměř neprocházel, a tak to na svých bedrech pocítili i koncoví uživatelé – někdo se svých dat nedočkal vůbec, a někdo si musel počkat podstatně déle než jindy.

První úvahy a spekulace o tom, co se vlastně v NIXu stalo, směřovaly cestou úvah o útoku typu DoS (Denial of Service). Tedy toho, že někdo cíleně bombardoval uzly NIXu svými požadavky s cílem úplně je zahltit. Další verzí bylo to, že do jednoho ze čtyř peeringových středisek NIXu (konkrétně do budovy Sitelu) uhodil blesk a poškodil některá zařízení.

Konkrétní vysvětlení nenabízely ani maily, které někteří provideři rozesílali svým zákazníkům:

Vazeni zakaznici,
dnes 11.5.2004 v cca 16:30 doslo k poruse L2 infrastruktury ceskeho peeringoveho centra NIX a nasledkem toho k preruseni vzajemneho propojeni vsech operatoru. Vysledkem byl temer 90ti minutovy vypadek celeho ceskeho internetu. Za problemy se omlouvame, bohuzel chyba nebyla na nasi strane a ani nesla nijak jednoduse odstranit. V kooperaci s ostatnimi operatory byla situace vyresena kolem 18. hodiny, na zjistovani pricin se nadale pracuje – dalsi komplikace by jiz nastat nemely…

Co se stalo?

Podle informací, které se mi podařilo z NIXu získat, nešlo o žádný útok zvenčí, ale o specifickou závadu některého ze zařízení v NIXu, která vyvolala tzv. broadcast storm. Ten pak zahltil prakticky všechny přípojky členů NIXu, a skončil až tím, že se příslušná zařízení různě povypínala, odpojila atd.

Pro toho, kdo se nechce moc zabývat detaily, si dovolím připodobnit „broadcast storm“ ke slovní přestřelce či tzv. „flame war“ (v diskusích): někdo nadhodí do pléna něco, co všechny ostatní nadzdvihne ze židle a okamžitě na to reagují stejně ostře. Každý pak z plna hrdla křičí na všechny ostatní (generuje velký datový provoz, viz statistiky) a odmítá s tím skončit. Nepomůže nic jiného než násilné „zavření úst“ (odpojení, restart atd.).

Co přesně se odehrálo na začátku a kdo byl iniciátorem přestřelky (čí zařízení způsobilo vznik broadcast stormu), se mi zjistit nepodařilo. Zdroje z NIXu jsou v tomto ohledu velmi diplomatické a říkají, že se to nedá stoprocentně určit. Hypotéz je více, některé hovoří o čistě technické závadě, jiné zase o poškození v důsledku úderu blesku. Zajímavé jsou i samotné statistiky z doby přestřelky

1189
1190
1191

Stává se to?


Zákonitá otázka, která se okamžitě nabízí, je to zda se podobné příhody občas stávají, nebo zda je to něco nevídaného a unikátního. Odpověď je taková, že zcela unikátní to není a že přes veškerou péči a snahu o předcházení k tomu dochází i v jiných peeringových centrech. Například zde je popisován obdobný příklad, který se stal v říjnu roku 2001 ve Velké Británii tamnímu peeringovému centru LINX. Také tehdy to ovlivnilo většinu provozu v celé zemi a první reakce také byly takové, že někdo atakuje LINX útokem DOS (viz zde). Nakonec se ale ukázalo, že i zde to byl „broadcast storm“.

Podle informací z našeho NIXu to ani u nás nebylo úplně poprvé. I v minulosti s prý vyskytly „broadcast storms“, ale nikdy nebyly tak rozsáhlé. Vždy se je podařilo eliminovat, aby neměly výraznější dopady na český Internet a provoz v něm.

Proč?


Důvody toho, proč „broadcast storm“ v peeringových centrech vzniká, je třeba hledat ve způsobu jejich technického řešení. Náš NIX se v tomto ohledu nijak neliší od ostatních ve světě: všechny přípojky jednotlivých operátorů (členů NIXu) jsou propojeny na úrovni linkové vrstvy (druhé vrstvy ISO/OSI modelu, tj. L2). Navzájem si tedy vyměňují linkové rámce (konkrétně ethernetové) způsobem, který je označován jako switching. Zařízení, které tak činí, je tzv. switchem. Náš NIX používá switche řady Catalyst od firmy Cisco, konkrétně modely 3550, 6006, 6505 a 6506. V každém ze čtyř současných propojovacích bodů NIXu (v objektech ČRa, GTS, Pragonetu a Sitelu) je umístěn takovýto switch a všechny jsou vzájemně propojeny (topologie).

Tímto propojením switchů (na úrovni linkové vrstvy) vzniká jedna velká „plochá“ IP síť, která tudíž tvoří jedinou broadcast doménu: kdykoli někdo vyšle tzv. broadcast (rámec určený všem), všechny switche jej musí rozeslat do všech směrů (do všech přípojek, které jsou na ně napojeny). Takže pokud nějaké zařízení začne rozesílat zvýšené množství broadcastů, začne tím významně zatěžovat celou síť (celou soustavu vzájemně propojených switchů). Pokud přitom ještě udělá chybu a rozesílá broadcastový rámec s chybným obsahem, na který příjemce reaguje také broadcastem, vzniká okamžitě řetězová reakce, která prudce eskaluje a téměř okamžitě zahltí veškerou dostupnou kapacitu – a právě to je tzv. broadcast storm.

Nebezpečí vzniku broadcast stormů je v odborné literatuře běžně uváděno jako jeden z argumentů, proč není dobré dělat „příliš velké“ sítě jen pomocí switchů – právě proto, že tím vzniká příliš velká broadcastová doména, která musí šířit všechny broadcasty do všech svých částí. Obecným řešením je rozbít takovouto příliš velkou síť na menší části a učinit z nich samostatné sítě, a tím i samostatné broadcast domény (a vzájemně je propojit na úrovni síťové vrstvy, tedy pomocí směrovačů).

Takovéto obecné řešení by teoreticky připadalo v úvahu i pro realizaci peeringových center. Představovalo by ovšem větší zátěž na aktivní síťové prvky (směrovače místo switchů), bylo by pomalejší a také dražší. Pokud je mi známo, snad se ani nikde v peeringových centrech nepoužívá.

UX konference
       

Dalším řešením, které připadá v úvahu, je ponechat společný segment, zajišťující peering, na úrovni vrstvy linkové, ale každou přípojku povinně „protáhnout“ přes samostatný směrovač. Ten by pak mohl eliminovat případné problémy s broadcasty, ale i on bude hodně zatížen, bude drahý, bude zpomalovat přenosy – a také on se může „zbláznit“ a vyvolat nějaké problémy. Absolutně spolehlivé řešení neexistuje (kromě úplného rozpojení).

Informace z NIXu hovoří o tom, že snahy zabránit eventuelnímu opakování události z minulého týdne se ubírají hlavně cestou přehodnocení (dosud skutečně dosti liberálních) pravidel toho, jak se členové NIXu připojují ke společnému (peeringovému) segmentu.

Anketa

Pocítili jste problémy v NIXu minulý týden?

       

Jiří Peterka

Autor je nezávislým konzultantem a publicistou. Věnuje se také pedagogické činnosti na MFF UK, kde přednáší problematiku počítačových sítí a komunikací.

Školení Twitteru s Danem Dočekalem

DW - Školení PPC
  • Jak komunikovat na Twitteru.
  • Jak začlenit Twitter do marketingového mixu vaší firmy.
  • Jak využít Twitter jako zdroj informací pro rozhodování.
  • Nabízíme i školení Facebooku a Google+.

Detailní informace o školení Twitteru »

Přehled názorů

Broadcasty?
Roman 18. 5. 2004 07:42
Nový
├ 
Re: Broadcasty?
Petr Souček 18. 5. 2004 07:59
Nový
│
└ 
Re: Broadcasty?
ZP 18. 5. 2004 09:18
Nový
│
 
└ 
Re: Broadcasty?
Hynek Med 18. 5. 2004 18:43
Nový
└ 
Re: Broadcasty?
EW 18. 5. 2004 18:57
Nový
 
├ 
Re: Broadcasty?
Dusan 18. 5. 2004 19:36
Nový
 
│
└ 
Re: Broadcasty?
EW 18. 5. 2004 20:51
Nový
 
│
 
└ 
Re: Broadcasty?
anonymní uživatel 19. 5. 2004 09:08
Nový
 
├ 
Re: Broadcasty?
anonymní uživatel 19. 5. 2004 00:53
Nový
 
└ 
Re: Broadcasty?
jantar 19. 5. 2004 09:11
Nový
 
 
└ 
Re: Broadcasty?
EW 19. 5. 2004 20:48
Nový
 
 
 
└ 
Re: Broadcasty?
jantar 20. 5. 2004 08:57
Nový
lkh
Anička Balounová 18. 5. 2004 08:24
Nový
└ 
A co Windowsy - ty to zvladaji pravidelne
Zdenka Kralova 18. 5. 2004 08:32
Nový
Broadcast storm
Anonym 18. 5. 2004 09:01
Nový
Den poté
Brouk Pytlik 18. 5. 2004 09:50
Nový
└ 
Re: Den poté
rezavy 18. 5. 2004 10:55
Nový
Re: Přesná příčina není známa
rewaq 18. 5. 2004 10:10
Nový
└ 
Re: Přesná příčina není známa
anonymní uživatel 18. 5. 2004 10:29
Nový
není znám původce? Tak se koukněte pořádně
noname 18. 5. 2004 10:27
Nový
├ 
Re: není znám původce? Tak se koukněte pořádně
anonymní uživatel 18. 5. 2004 10:31
Nový
└ 
Re: není znám původce? Tak se koukněte pořádně
Lubos Pinkava 18. 5. 2004 11:24
Nový
 
└ 
Re: není znám původce? Tak se koukněte pořádně
noname 18. 5. 2004 12:47
Nový
 
 
├ 
Re: není znám původce? Tak se koukněte pořádně
noname 18. 5. 2004 12:48
Nový
 
 
├ 
Re: není znám původce? Tak se koukněte pořádně
Borivoj 18. 5. 2004 13:02
Nový
 
 
│
└ 
Re: není znám původce? Tak se koukněte pořádně
noname 18. 5. 2004 15:36
Nový
 
 
│
 
└ 
Re: není znám původce? Tak se koukněte pořádně
anonymní uživatel 18. 5. 2004 16:01
Nový
 
 
│
 
 
└ 
Re: není znám původce? Tak se koukněte pořádně
noname 18. 5. 2004 22:03
Nový
 
 
├ 
Re: není znám původce? Tak se koukněte pořádně
anonymní uživatel 18. 5. 2004 14:11
Nový
 
 
│
└ 
Re: není znám původce? Tak se koukněte pořádně
noname 18. 5. 2004 15:42
Nový
 
 
│
 
├ 
Re: není znám původce? Tak se koukněte pořádně
Borivoj 18. 5. 2004 15:53
Nový
 
 
│
 
└ 
Re: není znám původce? Tak se koukněte pořádně
anonymní uživatel 18. 5. 2004 15:54
Nový
 
 
│
 
 
└ 
Re: není znám původce? Tak se koukněte pořádně
noname 18. 5. 2004 22:01
Nový
 
 
│
 
 
 
└ 
Re: není znám původce? Tak se koukněte pořádně
anonymní uživatel 19. 5. 2004 00:50
Nový
 
 
│
 
 
 
 
├ 
Re: není znám původce? Tak se koukněte pořádně
Myšel 19. 5. 2004 11:20
Nový
 
 
│
 
 
 
 
└ 
Re: není znám původce? Tak se koukněte pořádně
noname 19. 5. 2004 11:31
Nový
 
 
│
 
 
 
 
 
├ 
Re: není znám původce? Tak se koukněte pořádně
nobody 19. 5. 2004 14:57
Nový
 
 
│
 
 
 
 
 
└ 
Re: není znám původce? Tak se koukněte pořádně
anonymní uživatel 19. 5. 2004 14:59
Nový
 
 
│
 
 
 
 
 
 
└ 
Re: není znám původce? Tak se koukněte pořádně
noname 19. 5. 2004 16:23
Nový
 
 
│
 
 
 
 
 
 
 
├ 
Re: není znám původce? Tak se koukněte pořádně
abc123 19. 5. 2004 16:58
Nový
 
 
│
 
 
 
 
 
 
 
│
└ 
Re: není znám původce? Tak se koukněte pořádně
anonymní uživatel 19. 5. 2004 19:16
Nový
 
 
│
 
 
 
 
 
 
 
├ 
Re: není znám původce? Tak se koukněte pořádně
Petr Souček 19. 5. 2004 19:45
Nový
 
 
│
 
 
 
 
 
 
 
└ 
Re: není znám původce? Tak se koukněte pořádně
Karel Sotkovsky - TeliaSonera IC 20. 5. 2004 09:51
Nový
 
 
├ 
Re: není znám původce? Tak se koukněte pořádně
Petr M 18. 5. 2004 19:47
Nový
 
 
└ 
Re: není znám původce? Tak se koukněte pořádně
majkl 18. 5. 2004 21:52
Nový
 
 
 
└ 
Re: není znám původce? Tak se koukněte pořádně
iNDY 19. 5. 2004 14:11
Nový
 
 
 
 
└ 
Re: není znám původce? Tak se koukněte pořádně
majkl 20. 5. 2004 12:18
Nový
 
 
 
 
 
└ 
Re: není znám původce? Tak se koukněte pořádně
iNDY 20. 5. 2004 12:59
Nový
Blesky?
brtnik.bcd 18. 5. 2004 10:35
Nový
├ 
Re: Blesky?
Petr Liskar 18. 5. 2004 11:45
Nový
│
└ 
Re: Blesky?
brtnik.bcd 18. 5. 2004 23:36
Nový
└ 
Re: Blesky?
Snoopy 18. 5. 2004 12:59
Nový
NIX 8.5.2004
Petr 18. 5. 2004 10:52
Nový
To by mne zajimalo proc ...
Dusan 18. 5. 2004 12:05
Nový
├ 
Re: To by mne zajimalo proc ...
Hynek Med 18. 5. 2004 18:45
Nový
│
└ 
Re: To by mne zajimalo proc ...
Dusan 19. 5. 2004 09:07
Nový
└ 
Re: To by mne zajimalo proc ...
majkl 18. 5. 2004 22:09
Nový
 
└ 
Re: To by mne zajimalo proc ...
Dusan 19. 5. 2004 09:11
Nový
broadcast storm
Dildo 19. 5. 2004 00:32
Nový
├ 
Re: broadcast storm
profix 19. 5. 2004 02:14
Nový
├ 
Re: broadcast storm
anonymní uživatel 19. 5. 2004 10:28
Nový
│
└ 
Re: broadcast storm
Dildo 19. 5. 2004 10:30
Nový
├ 
Re: Dildo
p 19. 5. 2004 20:14
Nový
│
└ 
Re: Dildo
anonymní uživatel 20. 5. 2004 08:59
Nový
├ 
Re: broadcast storm
........... 19. 5. 2004 23:12
Nový
│
└ 
Re: broadcast storm
. 7. 6. 2004 09:44
Nový
└ 
Re: broadcast storm
David Rohleder 20. 5. 2004 11:31
Nový
 
└ 
Re: broadcast storm
Dildo 21. 5. 2004 09:49
Nový
 
 
└ 
Re: broadcast storm
anonymní uživatel 21. 5. 2004 10:36
Nový
 
 
 
└ 
Re: broadcast storm
Dildo 21. 5. 2004 12:54
Nový
 
 
 
 
└ 
Re: broadcast storm
anonymní uživatel 21. 5. 2004 13:07
Nový
 
 
 
 
 
├ 
Re: broadcast storm
noname 21. 5. 2004 17:28
Nový
 
 
 
 
 
└ 
Re: broadcast storm
Dildo 21. 5. 2004 18:41
Nový
       

Tento text je již více než dva měsíce starý. Chcete-li na něj reagovat v diskusi, pravděpodobně vám již nikdo neodpoví. Pro řešení aktuálních problémů doporučujeme využít naše diskusní fórum.

Zasílat nově přidané příspěvky e-mailem