Seznam měl výpadek kvůli proudu
5. 7. 2006 0:16
Jiří Macich ml.
Poprvé po pěti letech provozu v telehouse TTC Teleport v přažských Malešicích včera večer vypadl elektrický proud, což mělo za následek výpadek několika stovek serverů trvající 30 minut (od 21:30 do 22:00). Mezi postiženými byl i portál Seznam nebo servery obsluhující přenositelnost pevných telefonních čísel. Ihned po naskočení napájení se objevily problémy s konektivitou. (Hostovinky.cz)
Dále čtěte…
- Centrum.cz je nedostupné, může za to pravděpodobně výpadek proudu 3. 5. 2011 20:13
- Oficiální spamer českého internetu Banán s.r.o. byl hacknut 19. 1. 2010 11:17
- SourceForge.net má český mirror, zajišťuje jej IGNUM 8. 12. 2009 8:41
- Byly vyhlášeny výsledky soutěže Top hostingy 2009 25. 11. 2009 16:25
- Top hostingy 2009: začalo veřejné hlasování 30. 9. 2009 9:07
uživatel si přál zůstat v anonymitě
5. 7. 2006 0:54
Nový
...ach to opisovani :)
celé vlákno
...staci se podivat na verejne statistiky NIXu a je videt, ze k vypadku doslo jiz po pul devate - nikoliv v pul desate, jak publikum presvedcuje mladenec Cendru ;)
uživatel si přál zůstat v anonymitě
5. 7. 2006 0:57
Nový
Re: ...ach to opisovani :)
celé vlákno
hmm, a HM seznamu nejede do včil.
uživatel si přál zůstat v anonymitě
5. 7. 2006 0:57
Nový
Re: ...ach to opisovani :)
celé vlákno
HP - samozřejmě ;-)
M jako Molitan (neregistrovaný)
5. 7. 2006 10:35
Nový
Re: ...ach to opisovani :)
celé vlákno
Nejde vam take prihlasit se do SKlik?
uživatel si přál zůstat v anonymitě
5. 7. 2006 9:56
Nový
Re: ...ach to opisovani :)
celé vlákno
ja teda nevim ale seznam vypad v pul devaty a jeste v pul jedny v noci nesel, tak co melou o 30 minutach
uživatel si přál zůstat v anonymitě
5. 7. 2006 10:19
Nový
Re: ...ach to opisovani :)
celé vlákno
Nekteri holt melou... a jini to bezmyslenkovite opisou ;-)
pavel (neregistrovaný)
5. 7. 2006 20:22
Nový
Re: ...ach to opisovani :)
celé vlákno
No výpadek byl od půl devátý někdy do jedenácti nebo půl dvanáctý, potom všechno naběhlo. Kromě seznamu, ten se z toho rozsypal a ještě teď to možná neni úplně v pořádku.
uživatel si přál zůstat v anonymitě
5. 7. 2006 1:01
Nový
Já Vám dám Koudelku......
celé vlákno
Nechval dne před večerem...Doufám,že ráno už to poběží.Problém nebude jen v Malešicích :-))))
Seznam.cz
Čas: 0:59 hod.
NĚKTERÁ Z KOMPONENT SYSTÉMU NEBĚŽÍ
< zpět na prihlaseni
Seznam.cz
Čas: 0:59 hod.
NĚKTERÁ Z KOMPONENT SYSTÉMU NEBĚŽÍ
< zpět na prihlaseni
D (neregistrovaný)
5. 7. 2006 8:37
Nový
Re: Já Vám dám Koudelku......
celé vlákno
Hm, tak třeba mail rozhraní mi nejede už několk dní, tuším od neděle, a nejde to ani teď!! - "NĚKTERÁ Z KOMPONENT SYSTÉMU NEBĚŽÍ" Hmmm... :(
kix (neregistrovaný)
5. 7. 2006 8:41
Nový
napájení
celé vlákno
Takové hostingové centrum nemá záložní napájení? To se mi nechce věřit.
Michal Kára (neregistrovaný)
5. 7. 2006 9:18
Nový
Re: napájení
celé vlákno
Ma, ale pokud vypadnou pojistky az za zaloznim zdrojem, tak je to na dve veci. (Nevim, jestli tohle byl presne ten pripad.)
mirdaz (neregistrovaný)
5. 7. 2006 10:25
Nový
doplnění
celé vlákno
Ještě ve dvě v noci nic nešlo, ale to je asi normální, asi není sranda vše po takovém výpadku zprovoznit
5. 7. 2006 10:33
Nový
nejen TTC
celé vlákno
Tech problemu bylo vcera zrejme vic.
V pul devate vypadl jeden spoj net4netu (ke kteremu je pripojen i Seznam) do nixu, cast provozu se preroutovala pres druhy spoj.
Zrejme to bylo nasledkem vypadku nejakeho optickeho switche (at uz kvuli ztrate napajeni nebo z jineho duvodu). Spoj nabehl v 11 vecer, jestli zaroven s tim nabehl i seznam, to nevim, uz jsem byl offline :)
Takze tak...
V pul devate vypadl jeden spoj net4netu (ke kteremu je pripojen i Seznam) do nixu, cast provozu se preroutovala pres druhy spoj.
Zrejme to bylo nasledkem vypadku nejakeho optickeho switche (at uz kvuli ztrate napajeni nebo z jineho duvodu). Spoj nabehl v 11 vecer, jestli zaroven s tim nabehl i seznam, to nevim, uz jsem byl offline :)
Takze tak...
uživatel si přál zůstat v anonymitě
5. 7. 2006 11:29
Nový
Re: nejen TTC
celé vlákno
net4neti swicthe jsou umisteny v TTC, takze byly bez napajeni.
Seznam skutecne nejel dele, maji tusim pres 300 serveru a prece jen nikdo nemuze byt staveny na reseni tak rozsahleho vypadku do 30 minut, to by musel u kazdeho serveru stat jeden clovek. Jenze v noci pred svatecnim dnem byla pulka republiky pod parou, takze jestli sehnali 4 zive adminy tak to bylo moc, navic tim ze se dlouho probirala sit net4net, tak se tam admini asi nedostali vzdalene, museli jet na misto a potom zase narazite na nedostatek konzoli na kterych je mozne neco delat. I kdyz 4 vlastni tam seznam asi ma. Navic kdyz slo dolu napajeni, tak tam byly asi velke napetove vykyvy, takze stroje byly obecne v horsim stavu, nez kdyby je jen tak nekdo vypnul.
A ze cendra keca o rozsahu vypadku tak nejak patri k jeho koloritu.
Seznam skutecne nejel dele, maji tusim pres 300 serveru a prece jen nikdo nemuze byt staveny na reseni tak rozsahleho vypadku do 30 minut, to by musel u kazdeho serveru stat jeden clovek. Jenze v noci pred svatecnim dnem byla pulka republiky pod parou, takze jestli sehnali 4 zive adminy tak to bylo moc, navic tim ze se dlouho probirala sit net4net, tak se tam admini asi nedostali vzdalene, museli jet na misto a potom zase narazite na nedostatek konzoli na kterych je mozne neco delat. I kdyz 4 vlastni tam seznam asi ma. Navic kdyz slo dolu napajeni, tak tam byly asi velke napetove vykyvy, takze stroje byly obecne v horsim stavu, nez kdyby je jen tak nekdo vypnul.
A ze cendra keca o rozsahu vypadku tak nejak patri k jeho koloritu.
uživatel si přál zůstat v anonymitě
5. 7. 2006 13:04
Nový
Re: nejen TTC
celé vlákno
Já si tedy myslím,že pokud byli pod parou,tak nyní vyspávají opici nebo že by zase Malešice? :-))) jj Seznam,tak tohle tedy neznám......
Seznam.cz
Čas: 13:02 hod.
NĚKTERÁ Z KOMPONENT SYSTÉMU NEBĚŽÍ
< zpět na prihlaseni
Seznam.cz
Čas: 13:02 hod.
NĚKTERÁ Z KOMPONENT SYSTÉMU NEBĚŽÍ
< zpět na prihlaseni
uživatel si přál zůstat v anonymitě
5. 7. 2006 11:59
Nový
Nechapu...
celé vlákno
...proc by meli admini jednotlive servery ozivovat z konzole. Pokud slo opravdu jen o vypadek proudu, takovy server by mel byt schopny opetovne nastartovat sam, at uz je jeden, nebo tri stovky :/
lahvon (neregistrovaný)
7. 7. 2006 12:31
Nový
Re: Nechapu...
celé vlákno
Pravidlo cislo jedna.
Cemu nerozumim, do toho nemluvim a nasloucham, nebo se ptam.
Pokud vypnes samostatny server korektne a znovy ho zapnes, tak ve vetsine pripadu vse pojede jak ma.
Pokud mas serverove clustery, provazane servery, externi diskova pole a jine vopicarny a zcela nekorektne v pulce relaci vypnes proud, tak si tim cely system rozsypes.
Nekonzistence databazi, nekorektne zapsana data na diskovych polich, atd.
Stejne tak zapinani tak rozsahleho systemu - site serveru neni zadna prdel. Musis to nahazovat postupne, u vseho overovat funkcnost a konzistenci dat, zapinat jednotlive casti postupne, podle predem daneho postupu. Tak aby vse jelo jak ma.
A mezi tim jeste resit chyby dane nekorektnim vypnutim.
Tohle neni zadna prdel, kdyz mas 6 serveru a diskovych poli. Natoz kdyz jich mas stovky.
Ale chapu, ze pro nekoho, kdo ma doma jeden SOHO routrik a 3 desktopy, ze pro nej to muze byt spanelska vesnice. Pak se ale takovy uzivatel muze zdrzet chytrackejch kecu.
Cemu nerozumim, do toho nemluvim a nasloucham, nebo se ptam.
Pokud vypnes samostatny server korektne a znovy ho zapnes, tak ve vetsine pripadu vse pojede jak ma.
Pokud mas serverove clustery, provazane servery, externi diskova pole a jine vopicarny a zcela nekorektne v pulce relaci vypnes proud, tak si tim cely system rozsypes.
Nekonzistence databazi, nekorektne zapsana data na diskovych polich, atd.
Stejne tak zapinani tak rozsahleho systemu - site serveru neni zadna prdel. Musis to nahazovat postupne, u vseho overovat funkcnost a konzistenci dat, zapinat jednotlive casti postupne, podle predem daneho postupu. Tak aby vse jelo jak ma.
A mezi tim jeste resit chyby dane nekorektnim vypnutim.
Tohle neni zadna prdel, kdyz mas 6 serveru a diskovych poli. Natoz kdyz jich mas stovky.
Ale chapu, ze pro nekoho, kdo ma doma jeden SOHO routrik a 3 desktopy, ze pro nej to muze byt spanelska vesnice. Pak se ale takovy uzivatel muze zdrzet chytrackejch kecu.
uživatel si přál zůstat v anonymitě
7. 7. 2006 12:56
Nový
Re: Nechapu...
celé vlákno
takze zrejme prispevek jednoho z adminu seznamu, ktery si kdysi usetril praci a ted ma fofry :)
Doby kdy me jeden domaci routrik a 2 desktopy zamestnaly na 24h denne jsou pryc. Sice nespravuju 300 serveru, ale sakra dobre vim, jake problemy muzou nastat pri takovem vypadku.
Ale na tohle se ma myslet uz od zacatku, delat neco jen "na pul" je k nicemu...
Doby kdy me jeden domaci routrik a 2 desktopy zamestnaly na 24h denne jsou pryc. Sice nespravuju 300 serveru, ale sakra dobre vim, jake problemy muzou nastat pri takovem vypadku.
Ale na tohle se ma myslet uz od zacatku, delat neco jen "na pul" je k nicemu...
Michal Kára (neregistrovaný)
7. 7. 2006 13:27
Nový
Re: Nechapu...
celé vlákno
Troufam si tvrdit, ze Centrum by to prezilo lip (pokud by nebyla nejaka velka smula). Koneckoncu, nedavno na Naganu vypadla klima, takze se dost serveru prehralo a poroucelo dolu (coz je horsi, nez kdyby jen vypadl proud) a taky nebyl problem.
Druha vec je, ze moc neverim tomu, ze by se neztratily vubec zadne maily... To by se musela informace o mailu pred poslanim OK na SMTP DATA prikaz fdatasync()ovat na disk. Coz by zbrzdovalo a v pripade ukladani informaci do DB je to i dost obtizne proveditelne.
Druha vec je, ze moc neverim tomu, ze by se neztratily vubec zadne maily... To by se musela informace o mailu pred poslanim OK na SMTP DATA prikaz fdatasync()ovat na disk. Coz by zbrzdovalo a v pripade ukladani informaci do DB je to i dost obtizne proveditelne.
7. 7. 2006 13:55
Nový
Re: Nechapu...
celé vlákno
Heh zasada prvni-1 - kdyz poucuju ostatni, ridim se alespon pravidly, ktera jim vtloukam...:-)
Aneb transakce (a je uplne putna, co si pod timto abstraktnim pojmem predstavite za implementaci) se odroluje a jede se dal, zadna potvrzena data v haji, zadne rozpadle systemy...
10. 7. 2006 8:07
Nový
Re: Nechapu...
celé vlákno
Bohuzel je to slozitejsi. Fyzicke disky mivaji cache, RAIDove radice taky. Databazovy server obvykle nema moznost pockat, az budou data fyzicky ulozena na disku - ten si mysli, ze je vsechno OK uz kdyz jsou v cache radice. Proti vypadku proudu (zvlast fyzickemu, kdy mohlo dojit k nejakemu kolisani) se softwarove branit prakticky nelze, klicova je hardwarova odolnost jednotlivych komponent. Druha vec je, ze tato hardwarova odolnost by mela byt vetsi u profesionalnich serveru nez u bezneho desktopoveho HW.
10. 7. 2006 8:44
Nový
Re: Nechapu...
celé vlákno
No, prave proto se doporucuje transakcni logy a vubec soubory tvorici tablespace databazi umistovat na RAID s vypnutou kesi pro zapis (staci pro cteni) - diky tomu, ze ctecich operaci e o par radu vice nez zapisovych tak to vetsinou vykonove neni zadny problem...
uživatel si přál zůstat v anonymitě
10. 7. 2006 9:29
Nový
Re: Nechapu...
celé vlákno
Ale tfuj, jednak tento konkretni problem beze zbytku resi Write-Through cache... a navic, ona takova financne bezcenna zalezitost jako baterie, ktera je schopna zapsat vse z radice na disk za dobu kratsi nez 1s je dobra vec... A to, ze se server ma korektne vypnout je otazka spoluprace UPS a stroje... (a to i po vypadku jisticu)... On-line UPS nejsou nejlevnejsi, ale pokud chcete 100% bezpeci, tak jinak nez redundanci toho nedosahnete...
11. 7. 2006 20:42
Nový
Re: Nechapu...
celé vlákno
No teda ja bych se citil jak blbec kdybych v hostingovem centru se zarucenym zalohovanym napajeni jeste daval kazdy server na UPS ...
11. 7. 2006 21:26
Nový
Re: Nechapu...
celé vlákno
Pokud mate redundantni zdroje a centrum Vam nedoda dve nezavisle vetve (dedikovane od centralniho jistice pouze Vam, o sdilenem segmentu vubec neuvazuji) energie to nevidim jako nenormalni... Ta pretizenost UPS je podivna, jak uz bylo naznaceno, kdyz nabeh (coz je taky spicka jak hrom) pred generatorem (coz je doba nezanedbatelna) unesla v pohode...
lahvon (neregistrovaný)
7. 7. 2006 12:31
Nový
Re: Nechapu...
celé vlákno
Pravidlo cislo jedna.
Cemu nerozumim, do toho nemluvim a nasloucham, nebo se ptam.
Pokud vypnes samostatny server korektne a znovy ho zapnes, tak ve vetsine pripadu vse pojede jak ma.
Pokud mas serverove clustery, provazane servery, externi diskova pole a jine vopicarny a zcela nekorektne v pulce relaci vypnes proud, tak si tim cely system rozsypes.
Nekonzistence databazi, nekorektne zapsana data na diskovych polich, atd.
Stejne tak zapinani tak rozsahleho systemu - site serveru neni zadna prdel. Musis to nahazovat postupne, u vseho overovat funkcnost a konzistenci dat, zapinat jednotlive casti postupne, podle predem daneho postupu. Tak aby vse jelo jak ma.
A mezi tim jeste resit chyby dane nekorektnim vypnutim.
Tohle neni zadna prdel, kdyz mas 6 serveru a diskovych poli. Natoz kdyz jich mas stovky.
Ale chapu, ze pro nekoho, kdo ma doma jeden SOHO routrik a 3 desktopy, ze pro nej to muze byt spanelska vesnice. Pak se ale takovy uzivatel muze zdrzet chytrackejch kecu.
Cemu nerozumim, do toho nemluvim a nasloucham, nebo se ptam.
Pokud vypnes samostatny server korektne a znovy ho zapnes, tak ve vetsine pripadu vse pojede jak ma.
Pokud mas serverove clustery, provazane servery, externi diskova pole a jine vopicarny a zcela nekorektne v pulce relaci vypnes proud, tak si tim cely system rozsypes.
Nekonzistence databazi, nekorektne zapsana data na diskovych polich, atd.
Stejne tak zapinani tak rozsahleho systemu - site serveru neni zadna prdel. Musis to nahazovat postupne, u vseho overovat funkcnost a konzistenci dat, zapinat jednotlive casti postupne, podle predem daneho postupu. Tak aby vse jelo jak ma.
A mezi tim jeste resit chyby dane nekorektnim vypnutim.
Tohle neni zadna prdel, kdyz mas 6 serveru a diskovych poli. Natoz kdyz jich mas stovky.
Ale chapu, ze pro nekoho, kdo ma doma jeden SOHO routrik a 3 desktopy, ze pro nej to muze byt spanelska vesnice. Pak se ale takovy uzivatel muze zdrzet chytrackejch kecu.
ldx (neregistrovaný)
5. 7. 2006 14:28
Nový
Radio Akropolis
celé vlákno
Vcera asi pul dne nejelo me oblibene radio Akropolis. Ani ogg stream, ani webserver, nic! Uz jsem se lek, ze se snad zrusili nebo co :-/
uživatel si přál zůstat v anonymitě
5. 7. 2006 17:35
Nový
Výpadek Seznamu
celé vlákno
Jo, tak začalo to maily, to předevčírem a včera i celým Seznamem. Ten dělá opět mrtvého brouka.... Ale není to jen Malešicemi, je to i dalšími... Takže, milý Ivo, prosím o soustředění se na jistotu a bezpečnost a energetické zázemí... nešlo to od cca 20:30 do 3:30 a ještě dnes se zobrazovaly staré informace na HP...
Rich Ard (neregistrovaný)
5. 7. 2006 18:40
Nový
Re: Výpadek Seznamu
celé vlákno
Na Seznamu vylaďují drobné chyby, ale nějak se jim to nedaří a začalo to zhruba před 2 týdny(zmizly ikony v diskuzi) a dnes to má pokračování - nejde se přihlásit do diskuze.
Dtz (neregistrovaný)
5. 7. 2006 18:50
Nový
Seznam :(
celé vlákno
Mají to řádně dojebkané, Seznam, smail, novinky.cz,... nic nejede jak ma!
rogue (neregistrovaný)
5. 7. 2006 21:37
Nový
LOL
celé vlákno
Byl jsem dnes na stránkách apc.cz a narazil jsem na tuhle tiskovou zprávu:
Případová studie TTC Teleport
TTC Teleport: Tam, kde nikdy nevypadne elektřina
Kvůli velkému rozsahu sem dávám jen hlavičku, ostatní si můžete dočíst na www.apc.cz
Případová studie TTC Teleport
TTC Teleport: Tam, kde nikdy nevypadne elektřina
Kvůli velkému rozsahu sem dávám jen hlavičku, ostatní si můžete dočíst na www.apc.cz
5. 7. 2006 21:39
Nový
jeden server vs 300 serverov
celé vlákno
Ak ma niekto jeden server, tak ak nabehne, tak staci len skontrolovat, ci bezia vsetky dolezite veci.
Ak ma niekto viac serverov, tak nie su navzajom nezavysle.
Mame servery v GTS, nie je ich 300 :)) ale ak chcem aby vsetko bezalo ako ma, tak ich musim nahadzovat v urcitom poradi. Napr. file-servery, ktore su na ostatne namountovane cez nfs musim pochopitelne nahodit ako prve. Taktiez databazove serveru musia byt skor. Az po nich mozem nahodit web servery a nakoniec cache servery. V opacnom poradi, pripadne vsetko naraz, by to znamenalo, ze to nenabehne korektne a bolo by nutne vela veci restartovat a nahadzovat rucne.
Takyto postup sa tazko planuje, aby to nabehlo automaticky samo. Preto uplne chapem, ze Seznam sa prebudzal postupne. Ono dost pravdepodobne, po nabehu napajania museli servery najprv povypinat, aby ich zase nahodili tak ako treba....
Ak ma niekto viac serverov, tak nie su navzajom nezavysle.
Mame servery v GTS, nie je ich 300 :)) ale ak chcem aby vsetko bezalo ako ma, tak ich musim nahadzovat v urcitom poradi. Napr. file-servery, ktore su na ostatne namountovane cez nfs musim pochopitelne nahodit ako prve. Taktiez databazove serveru musia byt skor. Az po nich mozem nahodit web servery a nakoniec cache servery. V opacnom poradi, pripadne vsetko naraz, by to znamenalo, ze to nenabehne korektne a bolo by nutne vela veci restartovat a nahadzovat rucne.
Takyto postup sa tazko planuje, aby to nabehlo automaticky samo. Preto uplne chapem, ze Seznam sa prebudzal postupne. Ono dost pravdepodobne, po nabehu napajania museli servery najprv povypinat, aby ich zase nahodili tak ako treba....
6. 7. 2006 2:01
Nový
Re: jeden server vs 300 serverov
celé vlákno
Sorry, ale pokud mají 300 serverů a nahazují to ručně, tak si nic jiného než výpadky elektřiny nezaslouží.
Creckx (neregistrovaný)
6. 7. 2006 3:42
Nový
Re: jeden server vs 300 serverov
celé vlákno
Server by se měl postarat sám o sebe. Pokud nemůže něco udělat jako třeba to přimountování, tak by měl počkata až to bude možné a pak pokračovat dál v nahazování ostatních věcí. Jestli to opravdu mají jak popisuješ tak se divím, že jim to ještě jede.
ertra (neregistrovaný)
6. 7. 2006 15:11
Nový
Re: jeden server vs 300 serverov
celé vlákno
Pokud ma mala firmicka 10 serveru s MySQL a PHP, tak opravdu se mohou po zapnuti sami nahodit.
U slozitejsich systemu, napr banka, seznam, je automaticke nahazovani silenost, protoze vzajemna provazanost systemu je moc velka.
Napr. Oracle je na nestandartni vypnuti tak haklive, ze je lepsi to vzdy prekontrolovat rucne. Uz jsem par databazi ktere se dostaly do stavu corrupted po vypadku produ videl.
Take napr. aplikacni servery (weblogic) se nahazuji (startuji) treba 15 minut.
U slozitejsich systemu, napr banka, seznam, je automaticke nahazovani silenost, protoze vzajemna provazanost systemu je moc velka.
Napr. Oracle je na nestandartni vypnuti tak haklive, ze je lepsi to vzdy prekontrolovat rucne. Uz jsem par databazi ktere se dostaly do stavu corrupted po vypadku produ videl.
Take napr. aplikacni servery (weblogic) se nahazuji (startuji) treba 15 minut.
kvas (neregistrovaný)
6. 7. 2006 23:43
Nový
Re: jeden server vs 300 serverov
celé vlákno
asi je velikej problem otestovat dostupnost sluzby a tim pockat s bootovanim systemu ..... ale proste tam nikdo s nicim takovym nepocital a treba delali takovou vec prvne v zivote :) nebo vy si rebootujete takovou farmu 2x mesicne jen tak z nudy ? poucej se a priste jim to bude makat :)
martin (neregistrovaný)
7. 7. 2006 10:04
Nový
Re: jeden server vs 300 serverov
celé vlákno
.. naivko ;))
7. 7. 2006 12:07
Nový
je to naky dlouhy
celé vlákno
je patek 12hod a mail porad nejede a seznam dela jakoby nic. Maily na helpdesk se vraceji jako nedorucitelne a tlf je permanente obsazen. Co jim brani v tom, aby dali nejakym zpusobem vedet, co se deje? To tam maj vsichni dovolenou?