Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia TopDrive KupDnes Navrcholu NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Seznam měl výpadek kvůli proudu

Poprvé po pěti letech provozu v telehouse TTC Teleport v přažských Malešicích včera večer vypadl elektrický proud, což mělo za následek výpadek několika stovek serverů trvající 30 minut (od 21:30 do 22:00). Mezi postiženými byl i portál Seznam nebo servery obsluhující přenositelnost pevných telefonních čísel. Ihned po naskočení napájení se objevily problémy s konektivitou. (Hostovinky.cz)

Předchozí zprávička Následující zprávička        
uživatel si přál zůstat v anonymitě
5. 7. 2006 0:54 Nový

...ach to opisovani :)

celé vlákno
...staci se podivat na verejne statistiky NIXu a je videt, ze k vypadku doslo jiz po pul devate - nikoliv v pul desate, jak publikum presvedcuje mladenec Cendru ;)
uživatel si přál zůstat v anonymitě
5. 7. 2006 0:57 Nový

Re: ...ach to opisovani :)

celé vlákno
hmm, a HM seznamu nejede do včil.
uživatel si přál zůstat v anonymitě
5. 7. 2006 0:57 Nový

Re: ...ach to opisovani :)

celé vlákno
HP - samozřejmě ;-)
M jako Molitan
M jako Molitan (neregistrovaný)
5. 7. 2006 10:35 Nový

Re: ...ach to opisovani :)

celé vlákno
Nejde vam take prihlasit se do SKlik?
uživatel si přál zůstat v anonymitě
5. 7. 2006 9:56 Nový

Re: ...ach to opisovani :)

celé vlákno
ja teda nevim ale seznam vypad v pul devaty a jeste v pul jedny v noci nesel, tak co melou o 30 minutach
uživatel si přál zůstat v anonymitě
5. 7. 2006 10:19 Nový

Re: ...ach to opisovani :)

celé vlákno
Nekteri holt melou... a jini to bezmyslenkovite opisou ;-)
pavel
pavel (neregistrovaný)
5. 7. 2006 20:22 Nový

Re: ...ach to opisovani :)

celé vlákno
No výpadek byl od půl devátý někdy do jedenácti nebo půl dvanáctý, potom všechno naběhlo. Kromě seznamu, ten se z toho rozsypal a ještě teď to možná neni úplně v pořádku.
uživatel si přál zůstat v anonymitě
5. 7. 2006 1:01 Nový

Já Vám dám Koudelku......

celé vlákno
Nechval dne před večerem...Doufám,že ráno už to poběží.Problém nebude jen v Malešicích :-))))

Seznam.cz

Čas: 0:59 hod.
NĚKTERÁ Z KOMPONENT SYSTÉMU NEBĚŽÍ

< zpět na prihlaseni
D
D (neregistrovaný)
5. 7. 2006 8:37 Nový

Re: Já Vám dám Koudelku......

celé vlákno
Hm, tak třeba mail rozhraní mi nejede už několk dní, tuším od neděle, a nejde to ani teď!! - "NĚKTERÁ Z KOMPONENT SYSTÉMU NEBĚŽÍ" Hmmm... :(
kix
kix (neregistrovaný)
5. 7. 2006 8:41 Nový

napájení

celé vlákno
Takové hostingové centrum nemá záložní napájení? To se mi nechce věřit.
Michal Kára
Michal Kára (neregistrovaný)
5. 7. 2006 9:18 Nový

Re: napájení

celé vlákno
Ma, ale pokud vypadnou pojistky az za zaloznim zdrojem, tak je to na dve veci. (Nevim, jestli tohle byl presne ten pripad.)
mirdaz
mirdaz (neregistrovaný)
5. 7. 2006 10:25 Nový

doplnění

celé vlákno
Ještě ve dvě v noci nic nešlo, ale to je asi normální, asi není sranda vše po takovém výpadku zprovoznit
Luisifer
Luisifer (neregistrovaný)
5. 7. 2006 11:40 Nový

Re: doplnění

celé vlákno
Ještě po třetí ráno nejel.
pavel
pavel (neregistrovaný)
5. 7. 2006 20:23 Nový

Re: doplnění

celé vlákno
nejel ani když si to psal :D
Radek Z. aura:95
5. 7. 2006 10:33 Nový

nejen TTC

celé vlákno
Tech problemu bylo vcera zrejme vic.
V pul devate vypadl jeden spoj net4netu (ke kteremu je pripojen i Seznam) do nixu, cast provozu se preroutovala pres druhy spoj.
Zrejme to bylo nasledkem vypadku nejakeho optickeho switche (at uz kvuli ztrate napajeni nebo z jineho duvodu). Spoj nabehl v 11 vecer, jestli zaroven s tim nabehl i seznam, to nevim, uz jsem byl offline :)

Takze tak...
uživatel si přál zůstat v anonymitě
5. 7. 2006 11:29 Nový

Re: nejen TTC

celé vlákno
net4neti swicthe jsou umisteny v TTC, takze byly bez napajeni.

Seznam skutecne nejel dele, maji tusim pres 300 serveru a prece jen nikdo nemuze byt staveny na reseni tak rozsahleho vypadku do 30 minut, to by musel u kazdeho serveru stat jeden clovek. Jenze v noci pred svatecnim dnem byla pulka republiky pod parou, takze jestli sehnali 4 zive adminy tak to bylo moc, navic tim ze se dlouho probirala sit net4net, tak se tam admini asi nedostali vzdalene, museli jet na misto a potom zase narazite na nedostatek konzoli na kterych je mozne neco delat. I kdyz 4 vlastni tam seznam asi ma. Navic kdyz slo dolu napajeni, tak tam byly asi velke napetove vykyvy, takze stroje byly obecne v horsim stavu, nez kdyby je jen tak nekdo vypnul.

A ze cendra keca o rozsahu vypadku tak nejak patri k jeho koloritu.
uživatel si přál zůstat v anonymitě
5. 7. 2006 13:04 Nový

Re: nejen TTC

celé vlákno
Já si tedy myslím,že pokud byli pod parou,tak nyní vyspávají opici nebo že by zase Malešice? :-))) jj Seznam,tak tohle tedy neznám......

Seznam.cz

Čas: 13:02 hod.
NĚKTERÁ Z KOMPONENT SYSTÉMU NEBĚŽÍ

< zpět na prihlaseni
uživatel si přál zůstat v anonymitě
5. 7. 2006 11:59 Nový

Nechapu...

celé vlákno
...proc by meli admini jednotlive servery ozivovat z konzole. Pokud slo opravdu jen o vypadek proudu, takovy server by mel byt schopny opetovne nastartovat sam, at uz je jeden, nebo tri stovky :/
lahvon
lahvon (neregistrovaný)
7. 7. 2006 12:31 Nový

Re: Nechapu...

celé vlákno
Pravidlo cislo jedna.
Cemu nerozumim, do toho nemluvim a nasloucham, nebo se ptam.


Pokud vypnes samostatny server korektne a znovy ho zapnes, tak ve vetsine pripadu vse pojede jak ma.

Pokud mas serverove clustery, provazane servery, externi diskova pole a jine vopicarny a zcela nekorektne v pulce relaci vypnes proud, tak si tim cely system rozsypes.

Nekonzistence databazi, nekorektne zapsana data na diskovych polich, atd.
Stejne tak zapinani tak rozsahleho systemu - site serveru neni zadna prdel. Musis to nahazovat postupne, u vseho overovat funkcnost a konzistenci dat, zapinat jednotlive casti postupne, podle predem daneho postupu. Tak aby vse jelo jak ma.
A mezi tim jeste resit chyby dane nekorektnim vypnutim.

Tohle neni zadna prdel, kdyz mas 6 serveru a diskovych poli. Natoz kdyz jich mas stovky.


Ale chapu, ze pro nekoho, kdo ma doma jeden SOHO routrik a 3 desktopy, ze pro nej to muze byt spanelska vesnice. Pak se ale takovy uzivatel muze zdrzet chytrackejch kecu.
uživatel si přál zůstat v anonymitě
7. 7. 2006 12:56 Nový

Re: Nechapu...

celé vlákno
takze zrejme prispevek jednoho z adminu seznamu, ktery si kdysi usetril praci a ted ma fofry :)
Doby kdy me jeden domaci routrik a 2 desktopy zamestnaly na 24h denne jsou pryc. Sice nespravuju 300 serveru, ale sakra dobre vim, jake problemy muzou nastat pri takovem vypadku.
Ale na tohle se ma myslet uz od zacatku, delat neco jen "na pul" je k nicemu...
Michal Kára
Michal Kára (neregistrovaný)
7. 7. 2006 13:27 Nový

Re: Nechapu...

celé vlákno
Troufam si tvrdit, ze Centrum by to prezilo lip (pokud by nebyla nejaka velka smula). Koneckoncu, nedavno na Naganu vypadla klima, takze se dost serveru prehralo a poroucelo dolu (coz je horsi, nez kdyby jen vypadl proud) a taky nebyl problem.

Druha vec je, ze moc neverim tomu, ze by se neztratily vubec zadne maily... To by se musela informace o mailu pred poslanim OK na SMTP DATA prikaz fdatasync()ovat na disk. Coz by zbrzdovalo a v pripade ukladani informaci do DB je to i dost obtizne proveditelne.
Pavel Janoušek
7. 7. 2006 13:55 Nový

Re: Nechapu...

celé vlákno
Heh zasada prvni-1 - kdyz poucuju ostatni, ridim se alespon pravidly, ktera jim vtloukam...:-)

Aneb transakce (a je uplne putna, co si pod timto abstraktnim pojmem predstavite za implementaci) se odroluje a jede se dal, zadna potvrzena data v haji, zadne rozpadle systemy...

HK Maly aura:60
10. 7. 2006 8:07 Nový

Re: Nechapu...

celé vlákno
Bohuzel je to slozitejsi. Fyzicke disky mivaji cache, RAIDove radice taky. Databazovy server obvykle nema moznost pockat, az budou data fyzicky ulozena na disku - ten si mysli, ze je vsechno OK uz kdyz jsou v cache radice. Proti vypadku proudu (zvlast fyzickemu, kdy mohlo dojit k nejakemu kolisani) se softwarove branit prakticky nelze, klicova je hardwarova odolnost jednotlivych komponent. Druha vec je, ze tato hardwarova odolnost by mela byt vetsi u profesionalnich serveru nez u bezneho desktopoveho HW.
Artur Linhart
10. 7. 2006 8:44 Nový

Re: Nechapu...

celé vlákno
No, prave proto se doporucuje transakcni logy a vubec soubory tvorici tablespace databazi umistovat na RAID s vypnutou kesi pro zapis (staci pro cteni) - diky tomu, ze ctecich operaci e o par radu vice nez zapisovych tak to vetsinou vykonove neni zadny problem...
uživatel si přál zůstat v anonymitě
10. 7. 2006 9:29 Nový

Re: Nechapu...

celé vlákno
Ale tfuj, jednak tento konkretni problem beze zbytku resi Write-Through cache... a navic, ona takova financne bezcenna zalezitost jako baterie, ktera je schopna zapsat vse z radice na disk za dobu kratsi nez 1s je dobra vec... A to, ze se server ma korektne vypnout je otazka spoluprace UPS a stroje... (a to i po vypadku jisticu)... On-line UPS nejsou nejlevnejsi, ale pokud chcete 100% bezpeci, tak jinak nez redundanci toho nedosahnete...
HK Maly aura:60
11. 7. 2006 20:42 Nový

Re: Nechapu...

celé vlákno
No teda ja bych se citil jak blbec kdybych v hostingovem centru se zarucenym zalohovanym napajeni jeste daval kazdy server na UPS ...
Pavel Janoušek
11. 7. 2006 21:26 Nový

Re: Nechapu...

celé vlákno
Pokud mate redundantni zdroje a centrum Vam nedoda dve nezavisle vetve (dedikovane od centralniho jistice pouze Vam, o sdilenem segmentu vubec neuvazuji) energie to nevidim jako nenormalni... Ta pretizenost UPS je podivna, jak uz bylo naznaceno, kdyz nabeh (coz je taky spicka jak hrom) pred generatorem (coz je doba nezanedbatelna) unesla v pohode...
lahvon
lahvon (neregistrovaný)
7. 7. 2006 12:31 Nový

Re: Nechapu...

celé vlákno
Pravidlo cislo jedna.
Cemu nerozumim, do toho nemluvim a nasloucham, nebo se ptam.


Pokud vypnes samostatny server korektne a znovy ho zapnes, tak ve vetsine pripadu vse pojede jak ma.

Pokud mas serverove clustery, provazane servery, externi diskova pole a jine vopicarny a zcela nekorektne v pulce relaci vypnes proud, tak si tim cely system rozsypes.

Nekonzistence databazi, nekorektne zapsana data na diskovych polich, atd.
Stejne tak zapinani tak rozsahleho systemu - site serveru neni zadna prdel. Musis to nahazovat postupne, u vseho overovat funkcnost a konzistenci dat, zapinat jednotlive casti postupne, podle predem daneho postupu. Tak aby vse jelo jak ma.
A mezi tim jeste resit chyby dane nekorektnim vypnutim.

Tohle neni zadna prdel, kdyz mas 6 serveru a diskovych poli. Natoz kdyz jich mas stovky.


Ale chapu, ze pro nekoho, kdo ma doma jeden SOHO routrik a 3 desktopy, ze pro nej to muze byt spanelska vesnice. Pak se ale takovy uzivatel muze zdrzet chytrackejch kecu.
ldx
ldx (neregistrovaný)
5. 7. 2006 14:28 Nový

Radio Akropolis

celé vlákno
Vcera asi pul dne nejelo me oblibene radio Akropolis. Ani ogg stream, ani webserver, nic! Uz jsem se lek, ze se snad zrusili nebo co :-/
uživatel si přál zůstat v anonymitě
5. 7. 2006 17:35 Nový

Výpadek Seznamu

celé vlákno
Jo, tak začalo to maily, to předevčírem a včera i celým Seznamem. Ten dělá opět mrtvého brouka.... Ale není to jen Malešicemi, je to i dalšími... Takže, milý Ivo, prosím o soustředění se na jistotu a bezpečnost a energetické zázemí... nešlo to od cca 20:30 do 3:30 a ještě dnes se zobrazovaly staré informace na HP...
Rich Ard
Rich Ard (neregistrovaný)
5. 7. 2006 18:40 Nový

Re: Výpadek Seznamu

celé vlákno
Na Seznamu vylaďují drobné chyby, ale nějak se jim to nedaří a začalo to zhruba před 2 týdny(zmizly ikony v diskuzi) a dnes to má pokračování - nejde se přihlásit do diskuze.
Dtz
Dtz (neregistrovaný)
5. 7. 2006 18:50 Nový

Seznam :(

celé vlákno
Mají to řádně dojebkané, Seznam, smail, novinky.cz,... nic nejede jak ma!
rogue
rogue (neregistrovaný)
5. 7. 2006 21:37 Nový

LOL

celé vlákno
Byl jsem dnes na stránkách apc.cz a narazil jsem na tuhle tiskovou zprávu:

Případová studie TTC Teleport

TTC Teleport: Tam, kde nikdy nevypadne elektřina

Kvůli velkému rozsahu sem dávám jen hlavičku, ostatní si můžete dočíst na www.apc.cz
Robert Drotar aura:92
5. 7. 2006 21:39 Nový

jeden server vs 300 serverov

celé vlákno
Ak ma niekto jeden server, tak ak nabehne, tak staci len skontrolovat, ci bezia vsetky dolezite veci.
Ak ma niekto viac serverov, tak nie su navzajom nezavysle.

Mame servery v GTS, nie je ich 300 :)) ale ak chcem aby vsetko bezalo ako ma, tak ich musim nahadzovat v urcitom poradi. Napr. file-servery, ktore su na ostatne namountovane cez nfs musim pochopitelne nahodit ako prve. Taktiez databazove serveru musia byt skor. Az po nich mozem nahodit web servery a nakoniec cache servery. V opacnom poradi, pripadne vsetko naraz, by to znamenalo, ze to nenabehne korektne a bolo by nutne vela veci restartovat a nahadzovat rucne.

Takyto postup sa tazko planuje, aby to nabehlo automaticky samo. Preto uplne chapem, ze Seznam sa prebudzal postupne. Ono dost pravdepodobne, po nabehu napajania museli servery najprv povypinat, aby ich zase nahodili tak ako treba....
Jarmil Prdel
6. 7. 2006 2:01 Nový

Re: jeden server vs 300 serverov

celé vlákno
Sorry, ale pokud mají 300 serverů a nahazují to ručně, tak si nic jiného než výpadky elektřiny nezaslouží.
Creckx
Creckx (neregistrovaný)
6. 7. 2006 3:42 Nový

Re: jeden server vs 300 serverov

celé vlákno
Server by se měl postarat sám o sebe. Pokud nemůže něco udělat jako třeba to přimountování, tak by měl počkata až to bude možné a pak pokračovat dál v nahazování ostatních věcí. Jestli to opravdu mají jak popisuješ tak se divím, že jim to ještě jede.
ertra
ertra (neregistrovaný)
6. 7. 2006 15:11 Nový

Re: jeden server vs 300 serverov

celé vlákno
Pokud ma mala firmicka 10 serveru s MySQL a PHP, tak opravdu se mohou po zapnuti sami nahodit.

U slozitejsich systemu, napr banka, seznam, je automaticke nahazovani silenost, protoze vzajemna provazanost systemu je moc velka.

Napr. Oracle je na nestandartni vypnuti tak haklive, ze je lepsi to vzdy prekontrolovat rucne. Uz jsem par databazi ktere se dostaly do stavu corrupted po vypadku produ videl.
Take napr. aplikacni servery (weblogic) se nahazuji (startuji) treba 15 minut.
kvas
kvas (neregistrovaný)
6. 7. 2006 23:43 Nový

Re: jeden server vs 300 serverov

celé vlákno
asi je velikej problem otestovat dostupnost sluzby a tim pockat s bootovanim systemu ..... ale proste tam nikdo s nicim takovym nepocital a treba delali takovou vec prvne v zivote :) nebo vy si rebootujete takovou farmu 2x mesicne jen tak z nudy ? poucej se a priste jim to bude makat :)
martin
martin (neregistrovaný)
7. 7. 2006 10:04 Nový

Re: jeden server vs 300 serverov

celé vlákno
.. naivko ;))
Landa Diego
7. 7. 2006 12:07 Nový

je to naky dlouhy

celé vlákno
je patek 12hod a mail porad nejede a seznam dela jakoby nic. Maily na helpdesk se vraceji jako nedorucitelne a tlf je permanente obsazen. Co jim brani v tom, aby dali nejakym zpusobem vedet, co se deje? To tam maj vsichni dovolenou?
Zasílat nově přidané příspěvky e-mailem        

Přehled názorů

...ach to opisovani :)
anonymní uživatel 5. 7. 2006 00:54
├ 
Re: ...ach to opisovani :)
anonymní uživatel 5. 7. 2006 00:57
│
├ 
Re: ...ach to opisovani :)
anonymní uživatel 5. 7. 2006 00:57
│
└ 
Re: ...ach to opisovani :)
M jako Molitan 5. 7. 2006 10:35
└ 
Re: ...ach to opisovani :)
anonymní uživatel 5. 7. 2006 09:56
 
├ 
Re: ...ach to opisovani :)
anonymní uživatel 5. 7. 2006 10:19
 
└ 
Re: ...ach to opisovani :)
pavel 5. 7. 2006 20:22
Já Vám dám Koudelku......
anonymní uživatel 5. 7. 2006 01:01
└ 
Re: Já Vám dám Koudelku......
D 5. 7. 2006 08:37
napájení
kix 5. 7. 2006 08:41
└ 
Re: napájení
Michal Kára 5. 7. 2006 09:18
doplnění
mirdaz 5. 7. 2006 10:25
└ 
Re: doplnění
Luisifer 5. 7. 2006 11:40
 
└ 
Re: doplnění
pavel 5. 7. 2006 20:23
nejen TTC
Radek Z. 5. 7. 2006 10:33
└ 
Re: nejen TTC
anonymní uživatel 5. 7. 2006 11:29
 
└ 
Re: nejen TTC
anonymní uživatel 5. 7. 2006 13:04
Nechapu...
anonymní uživatel 5. 7. 2006 11:59
├ 
Re: Nechapu...
lahvon 7. 7. 2006 12:31
│
├ 
Re: Nechapu...
anonymní uživatel 7. 7. 2006 12:56
│
├ 
Re: Nechapu...
Michal Kára 7. 7. 2006 13:27
│
└ 
Re: Nechapu...
Pavel Janoušek 7. 7. 2006 13:55
│
 
└ 
Re: Nechapu...
HK Maly 10. 7. 2006 08:07
│
 
 
└ 
Re: Nechapu...
Artur Linhart 10. 7. 2006 08:44
│
 
 
 
└ 
Re: Nechapu...
anonymní uživatel 10. 7. 2006 09:29
│
 
 
 
 
└ 
Re: Nechapu...
HK Maly 11. 7. 2006 20:42
│
 
 
 
 
 
└ 
Re: Nechapu...
Pavel Janoušek 11. 7. 2006 21:26
└ 
Re: Nechapu...
lahvon 7. 7. 2006 12:31
Radio Akropolis
ldx 5. 7. 2006 14:28
Výpadek Seznamu
anonymní uživatel 5. 7. 2006 17:35
└ 
Re: Výpadek Seznamu
Rich Ard 5. 7. 2006 18:40
Seznam :(
Dtz 5. 7. 2006 18:50
LOL
rogue 5. 7. 2006 21:37
jeden server vs 300 serverov
Robert Drotar 5. 7. 2006 21:39
├ 
Re: jeden server vs 300 serverov
Jarmil Prdel 6. 7. 2006 02:01
└ 
Re: jeden server vs 300 serverov
Creckx 6. 7. 2006 03:42
 
└ 
Re: jeden server vs 300 serverov
ertra 6. 7. 2006 15:11
 
 
└ 
Re: jeden server vs 300 serverov
kvas 6. 7. 2006 23:43
 
 
 
└ 
Re: jeden server vs 300 serverov
martin 7. 7. 2006 10:04
je to naky dlouhy
Landa Diego 7. 7. 2006 12:07