Bohuzel je to slozitejsi. Fyzicke disky mivaji cache, RAIDove radice taky. Databazovy server obvykle nema moznost pockat, az budou data fyzicky ulozena na disku - ten si mysli, ze je vsechno OK uz kdyz jsou v cache radice. Proti vypadku proudu (zvlast fyzickemu, kdy mohlo dojit k nejakemu kolisani) se softwarove branit prakticky nelze, klicova je hardwarova odolnost jednotlivych komponent. Druha vec je, ze tato hardwarova odolnost by mela byt vetsi u profesionalnich serveru nez u bezneho desktopoveho HW.
No, prave proto se doporucuje transakcni logy a vubec soubory tvorici tablespace databazi umistovat na RAID s vypnutou kesi pro zapis (staci pro cteni) - diky tomu, ze ctecich operaci e o par radu vice nez zapisovych tak to vetsinou vykonove neni zadny problem...
Ale tfuj, jednak tento konkretni problem beze zbytku resi Write-Through cache... a navic, ona takova financne bezcenna zalezitost jako baterie, ktera je schopna zapsat vse z radice na disk za dobu kratsi nez 1s je dobra vec... A to, ze se server ma korektne vypnout je otazka spoluprace UPS a stroje... (a to i po vypadku jisticu)... On-line UPS nejsou nejlevnejsi, ale pokud chcete 100% bezpeci, tak jinak nez redundanci toho nedosahnete...
Pokud mate redundantni zdroje a centrum Vam nedoda dve nezavisle vetve (dedikovane od centralniho jistice pouze Vam, o sdilenem segmentu vubec neuvazuji) energie to nevidim jako nenormalni... Ta pretizenost UPS je podivna, jak uz bylo naznaceno, kdyz nabeh (coz je taky spicka jak hrom) pred generatorem (coz je doba nezanedbatelna) unesla v pohode...
Heh zasada prvni-1 - kdyz poucuju ostatni, ridim se alespon pravidly, ktera jim vtloukam...:-)
Aneb transakce (a je uplne putna, co si pod timto abstraktnim pojmem predstavite za implementaci) se odroluje a jede se dal, zadna potvrzena data v haji, zadne rozpadle systemy...
...proc by meli admini jednotlive servery ozivovat z konzole. Pokud slo opravdu jen o vypadek proudu, takovy server by mel byt schopny opetovne nastartovat sam, at uz je jeden, nebo tri stovky :/
Pravidlo cislo jedna.
Cemu nerozumim, do toho nemluvim a nasloucham, nebo se ptam.
Pokud vypnes samostatny server korektne a znovy ho zapnes, tak ve vetsine pripadu vse pojede jak ma.
Pokud mas serverove clustery, provazane servery, externi diskova pole a jine vopicarny a zcela nekorektne v pulce relaci vypnes proud, tak si tim cely system rozsypes.
Nekonzistence databazi, nekorektne zapsana data na diskovych polich, atd.
Stejne tak zapinani tak rozsahleho systemu - site serveru neni zadna prdel. Musis to nahazovat postupne, u vseho overovat funkcnost a konzistenci dat, zapinat jednotlive casti postupne, podle predem daneho postupu. Tak aby vse jelo jak ma.
A mezi tim jeste resit chyby dane nekorektnim vypnutim.
Tohle neni zadna prdel, kdyz mas 6 serveru a diskovych poli. Natoz kdyz jich mas stovky.
Ale chapu, ze pro nekoho, kdo ma doma jeden SOHO routrik a 3 desktopy, ze pro nej to muze byt spanelska vesnice. Pak se ale takovy uzivatel muze zdrzet chytrackejch kecu.
takze zrejme prispevek jednoho z adminu seznamu, ktery si kdysi usetril praci a ted ma fofry :)
Doby kdy me jeden domaci routrik a 2 desktopy zamestnaly na 24h denne jsou pryc. Sice nespravuju 300 serveru, ale sakra dobre vim, jake problemy muzou nastat pri takovem vypadku.
Ale na tohle se ma myslet uz od zacatku, delat neco jen "na pul" je k nicemu...
Troufam si tvrdit, ze Centrum by to prezilo lip (pokud by nebyla nejaka velka smula). Koneckoncu, nedavno na Naganu vypadla klima, takze se dost serveru prehralo a poroucelo dolu (coz je horsi, nez kdyby jen vypadl proud) a taky nebyl problem.
Druha vec je, ze moc neverim tomu, ze by se neztratily vubec zadne maily... To by se musela informace o mailu pred poslanim OK na SMTP DATA prikaz fdatasync()ovat na disk. Coz by zbrzdovalo a v pripade ukladani informaci do DB je to i dost obtizne proveditelne.
Pravidlo cislo jedna.
Cemu nerozumim, do toho nemluvim a nasloucham, nebo se ptam.
Pokud vypnes samostatny server korektne a znovy ho zapnes, tak ve vetsine pripadu vse pojede jak ma.
Pokud mas serverove clustery, provazane servery, externi diskova pole a jine vopicarny a zcela nekorektne v pulce relaci vypnes proud, tak si tim cely system rozsypes.
Nekonzistence databazi, nekorektne zapsana data na diskovych polich, atd.
Stejne tak zapinani tak rozsahleho systemu - site serveru neni zadna prdel. Musis to nahazovat postupne, u vseho overovat funkcnost a konzistenci dat, zapinat jednotlive casti postupne, podle predem daneho postupu. Tak aby vse jelo jak ma.
A mezi tim jeste resit chyby dane nekorektnim vypnutim.
Tohle neni zadna prdel, kdyz mas 6 serveru a diskovych poli. Natoz kdyz jich mas stovky.
Ale chapu, ze pro nekoho, kdo ma doma jeden SOHO routrik a 3 desktopy, ze pro nej to muze byt spanelska vesnice. Pak se ale takovy uzivatel muze zdrzet chytrackejch kecu.