high availability seminar
Dec. 6th, 2008 12:53 amPaul Randall травил байки сегодня. например, рассказал страшную историю про админа, который хранил бэкапы базы на том же диске, что и сама база. и больше нигде. налоговая база штата - кто сколько бабла штату должен. и стал барахлить у них винт. но не тот, на котором была база с бэкапами, а другой. и пришёл technician с новым винтом на замену, и заменил его. и вынул плохой винт, и вставил хороший, и закрыл крышку, и сел за клавиатуру и отформатировал. но не тот винт, который он принёс, а тот, на котором база была со всеми бэкапами. $2B in monetary losses. no job losses though. government employee потому что. штат, как нетрудно догадаться, Аляска.
ещё была замечательная история про чуваков, которые делали только log backups, зато все их честно хранили. все пять тысяч лог-бэкапов по сто гигов каждый, сделанные с момента взятия full-бэкапа. домашнее задание: оценить, сколько дней им потребовалось, чтобы восстановить базу путём последовательного наката пяти тысяч бэкапов. второе задание: оценить, насколько повезло чувакам, что ни один из пяти тысяч лог-бэкапов не оказался битым.
или история про навороченный high availability solution, в котором ещё одна запасная копия хранилась, как положено, off site. и когда локальный бэкап оказался битым, вопрос о том, а как, собственно, восстанавливать десять терабайт, заныканные в 150 милях от датацентра, встал остро, как никогда. но чудес не бывает - на машине, два часа туда, два часа обратно. от четырёх девяток осталось только две.
ещё была замечательная история про чуваков, которые делали только log backups, зато все их честно хранили. все пять тысяч лог-бэкапов по сто гигов каждый, сделанные с момента взятия full-бэкапа. домашнее задание: оценить, сколько дней им потребовалось, чтобы восстановить базу путём последовательного наката пяти тысяч бэкапов. второе задание: оценить, насколько повезло чувакам, что ни один из пяти тысяч лог-бэкапов не оказался битым.
или история про навороченный high availability solution, в котором ещё одна запасная копия хранилась, как положено, off site. и когда локальный бэкап оказался битым, вопрос о том, а как, собственно, восстанавливать десять терабайт, заныканные в 150 милях от датацентра, встал остро, как никогда. но чудес не бывает - на машине, два часа туда, два часа обратно. от четырёх девяток осталось только две.
(no subject)
Date: 2008-12-06 01:29 pm (UTC)Потому что как минимум часть базы можно достать даже с отформатированного веника, тем более за такие бабки.
(no subject)
Date: 2008-12-07 11:56 pm (UTC)(no subject)
Date: 2008-12-06 03:01 pm (UTC)И ты сам-то в это веришь? Что действительно в штате _один_ сисадмин который там лично выбирает как хранить, а не сто дармоедов и контракт на много миллионов от какого-нибудь HP
Или что бывает HA которую надо останавливать на время восстановления? В такой системе не может быть никаких девяток вне зависимости от того, где бэкап
(no subject)
Date: 2008-12-06 08:14 pm (UTC)(no subject)
Date: 2008-12-06 08:55 pm (UTC)термины active/passive имеют мало смысла в данном контексте, ибо предполагают кластер, который предоставляет instance redundancy, а не storage redundancy. иными словами, failover в кластере представляет собой смену активного инстанса, который, тем не менее, продолжает работать с теми же дисками того же SAN-а.
(no subject)
Date: 2008-12-06 09:09 pm (UTC)(no subject)
Date: 2008-12-08 12:02 am (UTC)я так предполагаю, что, наверное, был кластер в одном датацентре, и backup mirroring в другой.
и да, пойнт байки в том, что это был плохой, негодный HA, в то время, как они думали, что хороший.
(no subject)
Date: 2008-12-06 08:44 pm (UTC)не могу найти, где я написал, что в штате штата был только один сисадмин. хотя и не вижу в этом ничего невозможного. regardless of admin count, всё равно какой-то конкретный человек принял это решение.
(no subject)
Date: 2008-12-06 09:45 pm (UTC)(no subject)
Date: 2008-12-08 12:09 am (UTC)понятно же, что весь пойнт этих баек в том, что как кастомеров ни учи, как правильно строить HA, всё равно найдутся вот такие вот ridiculous cases.
точно так же понятно, что и у oracle advisory team есть столько же таких же баек. ну может не столько же, поменьше немного. пропорционально количеству клиентов :)
(no subject)
Date: 2008-12-06 08:57 pm (UTC)(no subject)
Date: 2008-12-06 03:26 pm (UTC)(no subject)
Date: 2008-12-06 08:46 pm (UTC)(no subject)
Date: 2008-12-06 09:25 pm (UTC)(no subject)
Date: 2008-12-08 12:02 am (UTC)(no subject)
Date: 2008-12-06 09:42 pm (UTC)(no subject)
Date: 2008-12-08 12:04 am (UTC)(no subject)
Date: 2008-12-08 12:13 am (UTC)(no subject)
Date: 2008-12-08 10:21 am (UTC)(no subject)
Date: 2008-12-08 07:35 pm (UTC)