alexkuklin: (Default)
alexkuklin ([personal profile] alexkuklin) wrote2007-06-08 12:15 pm

(no subject)

Аппаратные рейды, говорите?
Вот что делать в такой ситуации:

Проблема такая! Упал райд 5, контролер IBM ServeRaid. Вся инфа накрылась соответственно. Пытаюсь спасти, ценность имеет только var область, поскольку там дампы были. Гружусь с knoppix, cfdisk видит диск c var областью, но смонтировать не удается, говорит, что файловая система типа того...... Что можно попытаться сделать, может есть какие-то юниксовые утилиты для восстановления?
alexkuklin> как упал??
а х... знает! Сначало выпали 2 харда (дело было в глубокой ночи), далее произошел вис сервака, после перезагрузки контроллер выдал, что никаго райда более нет. Его штатными утилитами удалось восстановить райд, но ни разделов, ни файла, ни чего не осталось.

[identity profile] 123lexa.livejournal.com 2007-06-08 08:30 am (UTC)(link)
Правильный ответ - Убить АП СТЕНУ того, кто посоветовал эту железяку:)

[identity profile] besm6.livejournal.com 2007-06-08 08:38 am (UTC)(link)
Алекс, если в типичном случае (а случай по умолчанию считается типичным) из пятого рейда вылетает два винта, то данные становятся невосстановимыми независимо от того, аппаратно он был сделан или программно. Сохранившейся информации для восстановления недостаточно по определению.

[identity profile] alexkuklin.livejournal.com 2007-06-08 08:45 am (UTC)(link)
Винты физически живы. Их потерял рейд.

[identity profile] sherr-khann.livejournal.com 2007-06-08 09:39 am (UTC)(link)
Блин, это мне, наверное везет так. Собрал рейд на SATA'шном LSI-Logic'е и хоть бы один намек на глюк... В то время, как у друга умер Интеловский SATA-RAID-контроллер, тут сдох IBM... Кошмар...

[identity profile] wildpierre.livejournal.com 2007-06-08 09:28 am (UTC)(link)
Угу, у нас было такое один раз - накрылась системная область, которая хранила записи о том, как именно физическое пространство организуется в логическое. Никакой пятый уровень райда не спас - пришлось искать бэкап.

[identity profile] sherr-khann.livejournal.com 2007-06-08 11:03 am (UTC)(link)
Хе! Разные бывают контроллеры.
Есть те, что прописывают эту инфу у себя во флеше.

[identity profile] stop-black-pr.livejournal.com 2007-06-08 11:20 am (UTC)(link)
пиздец же

[identity profile] alexkuklin.livejournal.com 2007-06-08 11:21 am (UTC)(link)
более того... на софтрейде я в таком случае сделаю --re-add --force и буду чинить файловую систему...
а тут, у этих деятелей, данные порвало на мелкие лоскуты - там ни одной целой копии суперблока не осталось

[identity profile] stop-black-pr.livejournal.com 2007-06-08 12:07 pm (UTC)(link)
вывод: делать рейд 0 + регулярные бекапы?

[identity profile] stop-black-pr.livejournal.com 2007-06-08 12:07 pm (UTC)(link)
ну то есть, если такой геморой, то зачем применять дорогое решение, если можно сделать более бюджетное

[identity profile] alexkuklin.livejournal.com 2007-06-08 12:09 pm (UTC)(link)
примерно.
более дорогое - оно более быстрое....
но что делать в случае подыхания контроллера - непонятно.

[identity profile] stop-black-pr.livejournal.com 2007-06-08 12:22 pm (UTC)(link)
если я правильно всё помню рейд 0 - это параллельная запись на два винта для ускорения, а рейд 1 - дублирование для повышения устойчивости системы

поскольку рейд в принципе можно считать неустойчивым, хотя бы из за того что все данные повязаны, то предлагается использовать его только для ускорения, а устойчивость обеспечивать по старинке - бекапами на обычный винт

[identity profile] alexkuklin.livejournal.com 2007-06-08 12:26 pm (UTC)(link)
raid5 хранит данные в режиме "два диска и разница между ними", т.е. надежность как у зеркала, а потеря пространства составляет 1/3 вместо 1/2 в случае зеркала.

[identity profile] stop-black-pr.livejournal.com 2007-06-08 12:30 pm (UTC)(link)
понятно, подзабыл уже
я думал там зеркало + параллельная запись

[identity profile] alexkuklin.livejournal.com 2007-06-08 12:11 pm (UTC)(link)
я софтрейд 5 под линуксом использую
был случай, когда у мня вывалилось два винта из трех - я перепугался, но --re-add и --force помогло поднять.

[identity profile] kinuski.livejournal.com 2007-06-10 01:02 pm (UTC)(link)
Если в RAID-5 выходит из строя более одного диска - массив нежизнеспособен, винить контроллер только за это нельзя. Если диски после выхода из строя массива кажутся нормальными, это ничего не значит - диски могли сбойнуть и могут сделать это еще раз. Если контроллер потерял диски, дело необязательно в контроллере.

Backup'ы спасут мир...

[identity profile] alexkuklin.livejournal.com 2007-06-10 02:07 pm (UTC)(link)
фигня в том, что физически диски и данные на них живы - их рейд потерял.

[identity profile] alexkuklin.livejournal.com 2007-06-10 02:10 pm (UTC)(link)
> Если диски после выхода из строя массива кажутся нормальными, это ничего не значит - диски могли сбойнуть и могут сделать это еще раз. Если контроллер потерял диски, дело необязательно в контроллере.

понимаете, мне пофиг - мне данные нужны.
т.е. потерять диски рейд имеет право.
у меня так было с софтрейдом.
но с софтрейдом в случае проблем - я знаю, каким образом поднимать данные, даже с битого винта.
в случае с аппаратным - все это скрыто внутри железки

[identity profile] easyjohn.livejournal.com 2007-07-06 02:28 pm (UTC)(link)
у вас странная фобия по поводу аппаратных рейдов, встречается многократно на протяжении последних постов.
лично я по ходу своей прямой деятельности старался все строить только на них. и больших проблемм мне это никогда не приносило, а наоборот. а вот недоверие к софтам - есть. :)

в вышеописанной ситуации выпадения больше 1 винта на 3-5 рейде есть стандартная продцедура, впихнуть принудительно один из выпавших в онлайн, сделав вид что он живой, и в дигрейте слить все данные.
бывает они при этом частично повреждены но так, что бы были повреждены фатально - не встречал.

чаще всего такие вещи случаются из-за шлейфов, смерти контроллера или одновременной смерти винтов.
еще есть вариант ленивого админа, не заметившего вовремя переход рейда в дегрейт, не рассматриваем.
соотвественно если шлейфы - втыкание онлайн все лечит. (чаще всего было на сказе, когда отваливался сразу какой-то канал целиком. было понятно что все живо, просто шейф или от вибрации отходит или окислился)

в случае смерти контроллера, все конечно хуже. но обычно он мрет не убивая данные. в этом случае заменой контроллера можно получить обратно рабочий массив.
напрмер один из наших поставщиков железа держит архив всех устаревших рейдконтроллеров, что бы в случае проблемм у клиента, можно было хотя бы слить данные.

ну и одновременная смерть обоих винтов - это достаточно большая редкость. просто не встречал. :)

а вообще золотое правило админа - никакой рейд не спасет при отсутсвии баккапа. по этому баккаить и еще раз баккапить, какие бы надежные технологии не применились.

PS извиняюсь что отвечаю на старый пост, неоднократно натыкался на этот жж когда искал какую-либо нужную инфу. ник примелькался, сегодня решил почитать более детально. оказалось интересно. спасибо.

[identity profile] alexkuklin.livejournal.com 2007-07-06 04:48 pm (UTC)(link)
я понимаю, что как правило все обходится и т.п.
однако когда я подряд наблюдаю несколько случаев потери данных при использовании аппаратных рейдов, я предпочту с ними не связываться там, где нет потребности в скорости большей, чем дают программные.