alexkuklin: (Default)
[personal profile] alexkuklin
Аппаратные рейды, говорите?
Вот что делать в такой ситуации:

Проблема такая! Упал райд 5, контролер IBM ServeRaid. Вся инфа накрылась соответственно. Пытаюсь спасти, ценность имеет только var область, поскольку там дампы были. Гружусь с knoppix, cfdisk видит диск c var областью, но смонтировать не удается, говорит, что файловая система типа того...... Что можно попытаться сделать, может есть какие-то юниксовые утилиты для восстановления?
alexkuklin> как упал??
а х... знает! Сначало выпали 2 харда (дело было в глубокой ночи), далее произошел вис сервака, после перезагрузки контроллер выдал, что никаго райда более нет. Его штатными утилитами удалось восстановить райд, но ни разделов, ни файла, ни чего не осталось.

Date: 2007-06-08 08:30 am (UTC)
From: [identity profile] 123lexa.livejournal.com
Правильный ответ - Убить АП СТЕНУ того, кто посоветовал эту железяку:)

Date: 2007-06-08 08:38 am (UTC)
From: [identity profile] besm6.livejournal.com
Алекс, если в типичном случае (а случай по умолчанию считается типичным) из пятого рейда вылетает два винта, то данные становятся невосстановимыми независимо от того, аппаратно он был сделан или программно. Сохранившейся информации для восстановления недостаточно по определению.

Date: 2007-06-08 08:45 am (UTC)
From: [identity profile] alexkuklin.livejournal.com
Винты физически живы. Их потерял рейд.

Date: 2007-06-08 09:39 am (UTC)
From: [identity profile] sherr-khann.livejournal.com
Блин, это мне, наверное везет так. Собрал рейд на SATA'шном LSI-Logic'е и хоть бы один намек на глюк... В то время, как у друга умер Интеловский SATA-RAID-контроллер, тут сдох IBM... Кошмар...

Date: 2007-06-08 09:28 am (UTC)
From: [identity profile] wildpierre.livejournal.com
Угу, у нас было такое один раз - накрылась системная область, которая хранила записи о том, как именно физическое пространство организуется в логическое. Никакой пятый уровень райда не спас - пришлось искать бэкап.

Date: 2007-06-08 11:03 am (UTC)
From: [identity profile] sherr-khann.livejournal.com
Хе! Разные бывают контроллеры.
Есть те, что прописывают эту инфу у себя во флеше.

Date: 2007-06-08 11:20 am (UTC)
From: [identity profile] stop-black-pr.livejournal.com
пиздец же

Date: 2007-06-08 11:21 am (UTC)
From: [identity profile] alexkuklin.livejournal.com
более того... на софтрейде я в таком случае сделаю --re-add --force и буду чинить файловую систему...
а тут, у этих деятелей, данные порвало на мелкие лоскуты - там ни одной целой копии суперблока не осталось

Date: 2007-06-08 12:07 pm (UTC)
From: [identity profile] stop-black-pr.livejournal.com
вывод: делать рейд 0 + регулярные бекапы?

Date: 2007-06-08 12:07 pm (UTC)
From: [identity profile] stop-black-pr.livejournal.com
ну то есть, если такой геморой, то зачем применять дорогое решение, если можно сделать более бюджетное

Date: 2007-06-08 12:09 pm (UTC)
From: [identity profile] alexkuklin.livejournal.com
примерно.
более дорогое - оно более быстрое....
но что делать в случае подыхания контроллера - непонятно.

Date: 2007-06-08 12:22 pm (UTC)
From: [identity profile] stop-black-pr.livejournal.com
если я правильно всё помню рейд 0 - это параллельная запись на два винта для ускорения, а рейд 1 - дублирование для повышения устойчивости системы

поскольку рейд в принципе можно считать неустойчивым, хотя бы из за того что все данные повязаны, то предлагается использовать его только для ускорения, а устойчивость обеспечивать по старинке - бекапами на обычный винт

Date: 2007-06-08 12:26 pm (UTC)
From: [identity profile] alexkuklin.livejournal.com
raid5 хранит данные в режиме "два диска и разница между ними", т.е. надежность как у зеркала, а потеря пространства составляет 1/3 вместо 1/2 в случае зеркала.

Date: 2007-06-08 12:30 pm (UTC)
From: [identity profile] stop-black-pr.livejournal.com
понятно, подзабыл уже
я думал там зеркало + параллельная запись

Date: 2007-06-08 12:11 pm (UTC)
From: [identity profile] alexkuklin.livejournal.com
я софтрейд 5 под линуксом использую
был случай, когда у мня вывалилось два винта из трех - я перепугался, но --re-add и --force помогло поднять.

Date: 2007-06-10 01:02 pm (UTC)
From: [identity profile] kinuski.livejournal.com
Если в RAID-5 выходит из строя более одного диска - массив нежизнеспособен, винить контроллер только за это нельзя. Если диски после выхода из строя массива кажутся нормальными, это ничего не значит - диски могли сбойнуть и могут сделать это еще раз. Если контроллер потерял диски, дело необязательно в контроллере.

Backup'ы спасут мир...

Date: 2007-06-10 02:07 pm (UTC)
From: [identity profile] alexkuklin.livejournal.com
фигня в том, что физически диски и данные на них живы - их рейд потерял.

Date: 2007-06-10 02:10 pm (UTC)
From: [identity profile] alexkuklin.livejournal.com
> Если диски после выхода из строя массива кажутся нормальными, это ничего не значит - диски могли сбойнуть и могут сделать это еще раз. Если контроллер потерял диски, дело необязательно в контроллере.

понимаете, мне пофиг - мне данные нужны.
т.е. потерять диски рейд имеет право.
у меня так было с софтрейдом.
но с софтрейдом в случае проблем - я знаю, каким образом поднимать данные, даже с битого винта.
в случае с аппаратным - все это скрыто внутри железки

Date: 2007-07-06 02:28 pm (UTC)
From: [identity profile] easyjohn.livejournal.com
у вас странная фобия по поводу аппаратных рейдов, встречается многократно на протяжении последних постов.
лично я по ходу своей прямой деятельности старался все строить только на них. и больших проблемм мне это никогда не приносило, а наоборот. а вот недоверие к софтам - есть. :)

в вышеописанной ситуации выпадения больше 1 винта на 3-5 рейде есть стандартная продцедура, впихнуть принудительно один из выпавших в онлайн, сделав вид что он живой, и в дигрейте слить все данные.
бывает они при этом частично повреждены но так, что бы были повреждены фатально - не встречал.

чаще всего такие вещи случаются из-за шлейфов, смерти контроллера или одновременной смерти винтов.
еще есть вариант ленивого админа, не заметившего вовремя переход рейда в дегрейт, не рассматриваем.
соотвественно если шлейфы - втыкание онлайн все лечит. (чаще всего было на сказе, когда отваливался сразу какой-то канал целиком. было понятно что все живо, просто шейф или от вибрации отходит или окислился)

в случае смерти контроллера, все конечно хуже. но обычно он мрет не убивая данные. в этом случае заменой контроллера можно получить обратно рабочий массив.
напрмер один из наших поставщиков железа держит архив всех устаревших рейдконтроллеров, что бы в случае проблемм у клиента, можно было хотя бы слить данные.

ну и одновременная смерть обоих винтов - это достаточно большая редкость. просто не встречал. :)

а вообще золотое правило админа - никакой рейд не спасет при отсутсвии баккапа. по этому баккаить и еще раз баккапить, какие бы надежные технологии не применились.

PS извиняюсь что отвечаю на старый пост, неоднократно натыкался на этот жж когда искал какую-либо нужную инфу. ник примелькался, сегодня решил почитать более детально. оказалось интересно. спасибо.

Date: 2007-07-06 04:48 pm (UTC)
From: [identity profile] alexkuklin.livejournal.com
я понимаю, что как правило все обходится и т.п.
однако когда я подряд наблюдаю несколько случаев потери данных при использовании аппаратных рейдов, я предпочту с ними не связываться там, где нет потребности в скорости большей, чем дают программные.

Profile

alexkuklin: (Default)
alexkuklin

January 2020

S M T W T F S
    1234
567891011
12131415161718
19202122232425
262728293031 

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 6th, 2025 09:49 am
Powered by Dreamwidth Studios