Как сделать raid массив из 4-6 жестких дисков на windows 7 или 10?

Введение

Пословицу «Пока гром не грянет, мужик не перекрестится» знает почти каждый. Жизненная она: пока та или иная проблема не коснется юзера вплотную, тот о ней даже не задумается. Умер блок питания и прихватил с собой пару-тройку девайсов — пользователь бросается искать статьи соответствующей тематики о вкусном и здоровом питании. Сгорел или начал глючить от перегрева процессор — в «Избранном» появляется пара-тройка ссылок на развесистые ветки форумов, на которых обсуждают охлаждение CPU.

С жесткими дисками та же история: как только очередной винт, хрустнув на прощание головками, покидает наш бренный мир, обладатель ПК начинает суетиться, чтобы обеспечить улучшение жизненных условий накопителя. Но даже самый навороченный кулер не может гарантировать диску долгую и счастливую жизнь. На срок службы накопителя влияет много факторов: и брак на производстве, и случайный пинок корпуса ногой (особенно если кузов стоит где-нибудь на полу), и пыль, прошедшая сквозь фильтры, и высоковольтная помеха, посланная блоком питания… Выход один — резервное копирование информации, а если требуется бэкап на ходу, то самое время строить RAID-массив, благо сегодня почти каждая материнка обладает каким-нибудь RAID-контроллером.

На этом месте мы остановимся и сделаем краткий экскурс в историю и теорию RAID-массивов. Сама аббревиатура RAID расшифровывается как Redundant Array of Independent Disks (избыточный массив независимых дисков). Раньше вместо independent употребляли inexpensive (недорогой), но со временем это определение потеряло актуальность: недорогими стали почти все дисковые накопители.

История RAID началась в 1987 году, когда появилась на свет статья «Корпус для избыточных массивов из дешевых дисков (RAID)», подписанная товарищами Петерсоном, Гибсоном и Катцем. В заметке была описана технология объединения нескольких обычных дисков в массив для получения более быстрого и надежного накопителя. Также авторы материала рассказывали читателям о нескольких типах массивов — от RAID-1 до RAID-5. Впоследствии к описанным почти двадцать лет назад массивам прибавился RAID-массив нулевого уровня, и он обрел популярность. Так что же представляют собой все эти RAID-x? В чем их суть? Почему они называются избыточными? В этом мы и постараемся разобраться.

Если говорить очень простым языком, то RAID — это такая штука, которая позволяет операционной системе не знать, сколько дисков установлено в компьютере. Объединение хардов в RAID-массив — процесс, прямо противоположный разбиению единого пространства на логические диски: мы формирует один логический накопитель на основе нескольких физических. Для того чтобы сделать это, нам потребуется или соответствующий софт (об этом варианте мы даже говорить не будем — ненужная это вещь), или RAID-контроллер, встроенный в материнку, или отдельный, вставляемый в слот PCI либо PCI Express. Именно контроллер объединяет диски в массив, а операционная система работает уже не с HDD, а с контроллером, который ей ничего ненужного не сообщает. А вот вариантов объединения нескольких дисков в один существует великое множество, точнее, около десяти.

RAID 61 & RAID 16

В основу этих массивов легли различные комбинации RAID 6 с зеркалом. Как и в случае с RAID 51 и 15, в некоторых комбинациях допускается выход из строя более чем половины всех имеющихся дисков. В RAID 61 может выйти из строя полностью одно зеркало и два диска из второго, то есть в минимальном варианте с 8 дисками допускается выход из строя 6 штук, а это 75%. Второй вариант допускает выход из строя максимум полностью двух зеркал, а также по одному диску из всех оставшихся. К сожалению, в сети касательно RAID 16 удалось найти только картинку.

Минусы — достаточно экзотический вариант, мало где можно встретить, низкая скорость записи, сильное снижение производительности при деградации массива (это касается не только того, что функционировать будет небольшое количество жестких дисков, но и имеется в виду сильная загрузка ЦП контроллера при вычислении недостающих данных);

Плюсы — экстремальная отказоустойчивость, неплохая скорость на чтение, сравнительно эффективное использование дискового пространства при использовании большого количества дисков.

Количество дисков

Отвечая на вопрос — сколько же дисков требуется для рейд 10, скажу, что для такого массива необходимо четное их количество. Причем, минимально допустимое количество винчестеров составляет 4, а максимальное 16. Также, бытует мнение, что raid «1+0» (он же 10) и «0+1» чем-то различаются. Это правда, но различие состоит только в последовательности соединения массивов.

Последняя цифра обозначает тип массива самого верхнего уровня. Например, raid «0+1» обозначает некую зеркальную систему полос, внутри которой два нулевых рейда (общее количество: 4 жестких диска) объединяются в один рейд 1 — это как пример, «нулевых» рейд массивов тут может быть и больше. Причем, снаружи визуально эти два подвида рейд 10 ничем не отличаются. И чисто теоретически они имеют равную степень устойчивости к сбоям.

Столько дисков может поломаться и потери данных не произойдет

Повторюсь, главным недостатком raid 10 остается — необходимость включения в массив дисков «горячего резерва». Расчет примерно следующий: на 5 рабочих накопителей должен быть один резервный. Теперь пару слов про емкость дисков. Особенность емкости рейд 1 заключается в том, что вам всегда доступна лишь половина пространства винчестеров от их общего объема. В RAIDе 10 из 4 дисков общим объемом 4 Терабайта для записи будут доступны всего 2 Тб. Вообще, легко подсчитать доступный объем можно по формуле: F*G/2, F означает — количество дисков в массиве, а G — их емкость.

RAID 7.3

Изначально RAID был исключительно аппаратной технологией. Физический RAID-контроллер способен поддерживать несколько массивов различных уровней одновременно, однако более эффективная реализация RAID возможна с помощью программных компонентов (драйверов). Так, ядро Linux позволяет гибко управлять RAID-устройствами. Взяв за основу модули ядра Linux и технологии помехоустойчивого кодирования, разработчики программной технологии RAIDIX сумели создать решение для построения высокопроизводительных отказоустойчивых СХД на базе стандартных комплектующих.

ПО RAIDIX позволяет работать с массивами уровней RAID 0, RAID 5, RAID 6 и RAID 10. Среди патентованных алгоритмов «Рэйдикс» – уникальные уровни RAID 7.3 и N+M.

RAID 7.3 является аналогом RAID 6 с двойной четностью, но имеет более высокую степень надёжности. RAID 7.3 – уровень чередования блоков с тройным распределением четности, который позволяет восстанавливать данные при отказе до трех дисков в массиве и достигать высоких скоростных показателей без дополнительной нагрузки на процессор. RAID 7.3 существенно снижает вероятность отказа дисков без потерь в производительности и стоимости и зачастую используется для крупных массивов объемом более 32 ТБ.

Real-time scenarios

So far, we have seen the two RAID levels, their advantages and disadvantages, and how they stack against each other in common operations. Let’s now take a look at some real-time scenarios and which of the two would work best in each.

File and application servers

RAID 5 works best for file and application servers because storage is optimized and highly efficient. Also, RAID 5 servers don’t use mirroring, and even the parity is split across different disks, depending on the setup. Hence, RAID 5 can be easily implemented even if the file servers have lesser drives.

Continuous data access

If you need continuous data access, RAID 5 is the best choice as the data is automatically reconstructed in the event of a disk failure. In RAID 1, you have to turn off the system to replace the corrupted drive with the secondary one. In other words, hot-swapping the corrupted drive with a secondary one is easy in RAID 5, and it comes with parity checks as well. Though you can implement hot swapping in RAID 1 with hardware controllers, it’s not easy.

Simple configuration

RAID 1 is the right choice for those who are setting up a RAID 1 at home or for basic applications at work. This is a simple technology that requires no complex set up and hence, works well for basic read/write operations.

Hardware-based

Wikimedia

As you know, any RAID level can be implemented through hardware or software, and each comes with its share of advantages and disadvantages. If you’re looking to tap into the advantages of a hardware-based configuration, RAID 1 is your choice because RAID 5 is best implemented through software.

Tight budget

If you’re on a tight budget and can choose from either level, go for RAID 5 as it is cost-effective since it optimizes storage. Also, it has zero downtime.

Accounting systems

Accounting systems handle critical data, and undoubtedly, RAID 1 is the choice because of its high reliability. Thus, these are some of the real-time scenarios when you can use these RAID levels.

Самые распространенные типы массивов

Обычно создают RAID1. Процесс его создания называется «зеркалированием». Преимущество RAID1 в том, что все файлы одного диска дублируются на другом, и оба винчестера являются точной (зеркальной) копией друг друга. После создания массива вероятность сохранности информации увеличивается в 2 раза. Если пользователь сохранил файл на одном диске, сразу же появится его копия на втором. В случае поломки одного винчестера данные останутся невредимыми на другом (на зеркале). Процент вероятности одновременной поломки двух HDD (SSD) минимальный.

Типы массивов:

  1. JBOD. Последовательно соединяет накопители (разного объема) в том количестве, которое позволяет контроллер. Увеличивает вероятность сохранности данных, но не изменяет скорость и производительность. Не рекомендован для SSD, так как массив заполняется последовательно.
  2. RAID Требует минимум два накопителя одинакового объема и скорости. Информация разбивается и записывается параллельно на два носителя. При выходе из строя одного содержимое второго не подлежит прочтению. Преимущество: повышает скорость обработки большого объема информации.
  3. RAID Потребуется установка еще одного или двух накопителей. Объем отзеркаленного массива будет равняться объему основного диска. В случае сбоя данные сохранятся на втором накопителе. Чем большее подсоединено дисков, тем больше копий. Данные дублируются на каждый накопитель.
  4. RAID Потребуется минимум 3 накопителя. Информация будет дублироваться только на одном из них. Отзеркаленные данные можно использовать для восстановления. Увеличит производительность и скорость.
  5. RAID Требует минимум 4 накопителя. Допускается выход из строя двух из них без фатальных последствий. Надежен, но менее производителен.
  6. RAID Потребуется четное количество накопителей, но не меньше 4 штук. Совмещает качества RAID 1 и 0. Расходует много пространства под резерв, но использует половину от общего объема гигабайт. Увеличивает скорость. Приводит к проблемам только при поломке сразу двух дисков массива.

RAID 10 (1+0)

RAID 10 — зеркалированный массив, данные в котором записываются последовательно на несколько дисков, как вRAID 0. Эта архитектура представляет собой массив типа RAID 0, сегментами которого вместо отдельных дисков являются массивы RAID 1. Соответственно, массив этого уровня должен содержать как минимум 4 диска (и всегда чётное количество). RAID 10 объединяет в себе высокую отказоустойчивость и производительность.

Утверждение, что RAID 10 является самым надёжным вариантом для хранения данных вполне обосновано тем, что массив будет выведен из строя после выхода из строя всех накопителей в одном и том же массиве. При одном вышедшем из строя накопителе, шанс выхода из строя второго в одном и том же массиве равен 1/3*100=33%. RAID 0+1 выйдет из строя при двух накопителях, вышедших из строя в разных массивах. Шанс выхода из строя накопителя в соседнем массиве равен 2/3*100=66%, однако так как накопитель в массиве с уже вышедшим из строя накопителем уже не используется, то шанс того, что следующий накопитель выведет из строя массив целиком равен 2/2*100=100%

RAID 1 (Mirror)

Что такое RAID и зачем он нужен?

Акроним RAID (Reudant Array of Independed Disks) избыточный массив независимых дисков, впервые был использован в 1988 году исследователями из института Беркли Паттерсоном (Patterson), Гибсоном (Gibson) и Кацем (Katz). Они описали конфигурацию массива из нескольких недорогих дисков, обеспечивающих высокие показатели по отказоустойчивости и производительности.

Наиболее «слабой» в смысле отказоустойчивости частью компьютерных систем всегда являлись жесткие диски, поскольку они, чуть ли не единственные из составляющих компьютера, имеют механические части. Данные записанные на жесткий диск доступны только пока доступен жесткий диск, и вопрос заключается не в том, откажет ли этот жесткий диск когда-нибудь, а в том, когда он откажет.

RAID обеспечивает метод доступа к нескольким жестким дискам, как если бы имелся один большой диск (SLED — single large expensive disk), распределяя информацию и доступ к ней по нескольким дискам, обеспечивая снижение риска потери данных, в случае отказа одного из винчестеров, и увеличивая скорость доступа к ним.

Обычно RAID используется в больших файл серверах или серверах приложений, когда важна, высока скорость и надежность доступа к данным. Сегодня RAID находит применение так же в настольных системах, работающих с CAD, мультимедийными задачами и когда требуется обеспечить высокую производительность дисковой системы.

Что такое BBU и зачем он нужен?

BBU (Battery Backup Unit) необходим для предотвращения потери данных находящихся в кэш-е RAID контроллера и еще не записанных на диск (отложенная запись — «write-back caching»), в случае аварийного выключения компьютерной системы.

Существуют три разновидности BBU:

  • Просто BBU: это аккумулятор, который обеспечивает резервное питание кэша через RAID контроллер.
  • Переносимые (Transportable) BBU (tBBU): это аккумулятор, который размещен непосредственно на модуле кэш и питает его независимо от RAID контроллера. В случае выхода из строя RAID контроллера, это позволяет перенести данные, сохраненные вкэш-е, на резервный контроллер и уже на нем завершить операцию записи данных.
  • Flash BBU: основная идея заключается в следующем: в случае сбоя питания RAID контроллер копирует содержимое кэш-а в энергонезависимую память (например, в случае с технологией Adaptec » Zero-Maintenance Cache Protection — на NAND флэш накопитель). Питание, необходимое для завершения этого процесса, обеспечивается встроенным супер-конденсатором. После восстановления питания, данные из флэш памяти копируются обратно в кэш контроллера.

Как создать RAID-массив в Windows 10

Самый простой способ создания программного РЕЙД-массива в Виндовсе:

установить в системный блок дополнительный диск размером не меньше того, на котором установлен Win 10 (желательно с равным количеством гигабайт);

через «Поиск» перейти в «Управление компьютером» и «Управление дисками»;

отобразится «Диск 0» и «Диск 1»;

  • на «Диске 0» находится С и Win 10 (для него будет создаваться зеркало);
  • «Диск 1» чистый (на нем будет создаваться зеркало С);
  • установить курсор на С;
  • кликнуть один раз правой кнопкой мыши;
  • всплывет окошко со списком действий;
  • выбрать «Добавить зеркало»;

  • появится окошко «Добавить зеркальный том» или «Мастер создания образа»;
  • система предложит «Выбрать размещение зеркала для С»;
  • отметить «Диск 1»;

  • если нужно, отформатировать его и нажать один раз на «Добавить зеркальный том»;
  • появится предупреждение, что зеркалирование возможно только для текущей (одной) ОС;
  • нажать на «Да»;

начнется процедура создания силами Виндовса точной копии С на «Диске 1»;

по завершении ресинхронизации на «Диск 1» загрузится равное количество данных с накопителя С, а свободное место система пометит словом «не распределено».

Важно! После создания РЕЙД-массива все изменения, происходящие на накопителе С, будут зеркально отображаться на дополнительном винчестере. Если основной HDD с установленным на нем Win 10 выйдет из строя, то все данные сохранятся в зеркале

Зеркальный том разрешается в любое время убрать (удалить) с компьютера.

Raid 50

Raid 50 описание

Raid 50 является комбинацией между двумя рэйд-массивами пятого уровня, объединенными между собой в страйп, или raid 0. Минимальное количество дисков для построения рэйд 50 массива — шесть штук.

Raid 50 описание

На иллюстрации показан частный случай организации такого массива. Нужно иметь ввиду, что на ряде контроллеров идет каскадное представление дисков по цепочке физический-логический-физический. То есть шесть физических жестких дисков объединяются в два логических массива (диска) raid-5, далее они представляются как два физических диска соответствующего размера и уже эти диски объединяются между собой в страйп, со своим размером блока и очередностью и восстановление raid может быть в такой ситуации весьма нетривиальной задачей. Полученный логический диск собранный по технологии рейд 50, уже средствами ОС воспринимается как физический, и размечается и форматируется.

В качестве иллюстрации возможных нагромождений представим что этот «физический» диск raid-50 делится средствами ОС на два логических, из которых собирается JBOD или raid-0 уже средствами ОС. Инженер осуществляющий восстановление данных raid и получивший шесть дисков которые состояли в подобном массиве может потратить массу времени на построение таблиц соответствия блоков и дисков.

Восстановление Raid-50

Как и в случаях с рэйд массивами 6-го уровня, на raid-50 достаточно часто встречаются надстройки в виде слайсов, крутятся десятки виртуальных машин, *nix файловые системы, VMFS и прочие радости бытия. Восстановление информации с raid50 является достаточно сложной задачей. Для начала нужно попытаться получить максимально полную информацию о предполагаемой конфигурации, количестве и размере разделов и т.п. Далее, определившись с конфигурацией, целесообразно идти по пути сборки, которой оперировал raid контроллер. То есть сначала собираются все рэйд-5 массивы входившие в состав raid50, выгружаются в отдельные образы и уже они объединяются в виртуальный страйп.

Запасной диск (Hot Spare)

Если в массиве будет запасной диск для горячей замены, при выходе из строя одного из основных дисков, его место займет запасной.

Диском Hot Spare станет тот, который просто будет добавлен к массиву:

mdadm /dev/md0 —add /dev/sdd

Информация о массиве изменится, например:

mdadm -D /dev/md0


    Number   Major   Minor   RaidDevice State
       0       8       16        0      active sync   /dev/sdb
       2       8       48        1      active sync   /dev/sdc
       3       8       32        —      spare   /dev/sdd

Проверить работоспособность резерва можно вручную, симулировав выход из строя одного из дисков:

mdadm /dev/md0 —fail /dev/sdb

И смотрим состояние:

mdadm -D /dev/md0


    Rebuild Status : 37% complete

    Number   Major   Minor   RaidDevice State
       3       8       32        0      spare rebuilding   /dev/sdd
       2       8       48        1      active sync   /dev/sdc
       0       8       16        —      faulty   /dev/sdb

* как видим, начинается ребилд. На замену вышедшему из строя sdb встал hot-spare sdd.

Ценовая выгода шумного RAID

RAID — это хорошо даже без оглядки на деньги. Но давайте посчитаем цену простейшего stripe-массива объемом 400 Гбайт. Два диска Seagate Barracuda SATA 7200.8 по 200 Гбайт каждый обойдутся вам примерно в $230. RAID-контроллеры встроены в большинство материнских плат, то бишь мы получаем их бесплатно.

В то же время 400-гигабайтный диск той же модели стоит $280. Разница — $50, и на эти деньги можно приобрести мощный блок питания, который вам, несомненно, понадобится. Я уж не говорю о том, что производительность составного «диска» при более низкой цене будет почти вдвое выше производительности одного винчестера.

Проведем теперь подсчет, ориентируясь на общий объем 250 Гбайт. Дисков по 125 Гбайт не существует, так что возьмем два винчестера по 120 Гбайт. Цена каждого диска — $90, цена одного 250-гигабайтного винчестера — $130. Что ж, при таких объемах за производительность приходится платить. А если взять 300-гигабайтный массив? Два диска по 160 Гбайт — примерно $200, один на 300 Гбайт — $170… Опять не то. Получается, что выгоден RAID только при использовании дисков очень большого объема.

Сборка RAID

Перед сборкой, стоит подготовить наши носители. Затем можно приступать к созданию рейд-массива.

Подготовка носителей

Сначала необходимо занулить суперблоки на дисках, которые мы будем использовать для построения RAID (если диски ранее использовались, их суперблоки могут содержать служебную информацию о других RAID):

mdadm —zero-superblock —force /dev/sd{b,c}

* в данном примере мы зануляем суперблоки для дисков sdb и sdc.

Если мы получили ответ:

mdadm: Unrecognised md component device — /dev/sdb
mdadm: Unrecognised md component device — /dev/sdc

… то значит, что диски не использовались ранее для RAID. Просто продолжаем настройку.

Далее нужно удалить старые метаданные и подпись на дисках:

wipefs —all —force /dev/sd{b,c}

Создание рейда

Для сборки избыточного массива применяем следующую команду:

mdadm —create —verbose /dev/md0 -l 1 -n 2 /dev/sd{b,c}

* где:

  • /dev/md0 — устройство RAID, которое появится после сборки; 
  • -l 1 — уровень RAID; 
  • -n 2 — количество дисков, из которых собирается массив; 
  • /dev/sd{b,c} — сборка выполняется из дисков sdb и sdc.

Мы должны увидеть что-то на подобие:

mdadm: Note: this array has metadata at the start and
    may not be suitable as a boot device.  If you plan to
    store ‘/boot’ on this device please ensure that
    your boot-loader understands md/v1.x metadata, or use
    —metadata=0.90
mdadm: size set to 1046528K

Также система задаст контрольный вопрос, хотим ли мы продолжить и создать RAID — нужно ответить y:

Continue creating array? y

Мы увидим что-то на подобие:

mdadm: Defaulting to version 1.2 metadata
mdadm: array /dev/md0 started.

Вводим команду:

lsblk

… и находим информацию о том, что у наших дисков sdb и sdc появился раздел md0, например:


sdb                     8:16   0    2G  0 disk  
??md0                   9:0    0    2G  0 raid1 
sdc                     8:32   0    2G  0 disk  
??md0                   9:0    0    2G  0 raid1 

* в примере мы видим собранный raid1 из дисков sdb и sdc.

RAID 1

Принцип работы — mirroring («зеркалирование»). Самая простая система RAID-массивов из всех возможных. Представляет собой параллельную запись информации с основного диска на другие — дублирующие. Производительность при этом никак не изменяется. Имеет широкое применение в серверном обслуживании, потому что в случае выхода из строя одного из накопителей, все продублированные данные остаются на других носителях. При этом вам будет доступен объем лишь одного винчестера.

Предположим у вас есть 3 диска по 500 Гбайт каждый. Из 1500 Гбайт вам останется лишь 500 Гбайт. В общем, предназначение таких систем — резервация и клонирование информации. Есть смысл использовать диски с высокой скоростью (7200 об/мин) — например, такой:.

RAID 1 часто используют в корпоративной сфере, где потеря информации может обернуться серьезными убытками. 

RAID5 — большой, надёжный, но сложный

Есть ещё один способ обеспечить надёжность хранения данных — записывать куда-то дополнительную информацию о файле, которая поможет его восстановить. Для этого требуется уже не 2, а 3 жёстких диска.

По этому принципу работает RAID5 — каждый файл он разбивает на 2 части, которые записывает на разные диски, например, на первый и второй, а дополнительную информацию пишет на третий диск. Для следующего файла он делает точно так же, только сам файл пишет на второй и третий диск, а дополнительные данные — на первый и так далее для каждого файла.

Прерывистая линия — это дополнительные данные для каждого файла.

Когда один из дисков выйдет из строя, то все файлы можно восстановить из двух оставшихся по специальному алгоритму. Получается, что если у вас есть три диска по 1 терабайту, то с RAID5 вы получите 2 терабайта для хранения данных, а 1 терабайт будет использован системой для данных восстановления.

Два из трёх — достаточно для восстановления данных в RAID5.

+ больше места, чем в RAID1

+ надёжно

— данные хоть и можно восстановить без потерь, но сделать это гораздо сложнее, чем в RAID1

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector