Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
all2.docx
Скачиваний:
7
Добавлен:
24.12.2018
Размер:
1.54 Mб
Скачать

5. Raid массивы. Уровни raid (0, 1, 5, 6). Сравнение: оценки надежности, производительность, эффективность использования дискового пространства

RAID (redundant array of independent disks) — избыточный массив независимых жёстких дисков) массив из нескольких дисков, управляемых контроллером, взаимосвязанных скоростными каналами и воспринимаемых внешней системой как единое целое. В зависимости от типа используемого массива может обеспечивать различные степени отказоустойчивости и быстродействия. Служит для повышения надёжности хранения данных и/или для повышения скорости чтения/записи информации.

Уровни raid:

Без обеспечения надежности хранения данных

RAID 0

Диск 1

Диск 2

Диск 3

Диск 4

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Дисковый массив из двух или более жёстких дисков с отсутствием резервирования. Информация разбивается на блоки данных (Ai) и записывается на оба/несколько дисков одновременно.

(+):существенно повышается производительность.

(-): Надёжность RAID 0 заведомо ниже надёжности любого из дисков в отдельности, т. к. отказ любого из дисков приводит к неработоспособности всего массива.

С возможностью потери до одного жесткого диска (RAID 1-5)

RAID 1

Диск 1

Диск 2

A

A

B

B

C

C

D

D

(+): Обеспечивает приемлемую скорость записи и выигрыш по скорости чтения при распараллеливании запросов.

(+): Имеет высокую надёжность — работает до тех пор, пока функционирует хотя бы один диск в массиве.

(-): Приходится выплачивать стоимость двух жёстких дисков, получая полезный объём одного жёсткого диска (классический случай, когда массив состоит из двух дисков).

RAID 2

Отказоустойчивый дисковый массив с использованием кода Хемминга

Диск 1

Диск 2

Диск 3

Диск 4

Диск 5

Диск 6

Диск 7

A

B

C

D

ECC1:

ABCD

ECC2:

ABCD

ECC3:

ABCD

E

F

G

H

ECC1:

EFGH

ECC2:

EFGH

ECC3:

EFGH

I

J

K

L

ECC1:

IJKL

ECC2:

IJKL

ECC3:

IJKL

M

N

O

P

ECC1:

MNOP

ECC2:

MNOP

ECC3:

MNOP

В массивах такого типа диски делятся на две группы — для данных и для кодов коррекции ошибок, причем если данные хранятся на n дисках, то для хранения кодов коррекции необходимо n − 1 дисков. Метод Хемминга позволяет на лету исправлять однократные и обнаруживать двукратные ошибки.

Недостаток массива RAID 2 в том, что для его функционирования нужна структура из почти двойного количества дисков, поэтому такой вид массива не получил распространения.

RAID 3

Отказоустойчивый массив с параллельной передачей данных и четностью

Диск 1

Диск 2

Диск 3

Диск 4

Диск 5

A.1

A.2

A.3

A.4

ECC:A

B.1

B.2

B.3

B.4

ECC:B

C.1

C.2

C.3

C.4

ECC:C

D.1

D.2

D.3

D.4

ECC:D

В массиве RAID 3 из n дисков данные разбиваются на блоки размером 1 байт и распределяются по n − 1 дискам. Ещё один диск используется для хранения блоков чётности. Большинство пользователей удовлетворяет простое восстановление информации в случае поломки диска, для чего хватает информации, умещающейся на одном выделенном жёстком диске.

Отличия RAID 3 от RAID 2: невозможность коррекции ошибок на лету и меньшая избыточность.

(+): высокая скорость чтения и записи данных;

минимальное количество дисков для создания массива равно трём.

(-):массив этого типа хорош только для однозадачной работы с большими файлами, так как время доступа к отдельному сектору, разбитому по дискам, равно максимальному из интервалов доступа к секторам каждого из дисков. Для блоков малого размера время доступа намного больше времени чтения. Большая нагрузка на контрольный диск, и, как следствие, его надёжность сильно падает по сравнению с дисками, хранящими данные.

RAID 4

Массив независимых дисков с разделяемым диском четности

Диск 1

Диск 2

Диск 3

Диск 4

Диск 5

A

B

C

D

ECC:

ABCD

E

F

G

H

ECC:

EFGH

I

J

K

L

ECC:

IJKL

M

N

O

P

ECC:

MNOP

RAID 4 похож на RAID 3, но отличается от него тем, что данные разбиваются на блоки, а не на байты. Таким образом, удалось отчасти «победить» проблему низкой скорости передачи данных небольшого объёма. Запись же производится медленно из-за того, что чётность для блока генерируется при записи и записывается на единственный диск. Из систем хранения широкого распространения RAID-4 применяется на устройствах хранения компании NetApp (NetApp FAS), где его недостатки успешно устранены за счет работы дисков в специальном режиме групповой записи, определяемом используемой на устройствах внутренней файловой системой WAFL.

RAID 5

Отказоустойчивый массив независимых дисков с распределенной четностью

Диск 1

Диск 2

Диск 3

Диск 4

Диск 5

A

B

C

D

ECC:

ABCD

E

F

G

ECC:

EFGH

H

I

J

ECC:

IJKL

K

L

M

ECC:

MNOP

N

O

P

Блоки данных и контрольные суммы циклически записываются на все диски массива, нет асимметричности конфигурации дисков. Под контрольными суммами подразумевается результат операции XOR(исключающее или).

(+): RAID5 получил широкое распространение, в первую очередь, благодаря своей экономичности. Объём дискового массива RAID5 рассчитывается по формуле (n-1)*hddsize, где n — число дисков в массиве, а hddsize — размер наименьшего диска.

(-): Производительность RAID 5 заметно ниже, в особенности на операциях типа Random Write (записи в произвольном порядке), при которых производительность падает на 10-25% от производительности RAID 1 (или RAID 10), так как требует большего количества операций с дисками (каждая операция записи сервера заменяется на контроллере RAID на три – одну операцию чтения и две операции записи). Недостатки RAID 5 проявляются при выходе из строя одного из дисков — весь том переходит в критический режим (degrade), все операции записи и чтения сопровождаются дополнительными манипуляциями, резко падает производительность.

С возможностью потери до двух любых дисков

RAID 6

RAID 6: EVENODD

Диск 1

Диск 2

Диск 3

Диск 4

Диск 5

Диск 6

A

B

C

D

P:ABCD

Q:ALOS

E

F

G

H

P:EFGH

Q:BEPS

I

J

K

L

P:IJKL

Q:CFIS

M

N

O

P

P:MNOP

Q:DGJMS

RAID 6: X-Code

Диск 1

Диск 2

Диск 3

Диск 4

Диск 5

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P:CIO

P:DJK

P:EFL

P:AGM

P:BHN

Q:DHL

Q:EIM

Q:AJN

Q:BFO

Q:CGK

RAID 6: Reed-Solomon

Диск 1

Диск 2

Диск 3

Диск 4

Диск 5

Диск 6

A

B

C

D

XOR

ABCD

R-S

ABCD

E

F

G

XOR

EFGH

R-S

EFGH

H

I

J

XOR

IJKL

R-S

IJKL

K

L

M

XOR

MNOP

R-S

MNOP

N

O

P

XOR

QRST

R-S

QRST

Q

R

S

T

Отказоустойчивый массив независимых дисков с двумя независимыми распределенными схемами четности. Обеспечивает надежное хранение данных при выходе

из строя до двух дисков. Два основных подхода (ECC независимые по данным; ECC независимые по алгоритмам). Несколько различных реализаций ( EVENODD, XiCode, С кодами Рида-Соломона (ReediSolomon))

RAID 6: EVENODD

S=H⊕K⊕N

- Коды четности распределены по дискам

- P – XOR внутри горизонтальных групп

- Q – XOR внутри диагональных групп

- Случайная запись вызывает 6 операций ввода/вывода для 13 блоков и 12 для 3 блоков

RAID 6: X-Code

- Количество дисков должно быть простым числом

- P – XOR внутри диагональных групп слева направо

- Q – XOR внутри диагональных групп справа налево

- Случайная запись вызывает 6 операций ввода/вывода

RAID 6: Reed-Solomon

- XOR внутри горизонтальных групп

- RiS внутри горизонтальных групп

- Случайная запись вызывает 6 операций ввода/вывода

- Может быть расширен для обеспечения надежного хранения данных в случае отказа

большего числа дисков (>2)

RAID 6 — похож на RAID 5, но имеет более высокую степень надёжности — под контрольные суммы выделяется ёмкость 2-х дисков, рассчитываются 2 суммы по разным алгоритмам. Требует более мощный RAID-контроллер.

Для организации массива требуется минимум 4 диска[2]. Обычно использование RAID-6 вызывает примерно 10-15% падение производительности дисковой группы, по сравнению с аналогичными показателями RAID-5, что вызвано большим объёмом обработки для контроллера (необходимость рассчитывать вторую контрольную сумму, а также прочитывать и перезаписывать больше дисковых блоков при записи каждого блока).

Кластерные (комбинированные) – с возможностью потери до одного (двух) дисков из группы

RAID 1+0

Диск 1

Диск 2

Диск 3

Диск 4

Диск 5

Диск 6

A

A

B

B

C

C

D

D

E

E

F

F

G

G

H

H

I

I

Отказоустойчивый массив с дублированием и параллельной обработкой

RAID 0+1

Диск 1

Диск 2

Диск 3

Диск 4

Диск 5

Диск 6

A

B

C

A

B

C

D

E

F

D

E

F

G

H

I

G

H

I

Отказоустойчивый массив с параллельной обработкой и зеркалированием

RAID 5+0

Диск 1

Диск 2

Диск 3

Диск 4

Диск 5

Диск 6

A

B

P:AB

C

D

P:CD

E

P:EF

F

G

P:GH

H

P:IJ

I

J

P:KL

K

L

Отказоустойчивый массив с распределенными блоками четности и повышенной производительностью

RAID 1E

Диск 1

Диск 2

Диск 3

A

A

B

B

C

C

D

D

E

E

F

F

Отказоустойчивый массив с двунаправленным зеркалированием

RAID 5EE

Диск 1

Диск 2

Диск 3

Диск 4

Диск 5

Диск 6

A

B

C

D

XOR

ABCD

Hot spare

E

F

G

XOR

EFGH

Hot spare

H

I

J

XOR

IJKL

Hot spare

K

L

M

XOR

MNOP

Hot spare

N

O

P

XOR

QRST

Hot spare

Q

R

S

T

Отказоустойчивый массив независимых дисков с распределенными четностью и диском горячей подмены (Hot Spare)

Примечание: поддерживается не во всех контроллерах RAID level-5EE подобен массиву RAID-5E, но с более эффективным использованием резервного диска и более коротким временем восстановления. Подобно RAID level-5E, этот уровень RAID-массива создает ряды данных и контрольных сумм во всех дисках массива. Массив RAID-5EE обладает улучшенной защитой и производительностью.

Основные метрики надёжности для дисковых подсистем:

  • MTTF – среднее время до сбоя одного из компонентов.

  • MTTR – среднее время до восстановление массива.

  • MTTDL – среднее время до потери данных.

  • Среднее время до потери доступа к данным: (MTTLDA, MTDA).

Це́пь Ма́ркова — последовательность случайных событий с конечным или счётным числом исходов, характеризующаяся тем свойством, что, говоря нестрого, при фиксированном настоящем будущее независимо от прошлого.

Скрытые ошибки: ошибки при записи, удаление данных.

Метод Элиреса для оценки надежности дисковых систем: Используются 4 распределения: 1)D(Op) – время до функционального сбоя; 2)D(Ld) – время до появления скрытой ошибки;

3)D(Rest) – время восстановления после функционального сбоя;

4)D(Scrub) – время обнаружения и исправления скрытой ошибки. Диаграмма состояний RAID массива из N+1 дисков на рисунке 1. Последовательное моделирование методом Монте-Карло на рисунке 2.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]