Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы НИС.doc
Скачиваний:
13
Добавлен:
16.04.2019
Размер:
871.42 Кб
Скачать

Требования по отказоустойчивости и надежности хранения данных

  • Поддержка нужных уровней RAID. Как правило, это уровни 1, 0+1,1+0 и 5.

  • Наличие дисков "горячей замены" (hot-spare). Механизмы использования hot-spare дисков могут быть разные. Например, возможен вариант, когда в случае отказа диска данные из дисков затронутой RAID-группы копируются на hot-spare диск. Но также возможен вариант, когда нет специально выделенного hot-spare диска — все диски содержат данные, но при этом на всех дисках выделена резервная область, куда копируются данные с поврежденной RAID-группы. Определение требуемого метода опять же за проектировщиком.

  • Защита участков кэш-памяти, обслуживающих операции записи. За исключением тех случаев, когда отключен кэш на запись, сервер получает подтверждение завершения операции записи сразу после попадания данных в кэш-память еще до записи их на диск. Для обеспечения целостности данных обычно применяются следующие методы:

    • Зеркалирование участков кэш-памяти, обслуживающих операции записи.

    • Поддержка батареями кэш-памяти в течении N часов или сохранение ее содержимого на диски в случае отключения внешнего питания. Какой из указанных вариантов определить в требованиях — задача проектировщика.

  • Дублирование всех компонентов и отсутствие единой точки отказа (SPOF). Степень важности этого требования зависит от режима работы системы и требований к доступности сервисов. Однако, не надо забывать, что сам массив является SPOF, если он не задублирован другим массивом.

Возможность создания PIT-копий данных для использования их в системе резервного копирования. В ряде систем, где обрабатываются большие объемы данных (терабайты), а сервисы должны быть доступны 24х7 при больших нагрузках, необходимо применять Serverless резервное копирование. Для этого используется механизм создания PIT-копий средствами дискового массива.

15. Методы повышения отказоустойчивости SOHO серверов (домашних компьютеров).

SOHO (от англ. Small Office / Home Office — малый/домашний офис) — название сегмента рынка электроники, предназначенного для домашнего использования. Как правило, характеризует устройства не предназначенные для производственных нагрузок и довольно хорошо переживающие длительные периоды бездействия.

Отказоустойчивый сервер.

Как правило сервер обслуживает множество пользователей. Поэтому, сервер в идеале всегда должен быть в рабочем состоянии, чтобы исполнить тот или иной запрос. Если Ваш домашний компьютер перестанет работать, то в конечном итоге от этого пострадаете только Вы. Если же сервер перестанет работать, то пострадают множество клиентов, что может обернуться несоизмеримыми потерями по сравнению со стоимостью самого сервера.

Часто путают понятия «надежность» и «отказоустойчивость».

Надежность есть свойство объекта сохранять во времени в установленных пределах значения всех параметров, характеризующих его способность выполнять требуемые функции в заданных режимах и условиях применения, технического обслуживания, хранения и транспортирования.

Безотказность — это свойство объекта непрерывно сохранять работоспособное состояние в течение некоторого времени или наработки. Наработка — это продолжительность или объем работы объекта. Иными словами, это способность сохранять работоспособность при отказе каких-либо компонентов системы. В настоящее время отказоустойчивость достигается благодаря избыточности или дублированию критичных или наиболее уязвимых компонентов системы.

Время простоя сервера. Способы сокращения.

Способами повышения отказоустойчивости сервера и как следствие снижения времени простоя является применение таких элементов как: RAID-массивы (дублирование жестких дисков), дублированные блоки питания, дублированная система охлаждения, в ряде случаев – дублирование подсистемы памяти (т.н. зеркалирование модулей памяти).

Если необходимо еще больше повысить отказоустойчивость системы, то говорят уже о построении HA-кластеров (High Availability Clusters – кластеры высокой доступности или готовности). HA-кластер – представляет из себя полностью дублированную систему серверов, систем хранения, коммутации и питания. Такая система имеет один из самых высоких показателей готовности, которое измеряется временем простоя в год, либо отношением времени работы к времени простоя выраженное в процентах. Кроме того, такая система позволяет не останавливать систему для проведения ремонтных и регламентных работ, что также существенно повышает готовность в целом.

Для сравнения, показатели готовности различных вычислительных машин:

  • обычный ПК – ~90% в год или 36,5 суток простоя в год.

  • сервер начального уровня – ~96% в год или 14,6 суток простоя

  • отказоустойчивый сервер - ~98% в год или 7,3 суток простоя

  • кластер высокой готовности – 99,99% в год или 53 минуты в год