Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
91-100.doc
Скачиваний:
6
Добавлен:
23.09.2019
Размер:
765.44 Кб
Скачать

Реализация архивных систем хранения emc

Первая коммерчески успешная реализация системы хранения на основе идеологии CAS появилась на рынке в 2002 году. Платформа архивации с адресацией по содержимому была разработана специалистами корпорации EMC и увидела свет под названием EMC Centera. EMC Centera – контентно-ориентированная система хранения, построенная по принципу объединения независимых узлов с введением некоторой избыточности (архитектура RAIN). В качестве узла системы выступает сервер стандартной архитектуры с внутренними дисками, которые используются для размещения файлов операционного окружения CentraStar и архивных данных. Для защиты от потери данных в случае выхода из строя дисков узла или одного из узлов системы полностью, узлы объединяются в группы по зеркальной схеме или по схеме с вычислением контрольных сумм. Одной из важных особенностей реализации является то, что при выходе из строя одного из узлов системы обеспечивается не только защита данных, но и сохранение всего функционала решения в целом. Все узлы системы идентичны и используются для работы в одном из трех режимов: режим хранения данных, режим обеспечения доступа к архивным данным и смешанном, позволяющем минимизировать число узлов. Взаимодействие клиентов с системой архивации осуществляется по протоколу TCP/IP с использованием интерфейсов Gigabit Ethernet. Такие же интерфейсы применяются и для осуществления межузлового взаимодействия внутри платформы архивирования. Соединения для каждого узла дублированы. Защита данных от катастроф реализуется путём асинхронной репликации между двумя и более системами EMC Centera. Репликация, как и доступ к данным, осуществляется на базе протокола IP и может происходить в одном или обоих направлениях. В случае необходимости возможно построение схем репликации данных по цепочке из нескольких систем EMC Centera.

Программное обеспечение для решений архивации данных

Ввиду особенностей архитектуры систем хранения CAS, классический файловый или блочный доступ к данным невозможен. Это упрощает реализацию политик информационной безопасности и обеспечение сохранности данных, но предусматривает использование специализированного интерфейса (API) для осуществления информационного взаимодействия. На рынке существует множество продуктов ведущих производителей программного обеспечения, применяемых для организации решений архивного хранения. Основной функцией этих продуктов является обеспечение взаимодействия между системой хранения архивных данных (в частности, EMC Centera), приложениями и клиентами. Для построения моновендорного решения по архивации данных компания EMC предлагает ряд мощнейших программных продуктов, являющихся лидирующими на рынке. В первую очередь, это продукты семейства EMC SourceONE, обеспечивающие архивирование файлов, почтовых сообщений, данных прикладных систем, реализующие функционал eDirectory и позволяющие построить полноценное решение для архивного хранения данных уровня Enterprise. Для интеграции с приложениями, не поддерживающими прямое взаимодействие с EMC Centera, служит продукт EMC Centera Universal Access, представляющий собой шлюз для обеспечения взаимодействия между протоколами HTTP, FTP, NFS или CIFS и Centera API. Продукты EMC Centera Seek и EMC Centera Chargeback Reporter обеспечивают быстрый, точный поиск и функции отчетов для архивов значительных объемов. Дополнительным уровнем защиты данных, размещаемых на системах хранения любого типа, является их резервное копирование. Платформа архивирования не является исключением из этого правила. Взаимодействие решения для архивирования данных на базе EMC Centera с решениями для резервного копирования осуществляется с помощью EMC Centera Backup and Recovery Module. Данный модуль обеспечивает взаимодействие протоколов NDMP и Centera API, что позволяет интегрировать электронный архив с платформами резервного копирования ведущих производителей. Одной из таких платформ является продукт EMC Networker. Компания Открытые Технологии имеет большой опыт реализации сложных интеграционных проектов, включающих построение систем хранения данных, платформ архивирования, систем резервного копирования и восстановления данных. Открытые Технологии являются старейшим партнёром компании EMC, а также других производителей продуктов для рынка хранения данных. Мы всегда готовы предложить вам оптимальное решение на базе продуктов, выпускаемых лидерами отрасли.

94.Данные и знания. Характеристика моделей представления знаний.

Данные – это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства.

Для хранения данных используются базы и хранилища данных

Знания – это закономерности, принципы, связи, законы предметной области, полученные в результате практической деятельности и профессионального опыта.

Для хранения знаний используются базы знаний

Модель представления данных – множество элементов (объектов, типов данных) и связей (отношений) между ними, а также ограничений операций над типами данных и отношениями.

Основные модели представления данных в базах данных

  1. Иерархическая

  2. Сетевая

  3. Реляционная

  4. Многомерная

  5. Объектно-ориентированная

Иерархическая модель представляет собой ориентированный граф (перевернутое дерево) объектов, связанных иерархическими отношениями

К основным понятиям иерархической модели относятся: уровень, элемент (узел), связь

В сетевой модели при тех же основных понятиях (уровень, узел, связь) каждый элемент может быть связан с любым другим элементом, связанных иерархическими отношениями

Реляционная модель представляет собой совокупность двумерных таблиц, связанных отношениями.

К основным понятиям иерархической модели относятся: тип данных, домен, атрибут, кортеж, отношение, первичный ключ

Хранилище данных: предметно-ориентированный, интегрированный, неизменяемый и поддерживающий хронологию набор данных, предназначенный для обеспечения принятия управленческих решений.

Основные модели представления данных в хранилищах данных

Реляционная

Гибридная

Многомерная

Виртуальная

В основе реляционных хранилищ данных лежит разделение данных на две группы – измерения и факты.

Измерения – это категориальные атрибуты, наименования и свойства объектов, участвующих в некотором бизнес-процессе.

Примеры измерений: наименования товаров, названия фирм-поставщиков и покупателей, ФИО людей, названия городов и т. д.

Измерения качественно описывают исследуемый бизнес-процесс.

Факты – это непрерывные по своему характеру данные (могут принимать бесконечное множество значений).

Примеры фактов: цена товара или изделия, их количество, сумма продаж или закупок, зарплата сотрудников, сумма кредита и т. д.

Факты количественно описывают бизнес-процесс.

Схема построения реляционного хранилища данных «звезда»

Центральной является таблица фактов (Fact table), с которой связаны таблицы измерений (Dimension tables).

Преимущества схемы «звезда»

простота и логическая прозрачность модели

более простая процедура пополнения измерений, поскольку приходится работать только с одной таблицей

Недостатки схемы «звезда»

медленная обработка измерений, поскольку одни и те же значения измерений могут встречаться несколько раз в одной и той же таблице

высокая вероятность возникновения несоответствий в данных (в частности, противоречий), например, из-за ошибок ввода

95.Вывод на знаниях. Стратегии управления выводом: на основе гипотез, перебор фактов.

96.Интеллектуальные системы: понятие, область применения, классификация.

97.Экспертные системы: назначение, структура, разработчики.

Экспертные системы (ЭС) – это сложные программные комплексы, аккумулирующие знания специалистов в конкретных предметных областях и тиражирующие этот эмпирический опыт для консультаций менее квалифицированных пользователей.

Структура экспертной системы

Классификация экспертных систем

Классификация ЭС по решаемой задаче

Интерпретация данных – процесс определения смысла данных, результаты которого должны быть согласованными и корректными.

Диагностика - процесс соотнесения объекта с некоторым классом объектов и/или обнаружение неисправности в некоторой системе.

Мониторинг – непрерывная интерпретация данных в реальном масштабе времени и сигнализация о выходе тех или иных параметров за допустимые пределы. Главные проблемы – «пропуск» тревожной ситуации и инверсная задача «ложного» срабатывания. Сложность этих проблем в размытости симптомов тревожных ситуаций и необходимость учета временного контекста.

Проектирование состоит в подготовке спецификаций на создание «объектов» с заранее определенными свойствами. Под спецификацией понимается весь набор необходимых документов – чертёж, пояснительная записка и т. д.

Прогнозирование позволяет предсказывать последствия некоторых событий или явлений на основании анализа имеющихся данных. Прогнозирующие системы логически выводят вероятные следствия из заданных ситуаций.

Планирование – нахождение планов действий, относящихся к объектам, способным выполнять некоторые функции.

Обучение – использование компьютера для обучения какой-то дисциплине или предмету. Системы обучения диагностируют ошибки при изучении какой-либо дисциплины с помощью ЭВМ и подсказывают правильные решения.

Управление – функция организованной системы, поддерживающая определенный режим деятельности. Такого рода ЭС осуществляют управление поведением сложных систем в соответствии с заданными спецификациями.

Поддержка принятия решений – совокупность процедур, обеспечивающая лицо, принимающее решения, необходимой информацией и рекомендациями, облегчающими процесс принятия решения. Эти ЭС помогают специалистам выбрать и/или сформировать нужную альтернативу среди множества выборов при принятии ответственных решений.

Классификация ЭС по связи с реальным временем

Статические ЭС разрабатываются в предметных областях, в которых база знаний и интерпретируемые данные не меняются во времени. Они стабильны.

Пример: диагностика неисправностей в автомобиле.

Квазидинамические ЭС интерпретируют ситуацию, которая меняется с некоторым фиксированным интервалом времени.

Пример: микробиологические ЭС, в которых снимаются лабораторные измерения с технологического процесса один раз в 4-5 часов и анализируется динамика полученных показателей по отношению к предыдущему измерению.

Динамические ЭС работают в сопряжении с датчиками объектов в режиме реального времени с непрерывной интерпретацией поступающих в систему данных.

 Пример: управление гибкими производственными комплексами, мониторинг в реанимационных палатах.

Классификация ЭС по степени интеграции с другими программами

  • Автономные ЭС работают непосредственно в режиме консультаций с пользователем для специфически «экспертных» задач, для решения которых не требуется привлекать традиционные методы обработки данных (расчеты, моделирование и т. д.).

  • Гибридные ЭС представляют программный комплекс, агрегирующий стандартные пакеты прикладных программ (например, математическую статистику, линейное программирование или системы управления базами данных) и средства манипулирования знаниями. Это может быть интеллектуальная надстройка над ППП (пакетами прикладных программ) или интегрированная среда для решения сложной задачи с элементами экспертных знаний.

Этапы разработки ЭС

Стадии разработки прототипа ЭС

98.Назначение языка HTML. Основные средства форматирования текста, таблиц и форм в HTML. Каскадные списки стилей для форматирования объектов.

TML (от англ. HyperText Markup Language — «язык разметки гипертекста») — стандартный язык разметки документов воВсемирной паутине. Большинство веб-страниц создаются при помощи языка HTML (или XHTML). Язык HTML интерпретируетсябраузерами и отображается в виде документа, в удобной для человека форме.

HTML является приложением («частным случаем») SGML (стандартного обобщённого языка разметки) и соответствует международному стандарту ISO 8879. XHTML же является приложением XML.

Язык HTML был разработан британским учёным Тимом Бернерсом-Ли приблизительно в 19891991 годах в стенахЕвропейского совета по ядерным исследованиям в Женеве (Швейцария). HTML создавался как язык для обмена научной и технической документацией, пригодный для использования людьми, не являющимися специалистами в области вёрстки. HTML успешно справлялся с проблемой сложности SGML путём определения небольшого набора структурных и семантическихэлементов — дескрипторов. Дескрипторы также часто называют «тегами». С помощью HTML можно легко создать относительно простой, но красиво оформленный документ. Помимо упрощения структуры документа, в HTML внесена поддержка гипертекста.Мультимедийные возможности были добавлены позже.

Теги форматирования текста

<pre></pre>

Обрамляет предварительно отформатированный текст.

<h1></h1>

Создает самый большой заголовок

<h2></h2>, <h3>, </h3><h4></h4>, <h5>, </h5>

Создает заголовоки промежуточных размеров

<h6></h6>

Создает самый маленький заголовок

<b></b>

Создает жирый текст (нерекомендованный)

<i></i>

Создает наклонный текст (нерекомендованный)

<tt></tt>

Создает текст - имитирующий стиль печатной машинки. (нерекомендованный)

<kbd></kbd>

Создает текст - имитирующий стиль печатной машинки. (рекомендованный)

<var></var>

Название переменных отображается курсивом

<cite></cite>

Выделение цитат курсивом

<address></address>

Отображается курсивом в виде отдельного абзаца

<em></em>

Наклонный текст (воспринимается посковыми роботами как выделение)

<strong></strong>

Жирный текст (воспринимается посковыми роботами, как особо сильное выделение)

<font size="?"></font>

Устанавливает размер текста в пределах от 1 до 7.

<font color="?"></font>

Устанавливает цвет текста, используя значение цвета в виде RRGGBB.

Форматирование

<p></p>

Создает новый параграф

<p align="?"></p>

Выравнивает параграф относительно одной из сторон документа, значения: left, right, justify или center

<nobr>

Запрещает перевод строки.

<wbr>

Указывает где разбивать строку для переноса при необходимости.

<br>

Вставляет перевод строки.

<blockquote></blockquote>

Создает отступы с обеих сторон текста.

<dl></dl>

Создает список определений.

<dt>

Определяет каждый из терминов списка

<dd>

Описывает каждое определение

<ol></ol>

Создает нумерованный список

<li>

Определяет каждый элемент списка и присваивает номер

<ul></ul>

Создает ненумерованный список

<li>

Предваряет каждый элемент списка и добавляет кружок или квадратик.

<div align="?"></div>

Важный тег используемый для форматирования больших блоков текста HTML документа, также используется в таблицах стилей

CSS (англ. Cascading Style Sheets — каскадные таблицы стилей) — формальный язык описания внешнего вида документа, написанного с использованием языка разметки.

Преимущественно используется как средство описания, оформления внешнего вида веб-страниц, написанных с помощьюязыков разметки HTML и XHTML, но может также применяться к любым XML-документам, например, к SVG или XUL.