Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Б М.docx
Скачиваний:
148
Добавлен:
09.06.2015
Размер:
2.63 Mб
Скачать

Схема

Определения четности переносод

Чем меньше А!, тем меньше разрядность конт-

Четность

переносов

Четность

слагаемых

И

Схема проверки четностей по(12.8)

Ошибка

Рис. 12.2. Контроль сложения с использованием проверок по четности

рольного кода и проще дополнительная аппаратура. Для двоич­ных чисел контроль по модулю возможен при 3, поэтому в ЭВМ часто используют контроль по модулю 3.

Покажем, что с помощью контроля по модулю 3 обнаружи­ваются любые одиночные ошибки. Одиночная ошибка в каком- либо разряде двоичного числа соответствует изменению числа на значение ±2\ Для обнаружения ошибки необходимо, чтобы контрольные коды чисел а и а±2* не совпадали, т. е.

R (а)ФЯ (a±2) = R (a)±R (2*),

или

Я(2*)#0.

Но 2‘ не делится на 3 без остатка, следовательно, требуемое условие выполняется. Кроме одиночных ошибок при контроле по модулю 3 обнаруживается часть двойных ошибок, а именно те ошибки, при которых правильные и ошибочные результаты име­ют несовпадающие остатки от деления на 3.

На рис. 12.3 изображена структурная схема сумматора с контролем, по модулю R. Отметим, что контрольный блок значительно проще основного, при /? = 3 он содержит только два двоичных разряда. При реализации контроля важное значение имеет построение схем формирования остатков при минималь­ных затратах оборудования. Очевидно, что нахождение остатка путем прямого деления двоичного числа на 3 — путь неприемле­мый. Однако кодирование по модулю 3 обладает свойствами, позволяющими строить достаточно простые комбинационные схемы формирования остатка по модулю 3.

Рис. 12.3. Структурная схема сумматора с контролем по модулю R

Может быть применен контроль по модулю с большим осно­ванием, чем 3, например по модулю 7. При этом увеличивается число кратных ошибок, которые могут обнаруживаться системой контроля, однако возрастает сложность кодирующей и декоди­рующей аппаратуры.

Повышение степени интеграции и снижение стоимости (в пе­ресчете на один вентиль) электронных схем сделали возможным практическое использование для контроля некоторых узлов, на­пример сумматоров, самопроверяемого дублирования их схем, при котором'ошибки обнаруживаются по несовпадению сигналов на выходах дублированных схем. Этим способом обнаруживают ошибки любой кратности.

  1. Взаимодействие систем автоматического контроля, восстановления вычислительного процесса и диагностирования

В ЭВМ, снабженной системой автоматического контроля, возникновение ошибок в каком-либо устройстве порождает сиг­нал ошибки, с появлением которого приостанавливается выпол­нение программы целиком или только рабочей процедуры в не­исправном устройстве. При этом 1 в соответствующем разряде регистра ошибок, высвечиваемом на сигнальном табло на пульте оператора, указывает укрупненно место, где обнаружена ошибка (устройство, узел, регистр, группа разрядов регистра и т. д.). Сигнал ошибки инициирует работу системы восстановления.

Система автоматического восстановления во взаимодействии с системой автоматического контроля обычно выполняет следую­щие функции:

  1. распознавание характера обнаруженной ошибки, т. е. вы­яснение, вызвана ошибка случайным сбоем, перемежающимся или устойчивым отказом;

  2. организация «рестарта», т. е. продолжения выполнения программы путем устранения возникающей ошибки в информа­ции повторением ошибочно выполненной микрооперации, коман­ды или сегмента программы (при обнаружении, что ошибка вызвана сбоем);

  3. запись в память информации о сбое;

  4. инициирование (при обнаружении отказа) работы систе­мы автоматического диагностирования (САД).

На САД в данном случае возлагается:

  1. локализация места отказа с заданной степенью подробно­сти, например до уровня сменной платы, и, если возможно, реконфигурация, т. е. отключение неисправного узла или

устройства с передачей его функции другому соответствующему узлу или устройству;

  1. запись в память информации об отказе для последующей обработки.

Общая логика взаимодействия систем автоматического кон­троля, восстановления и диагностирования показана на рис. 12.4. Первой выполняется процедура обработки сигнала прерывания от системы контроля, начинающаяся записью со­стояний регистров процессора и старого слова состояния про­граммы (ССП) в соответствующие ячейки памя-ги и выборкой нового ССП системы восстановления. Далее производится за­пись в специальные регистры или ячейки памяти ситуации в ЭВМ в момент обнаружения ошибки (записывается состояние запоминающих элементов и шин передачи данных неисправного устройства) !.

Для распознавания характера ошибки (сбой или отказ) необходимо повторить, может быть, даже несколько раз, опера­цию, в которой обнаружилась ошибка. Однако желательно это сделать с минимальными потерями времени. С этой точки зрения лучше всего, если процессор и система контроля выполнены таким образом, что проверяется правильность каждой микроопе­рации и вычислительный процесс останавливается на ошибочно выполнившейся микрооперации, которая может быть повторена. Микрооперация (команда) может быть повторена, если не иска­зилась используемая в операции информация (операнды, адреса и т. д.), т. е. если не пройден «порог повторения». Это проверяет входящая в систему программа обработки ошибок, которая по записанной ситуации, соответствующей появлению ошибки, оп­ределяет, пройден или нет порог повторения микрооперации или команды I. Если соответствующий порог пройден, то вместо микрооперации повторяется команда, а вместо команды — сег­мент программы. Последнее возможно, если программист пре­дусмотрел в программе «контрольные точки», сохраняющие про­межуточные данные, позволяющие повторить программу с дан­ного места.

Если при повторении микрокоманды (команды, сегмента, программы) ошибка не повторяется, событие распознается как сбой и происходит возврат к точке прерывания программы, но перед этим в память записывается дополнительная информация

о состоянии в момент сбоя вычислительной системы (какие в это время выполнялись операции в периферийных и других устрой­ствах, название программы, адрес команды, операнды, время). Информация о ситуациях при сбоях и об отказах накапливается во внешнем ЗУ и в последующем обрабатывается специальной программой, вырабатывающей определеннее рекомендации об­служивающему персоналу, выполняющему профилактические работы.

Если при определенном числе повторений (например, во­семь) ошибка сохраняется, событие распознается как отказ и автоматически приводится в действие САД для определения места неисправности. Диагностические процедуры также могут включаться вручную с пульта, например при пуске машины.

После выявления места отказа проверяется возможность реконфигурации путем автоматического отключения неисправ­ного устройства и передачи его функций другому устройству. Если это возможно, то производится реконфигурация системы. Затем после сообщения оператору об отказе и произведенной реконфигурации происходит возврат к контрольной точке про­граммы. Если реконфигурация невозможна, САД инициирует на пульте код * неисправности. Оператор, пользуясь справочником неисправностей, находит неисправный блок, ремонтирует или заменяет его, затем с пульта включает диагностические про­цедуры. Если отказ устранен, производится возврат к контроль­ной точке программы.

  1. Принципы построения систем автоматического диагностирования ЭВМ

В техническом обслуживании ЭВМ наиболее сложной про­блемой является поиск места (локализация) неисправности, вызвавшей отказ в работе машины. Поиск места неисправности вручную в таком сложном объекте, как современные ЭВМ, требует очень высокой квалификации обслуживающего персона­ла и больших затрат времени.

Для облегчения и ускорения поиска причины отказа ЭВМ снабжаются системами автоматического диагностирования не­исправностей.

Диагностирование некоторого объекта может производиться функциональным или тестовым способом. Функциональное ди­агностирование предполагает контроль при помощи тех или иных средств контроля правильности функционирования объек­та диагностирования при реализации его рабочего процесса. Тестовое диагностирование производится путем подачи на ди­

агностируемый объект специальных тестовых воздействий и сравнения реакций объекта на эти воздействия с эталонными ответами.

Применяемые в ЭВМ средства автоматического контроля правильности функционирования помимо главной своей зада­чи — обнаружение ошибки в работе машины — позволяют ди­агностировать (локализовать) место неисправности, но с точно­стью лишь до устройства или крупного блока (например, модуля ОП, АЛУ и т. п.), т. е. с разрешающей способностью, которая для большинства ЭВМ оказывается недостаточной.

В ЭВМ используется главным образом метод тестового ди­агностирования, позволяющий локализовать место неисправно­сти с достаточной разрешающей способностью.

Диагностические процедуры могут осуществляться путем пропуска на ЭВМ специальных диагностических программ. Од­нако несравненно более гибкое диагностирование с большей детализацией места неисправности (большей разрешающей спо­собностью) обеспечивают диагностические процедуры, выпол­няемые под управлением специальных диагностических микроте­стов и микропрограмм («микропрограммное диагностирование», или, короче, «микродиагностика»).

В связи со сложностью аппаратуры диагностирование ЭВМ производится в форме многоэтапного процесса, причем на раз­ных этапах используются различные средства САД — микро­программные, программные, а также некоторые аппаратурные средства системы диагностирования.

Система автоматического диагностирования представляет собой комплекс аппаратурных, микропрограммных и программ­ных средств и справочной документации (справочников не­исправностей, инструкций, схем ЭВМ, тестов).

В зависимости от размещения аппаратурных средств систе­мы диагностирования различают встроенные САД, когда ди­агностирующие средства размещаются внутри ЭВМ, и внешние САД, когда эти средства находятся вне машины. На практике часто САД строятся комбинированными: одна часть их средств встраивается в машину, а другая оформляется в виде специаль­ного дополнительного оборудования, подсоединяемого к ЭВМ при диагностировании неисправностей.

Обычно объем диагностических микропрограмм (тестов «микродиагностики») и программ столь велик, что их не удается хранить внутри ЭВМ (в УП, ОП или специальных встроенных памятях), но это в ряде случаев и не так важно, так как диагно­стические тесты не так часто выполняются. Поэтому обычно они хранятся во внешних ЗУ, в том числе в специальных внешних ЗУ САД.

Для САД современных средних и больших ЭВМ общего назначения характерным является наличие в их составе по­строенных на основе микропроцессоров или микро-ЭВМ специа­лизированных диагностических процессоров (называемых сер­висными адаптерами или сервисными процессорами), управляю­щих загрузкой в ЭВМ из внешних ЗУ («сервисных ЗУ») диагностической информаций, инициированием диагностических процедур, опросом состояния ЭВМ после подачи тестовых воз­действий, сравнением полученных ответов с эталонными, инди­кацией и регистрацией результатов диагностирования.

При построении САД ЭВМ широкого назначения (например, в ЕС ЭВМ) используется диагностирование по методу «раскрут­ки». Метод «раскрутки» предполагает поэтапное последователь­ное расширение работоспособной части ЭВМ путем включения в эту часть оборудования, проверенного на предыдущем этапе.

На каждом i этапе диагностического процесса подмашина Aft, представляющая собой часть оборудования проверяемой ЭВМ, участвует в диагностировании аппаратуры ДМ;, которая, если в ней нет отказов, присоединяется к подмашине Aft-, обра­зуя новую подмашину Afi+i=AfiUAAf/, выполняющую диагно­стическую процедуру на следующем этапе.

Подмашина Af0, с которой начинается «раскрутка», называ­ется диагностическим ядром ЭВМ. Диагностическое ядро до­лжно иметь повышенную надежность и допускать проверку ра­ботоспособности вручную или в полуавтоматическом режиме.

Системы автоматического диагностирования в машинах ЕС ЭВМ. В рассматриваемых САД реализовано микропрограммное диагностирование (микродиагностика).

Микропрограммное диагностирование в отличие от диагно­стирования программными средствами позволяет контролиро­вать изменение состояния аппаратуры ЭВМ на каждом машин­ном такте, благодаря чему достигается высокая разрешающая способность САД — один-два сменных элемента (ТЭЗ). Однако при этом требуется дополнительная аппаратура (около 3—5 % объема оборудования процессора и каналов) и необходима раз­работка большого объема (около 1 Мбайт) микродиагностиче- ской информации (микротестов).

Средства САД и, в частности, микродиагностирование в не­которых моделях ЭВМ используются системой автоматизации профилактических испытаний, выполняемых при программно­управляемом изменении уровней питающих напряжений на ±5 % номинальных значений.

Системы диагностирования ЭВМ ЕС используют дополни­тельное внешнее оборудование — сервисный адаптер (сервис­ный процессор) с собственной небольшой оперативной памятью

Рис. 12.5. Система автоматического диагностирования ЭВМ ЕС-1045

и сервисное кассетное ЗУЛ (пультовый накопитель). На рис. 12.5 показаны связи этих сервисных устройств с оборудова­нием ЭВМ в САД ЭВМ ЕС-1045. Микродиагностическая инфор­мация, а в ряде моделей ЕС ЭВМ и рабочие микропрограммы машины хранятся на кассетах сервисного ЗУЛ.

Управляющая память (УП) микропрограммного управляю­щего устройства процессора машины вся или частично является загружаемой.

Из сервисного ЗУЛ передаются в регистр микрокоманд УУ процессора микротесты, в загружаемую УП (или ее загружае­мую секцию) — диагностические микропрограммы. Кроме того, из сервисного ЗУЛ производится также загрузка диагностиче­ских программ в ОП ЭВМ.

Сервисный процессор имеет собственную ориентированную на диагностические операции систему команд. Эти команды поступают в сервисный процессор с сервисного ЗУЛ и дешифри­руются дешифратором диагностических операций сервисного процессора.

Данные о текущем состоянии машины, т. е. данные о со­стоянии ее регистров, счетчиков, управляющих триггеров, уров­ней сигналов на шинах (общий объем этих данных в ЭВМ ЕС со­ставляет 3—4 тыс. бит), должны передаваться на пульт управ­ления машины, а в режиме диагностирования — выборочно и в сервисный процессор для сравнения реакций аппаратуры на микротесты и диагностические микропрограммы с эталонными, содержащимися в микродиагностической информации.

Передача из машины на пульт управления и в сервисный

процессор указанного объема данных параллельным кодом практически невозможна, так как требует нескольких тысяч проводов. Поэтому эти данные подвергаются сериализации, дру­гими словами, преобразованию объединенного параллельного кода состояния ЭВМ в последовательный. Этот последователь­ный код передается на пульт управления машины, там преобра­зуется в поток байт (десериализация) и отображается на инди­каторах пульта, запоминается в памяти пульта, а нужные фраг­менты данных о состоянии ЭВМ, адресуемые сервисным процессором, поступают в последний для сравнения с эталонны­ми кодами. Сериализация данных о состоянии ЭВМ производит­ся многоступенчатой схемой, построенной на мультиплексорах (см. гл. 3) [27].

В ЕС ЭВМ диагностирование машин производится по методу «раскрутки». Диагностическое ядро образуют сервисный про­цессор, сервисное ЗУЛ и часть аппаратуры пульта управления.

Диагностирование производится в несколько этапов. Можно выделить следующие укрупненные этапы: 1) статическое микро­диагностирование; 2) динамическое микродиагностирование;

  1. функциональное (программное) диагностирование.

Статическое микродиагностирование. Управление процессо­ром машины берет на себя сервисный процессор. Производится загрузка из сервисного ЗУЛ регистра микрокоманд микротестом и инициируется выполнением микрооперации с заданным тесто­вым набором.

Одновременно из сервисного ЗУЛ поступают эталонный код и адрес (номер) байта в сериализованном потоке данных о со­стоянии ЭВМ, который следует сравнить с эталоном.

- В данном случае микродиагиостирование называется «стати­ческим», так как проверяемая аппаратура работает не с рабочей тактовой частотой, а в темпе, определяемом загрузкой оборудо­вания микротестами. На данном этапе проверяются аппаратура процессора, каналов, адаптера канал — канал, управление па­мятями, загружаемая УП, частично другие памяти.

Динамическое микродиагностирование производится при ра­боте аппаратуры ЭВМ с рабочей тактовой частотой, что по­зволяет выявить неисправности, связанные с искажениями в ре­ализации временных диаграмм. При этом используется прове­ренная на предыдущем этапе загружаемая УП, в которую с сервисного ЗУЛ загружаются диагностические микропрограм­мы, принимающие на себя управление ЭВМ. Сервисный про­цессор сравнивает результаты выполнения микропрограмм с эталонами. На этом этапе в динамическом режиме проверяется аппаратура ЭВМ, в том числе все ее памяти.

Функциональное (программное) диагностирование. Сред­ствами функционального диагностирования служат проверенная на предыдущих этапах аппаратура машины и диагностические программы: 1) программа «базовый тест»; 2) программы тест- секций, выполняемые под управлением мониторной программы (диагностического монитора); 3) программы автономных ди­агностических тестов отдельных устройств. Базовый тест, за­гружаемый с сервисного ЗУЛ, проверяет выполнение группы команд процессора («ядро системы команд»), в том числе ко­манд ввода-вывода, цепи связи с некоторыми периферийными устройствами.

Далее при помощи программ тест-секций производится ди­агностирование всех операций процессора, системы прерывания, защиты памяти, таймера, средств прямого управления, ОП, памяти ключей защиты, каналов ввода-вывода, периферийных устройств и их УПУ.

Если результат прохождения какого-либо теста оказывается неудачным, САД высвечивает на индикаторном табло пульта управления номер этого теста. Оператор, пользуясь справочни­ком неисправностей, по номеру теста находит место неисправно­сти. В такой форме система сообщает оператору о месте не­исправности на всех этапах — от начала диагностического про­цесса до этапа проверки мультиплексного канала включительно. В последующих за этим этапах диагностики система выдает на печатающее устройство сообщение оператору о месте неисправ­ности и указание, какая сменная плата (ТЭЗ) подлежит замене.

Более подробно вопросы автоматизации контроля и диагно­стирования ЭВМ рассмотрены в [27]. Там же изложены прин­ципы построения таких средств повышения обслуживаемости ЭВМ, как системы автоматизации профилактических испытаний, сбора и обработки данных об отказах и сбоях, дистанционного обслуживания ЭВМ, а также особенности средств поддержки эксплуатационного обслуживания микропроцессорных устройств и персональных компьютеров.

Контрольные вопросы

  1. Перечислить основные характеристики надежности ЭВМ. Какие из этих характеристик являются специфичными для ЭВМ как универ­сального преобразователя информации? В чем различие между отказом и сбоем в работе ЭВМ?

  2. Обоснуйте, исходя из выражения (12.1), необходимый состав аппаратурно-программных средств, поддерживающих техническое об­служивание ЭВМ и способствующих повышению коэффициента исполь­зования ЭВМ и снижению расходов на эксплуатацию машины.

  3. Какой кратности ошибки (кроме одиночных) обнаруживает кон­троль по четности (нечетности)?

  4. Сколько нужно дополнительных (контрольных) разрядов для реализации памяти с коррекцией одной ошибки с помощью Кода ХэммИй- га при длине информационного слова 16, 24, 32 разряда?

  5. Как в процессе взаимодействия систем контроля, восстановления вычислительного процесса и диагностирования определяется, является ошибка машины результатом отказа или сбоя? В чем различие функцио­нирования этих систем в случае сбоя и отказа?