- •Московский инженерно-физический институт
- •2. Накопители на магнитных лентах и дисках 19
- •3. Структура дисковой памяти 35
- •4. Накопители на оптических дисках 47
- •Раздел 2 «устройства ввода-вывода графической информации (Дигитайзеры, сканеры, плоттеры) 54
- •2. Накопители на магнитных лентах и дисках 21
- •3. Структура дисковой памяти 37
- •4. Накопители на оптических дисках 49
- •Раздел 2 «устройства ввода-вывода графической информации (Дигитайзеры, сканеры, плоттеры) 56
- •2. Накопители на магнитных лентах и дисках 23
- •3. Структура дисковой памяти 39
- •4. Накопители на оптических дисках 51
- •Раздел 2 «устройства ввода-вывода графической информации (Дигитайзеры, сканеры, плоттеры) 58
- •Внешняя память получила своё название ещё и потому, что она подключается к системному блок (компьютеру) аналогично тому, как подключаются и другие периферийные устройства.
- •В такой системе время поиска информации достаточно велико (десятки миллисекунд).
- •Среди компакт-дисков различают три типа:
- •Физические основы записи-считывания на магнитный носитель
- •При считывании информации остаточная намагниченность образует в обмотке считывания магнитной головки сигнал Iсч (см. Рис. 5б).
- •Методы кодирования информации в накопителях
- •2. Накопители на магнитных лентах и дисках
- •Накопители на магнитных лентах До появления магнитных дисков единственными способами организации внешней памяти были накопители на магнитной ленте (нмл) и на магнитном барабане (нмб).
- •2.2. Накопители на магнитных дисках
- •Сервосистема работает следующим образом.
- •3. Структура дисковой памяти
- •Повышение производительности дисков
- •3.2 Физическая и логическая организация дисков
- •Несколько важных замечаний !
- •4. Накопители на оптических дисках
- •Общие положения Оптические (лазерные) диски пришли в вычислительную технику из аудио-видеотехники и во многом сохранили параметры, характерные для техники воспроизведения звука и изображений.
- •4.2 Физические основы записи-считывания на оптических дисках
- •Режим однократной записи и многократного считываниядопускает два варианта записи-считывания:
- •Литература
- •Раздел 2 «устройства ввода-вывода графической информации (Дигитайзеры, сканеры, плоттеры)
- •Раздел 1. «Подсистема внешней памяти (взу)» 11
- •1. Физические основы внешней памяти 11
- •2. Накопители на магнитных лентах и дисках 23
- •3. Структура дисковой памяти 39
- •4. Накопители на оптических дисках 51
- •Раздел 2 «устройства ввода-вывода графической информации (Дигитайзеры, сканеры, плоттеры) 58
- •2. Разновидности устройств ввода-вывода графической информации
- •3. Дигитайзеры
- •4. Сканеры
- •Режим 1 –восприятие строки изображения и преобразование её в строчную картину зарядовых пакетов.
- •5. Плоттеры
- •5.1 Разновидности плоттеров
- •5.2. Кинематические схемы перьевых плоттеров
- •5.3 Формирование графического изображения и организация управления пером в плоттере
- •5.4 Вывод символов на плоттерах
- •5.5 Программное обеспечение плоттеров
- •5.6. Растровые плоттеры
- •Раздел3 «Устройства вывода информации на печать (принтеры)
- •Упомянутые выше типы ударных принтеров в настоящее время практически не используются, так как они вытеснены новыми устройствами, имеющими более высокие технические показатели.
- •2. Организация взаимодействия принтера с пэвм
- •3. Способы знакогенерации в знакосинтезирующих принтерах
- •4. Программное управление печатью
- •7. Команды, реализующие дополнительные и вспомогательные возможности.
- •Описание языка pcl (Hewlett Packard Printer Communication Language)
- •Операторы управления принтером
- •Операторы выбора шрифта
- •Операторы управления загрузкой шрифтов
- •Операторы определения новых загружаемых шрифтов
- •Графические операторы
- •Литература:
- •Раздел 4 «Основы видеосистемы компьютера
- •2. Электронно-лучевые трубки и плоские панели
- •4. Растровый принцип вывода изображений и текста
- •4. Управление градациями яркости и цветом в элт- и lcd- дисплеях
- •5. Видеоадаптеры и видеомониторы
- •6. Режимы работы растрового дисплея
- •6.1. Графический режим
- •6.2. Текстовый режим
- •7. Видео bios и видеосервис bios
- •8. Интерфейсы дисплеев
- •Литература
- •Приложение 1 Характеристики видеоадаптеров. (в хронологическом порядке их появления)
- •Приложение 2 Основные параметры современных дисплеев
- •Раздел 5 «Речевой диалог пользователя с компьютером»
- •Процесс речеобразования и звуки речи
- •1. Признаковое описание речевых сигналов
- •1.1. Спектальное описание речевого сигнала
- •1.2. Клиппирование речевого сигнала
- •1.3. Выделение формантных параметров речи
- •1.5. Автокорреляция речевого сигнала
- •2. Устройства распознавания речи
- •2.1. Разновидности устройств речевого ввода и модель устройства речевого ввода
- •Обобщённая структура устройства распознавания речи
- •2.3 Структура и функции предпроцессора
- •3. Синтезаторы речи
- •3.1 Разновидности синтезаторов речи
- •3.2 Синтезаторы с непосредственным кодированием/восстановлением человеческой речи
- •3.3 Аналоговый синтез формантных частот
- •1. Температура воздуха в Москве
1.5. Автокорреляция речевого сигнала
Автокорреляционная функция (АКФ) сигнала однозначно связана с его спектром [1]. АКФ вычисляется либо на сравнительно длинных отрезках (секунды и более), либо на временных сегментах длительностью 10 – 20 мс. В первом случае получают обобщённые оценки сигнала, во втором – описание текущего сигнала, адекватное характеру артикуляционных движений, то есть получают параметры , пригодные для распознавания звуков.
Если анализируемый сегмент представлен последовательностью от-счётов сигнала X1, X2, X3,…,Xn, тогда для вычисления кратковременной АКФ можно использовать выражение:
N-τ
B(τ)= 1/(N-τ) Σ Xt Xt+τ
T=1
При значениях τ равных 0, 1, 2, …, 9 получается набор коэффициентов АКФ:B(0),B(1),B(2), …,B(9), однозначно определяющих данный сегмент.
В реальном масштабе времени далеко не каждая ЭВМ может выполнить такую обработку сигнала [1].
2. Устройства распознавания речи
2.1. Разновидности устройств речевого ввода и модель устройства речевого ввода
Задача распознавания речи (речевого ввода) существенно сложнее задачи синтеза речи (речевого вывода) и к настоящему времени решается лишь при ряде ограничений [3]:
1. Ограничен объём словаря для вводимой информации (от 50 до 300 слов; при увеличении словаря падает достоверность, растёт время распоз-навания);
2. Устройства ввода распознают изолированно (раздельно) произно- симые слова. Задача распознавания слитной речи пока окончательно не решена;
3. Проявляется зависимость достоверности распознавания от индиви-дуальных свойств речи конкретного оператора, вследствие чего требуется настройка устройства на данного диктора и его словарь. Достоверность распознавания при соблюдении некоторых условий достигает тем не менееь 92 – 99 %.
В связи с перечисленными выше ограничениями устройства речевого ввода (УРВ) можно классифицировать следующим образом:
1.Устройства для распознавания изолированной или слитной речи;
2.Устройства с ограниченным словарём (словником);
3.Устройства адаптированные на конкретного диктора
Большинство реально работающих устройств использует сравни- тельно несложный общий алгоритм распознавания речи, суть которого кратко заключается в следующем.
Предварительно, на этапе обучения устройства формируется и записывается в память словарь эталонов – массив слов, которые устройство должно распознавать с заданной достоверностью. Затем на этапе распознавания произнесённое диктором слово (реализация) сравнивается последовательно со всеми эталонами и вырабатывается решение о сходстве (несходстве) реализации и эталона.
Сравнительная простота общего алгоритма распознавания реализуется намного сложней, так как к техническим параметрам отдельных узлов УРВ предъявляются очень жёсткие требования. По этим причинам устройства распознавания речи развиты в настоящее время слабей, чем синтезаторы речи.
На рис.3 приведена модель устройства распознавания речи, с использованием которой (и её аналогов) были разработаны реальные устройства (в том числе такие серийные отечественные устройства как ИКАР, УРВ РМ, ЛЕКСИНАР и др.).
Модель УРВ состоит из нескольких блоков, каждый из которых реализует часть общего алгоритма распознавания речевого сигнала. Работа модели разбивается на два самостоятельных этапа (режима) работы:
а) Режим обучения устройства, на котором происходит формирова-ние словаря (словника);
б) Режим распознавания – основной режим работы УРВ.
Модель основана на распознавания раздельно произносимых слов, так как в этом случае временные интервалы между словами чётко различимы и не усложняют алгоритм. В составе модели имеется мини-дисплей (МД), который информирует диктора о том какие действия диктор должен предпринимать, если в работе УРВ имеются какие-либо неполадки или отклонения от алгоритма или о том, что обучение устройства или распознавание слов происходит нормально.
Опуская некоторые детали, рассмотрим несколько упрощенный принцип работы модели УРВ
РЕЖИМ ОБУЧЕНИЯ УСТРОЙСТВА(Режим 1): Диктор (Д) последовательно произносит в микрофон отдельные слова. Речевой сигнал с микрофона усиливается усилителем и в нормированном виде поступает на дальнейшую обработку –блок 1. Далее вблоке 2 происходит преобразование аналогового речевого сигналаX(t) в цифровую форму – формируется цифровое информационное описание речевого сигналаX*(t). Алгоритм формирования цифрового описания зависит от того, какой метод положен
в основу формирования признаковых параметров. Будем считать, что речевой сигнал подвергается спектральному анализу (см. раздел 2.1). В блоке 3 происходит формирование словаря УРВ и запись словаря в память устройства. Формирование словаря происходит последовательно для всех слов, которые должны входить в словарь На этом заканчивается режим 1 – режим обучения УРВ.
РЕЖИМ РАСПОЗНАВАНИЯ (режим 2):Этот режим является основным, то есть это собственно режим распознавания слов. Начальная часть режима (блоки 1 и 2) реализуются аналогично.
Сформированный цифровой образ слова, произнесённого диктором слова – реализация Xp(i)– поступает вблок 4, в котором происходит сравнение реализации с эталонамиXэ(j). В этом же блоке происходит нормализация темпа речи методом деформации оси времени с тем, чтобы длительность звучания реализации соответствовала длительности звучания эталона. Результатом работыблока 4 массив данных – так называемыхмер сходства(или несходства)– {Mk}, каждая из которых характеризует близость произнесённого слова к эталонам.
В блоке 5 происходит анализ мер сходства и вырабатывается решение, определяющее результат распознавания.
Возможны 5 вариантов решения (подсказок диктору):
а) Входная реализация тождественна (близка) одному из эталонов заданного словаря;
б) Реализация не принадлежит данному словарю;
в) Реализация равноудалена от нескольких эталонов словаря;
г) Реализация произнесена тихо;
д) Реализация не принадлежит к классу речевых сигналов (помеха).
Разумеется, эта модель, достаточно точно отражающая суть алгоритма распознавания и принцип реализации его в УРВ, рассмотрена с учётом большого количества упрощающих предположений. Это сделано намеренно с целью избежать излишних подробностей, мешающих понять суть процесса распознавания речи.