Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Самый новый ММТвО-1-11н.doc
Скачиваний:
120
Добавлен:
01.06.2015
Размер:
3.91 Mб
Скачать

1.1.4. Типы и форматы файлов мультимедиа

Рассмотрим основные ММ компоненты: текстовые и гипертекстовые, графические и гиперграфические, звуковые, видеокомпоненты и анимации, интерактивные трехмерные представления, а также соответствующие каждому из них типы и форматы файлов.

Набор правил, по которым сохраняются данные в файле, называется форматом файла. Различные типы файлов используют различные форматы. В общем случае для одного типа файлов может быть определено несколько разных форматов. Формат файла определяется по расширению имени файла. Как правило, форматы файлов создаются для использования в строго определенной прикладной программе, хотя бывают и универсальные форматы [4].

Текстовые файлы создаются в среде текстовых процессоров или специализированных приложений, в результате компьютерного сканирования и распознавания печатных документов или распознавания речи. Наиболее популярны следующие форматы текстовых файлов [4]:

  • Американский стандартный код для информационного обмена (American Standard Code for Information Interchange, ASCII) (.txt) – формат текстовых файлов в DOS-кодировке;

  • формат текстовых файлов Американского национального института стандартов (American National Standards Institute, ANSI) (.txt) для кодовой страницы Microsoft (MS) Windows;

  • формат MS Word для Windows (.doc) – поддерживаемый всеми формат Microsoft;

  • формат документов (Rich Text Format, RTF) (.rtf) – поддерживаемый всеми формат Microsoft. Сохраняет исходное форматирование, а также стили начертания символов. Файлы могут содержать графические картинки с различными параметрами. Поддерживает 256 цветов;

  • формат передаваемого документа (Portable Document Format, PDF) (.pdf) – обеспечивает получение точной копии необходимого документа.

С фрагментами этих файлов можно работать, как с текстом. Заметим, что последний формат фактически обеспечивает представление изображения текста и иллюстраций документа. В этой связи необходимо также отметить близкие по назначению к тестовым новые форматы:

  • графический формат DJVU (дежавю) (.djvu) – применяется для создания и размещения в Internet отсканированных книг (сканированных объемных документов) без распознавания текста. Обеспечивает компактное представление графического материала. Это лучший формат для электронного представления в Internet научной и технической литературы, стандарт де-факто для электронных библиотек;

  • формат FictionBook2 (FB2) (.fb2) – для создания электронных книг. Он является открытым, основан на расширяемом языке разметки (eXtensible Markup Language, XML) [11].

Гипертекст. Важнейшим средством структурирования информации является гипертекст (ГТ) (Hypertext – нелинейный текст) – информационная структура, состоящая из дискретных узлов данных и семантических связей между ними, где узел – текст или ГТ, а связи могут быть локальными, глобальными и смешанными. То есть ГТ – это некоторая метаструктура текста, которая может быть и многоуровневой, со сложными семантическими сетевыми отношениями между различными фрагментами текста [12]. По сути, значение ГТ может быть приравнено к значению книгопечатания. История ГТ начинается с середины 40-х годов:

  • 1945 г. – Ванневар Буш (советник президента США Ф.Д. Рузвельта) предложил саму идею ГТ;

  • 1965 г. – Теодор Хольм Нельсон предложил термин «гипертекст», развил и реализовал идеи работы с нелинейными текстами;

  • 1968 г. – Дуглас Энгельбард (изобретатель «мыши») продемонстрировал работу ГТ-интерфейса в системе телекоммуникаций;

  • 1975 г. – разработана система ZOG – информационная ГТ-система внутреннего распорядка авианосца «Карл Винстон»;

  • 1989 г. – Тим Бернерс-Ли предложил блестящую идею применить ГТ-модель к информационным ресурсам, распределенным в сети, причем самым простым способом.

Он же разработал язык гипертекстовой разметки (HyperText Markup Language, HTML), универсальный способ адресации сетевых ресурсов (Universal Resourse Locator, URL), протокол передачи ГТ (HyperText Transport Protocol, HTTP). общий интерфейс шлюзов (Common Gateway Interface, CGI) разработали позднее в национальном центре суперкомпьютерных приложений (NCSA) США. Т. Бернерс-Ли разработал и первую в истории программу просмотра черно-белых HTML-документов на станции пользователя – браузер (browser).

ГТ-файлы создаются в среде текстовых процессоров или специализированных программ поддержки различных языков разметки. Популярны следующие форматы поддержки ГТ:

  • формат HTML (.htm, .html). HTML-документы представляют собой ASCII-файлы, но в отличие от обычных текстовых файлов содержат специальные команды (тэги), определяющие правила форматирования;

  • формат стандартного языка обобщенной разметки (Standard Generalized Markup Language, SGML) (.sgm, .sgml). По сравнению с HTML обеспечивает более гибкие и разносторонние возможности форматирования. SGML – метаязык, реализующий межплатформенный структурный подход к описанию содержания документа. Структура SGML-документа делится на три части (декларация синтаксиса SGML; таблица описания типа документа, описывающая правила его структуризации; смысловая часть с конкретным размеченным текстом). Формат SGML используется для хранения файлов ММ;

  • формат XML (.xml) – упрощенная версия SGML, явившаяся ответом на ограничения HTML как компромисс между простотой HTML и гибкостью SGML (.xml). XML – метаязык, но он легче в применении и позволяет создавать более простые описания типа документов, чем SGML;

  • формат «компилированный HTML» (Compiled HTML, CHM) (.chm), специально разработанный Microsoft для поддержки ГТ справочных систем [4, 11, 12].

Следует подчеркнуть, что, кроме собственно ГТ-файлов, в состав сложного ГТ-документа могут входить файлы в форматах других ММ компонентов.

Графические файлы. Изображения обычно поступают в компьютер тремя следующими способами [4]:

  • вводятся с помощью черно-белого или цветного сканера;

  • выбираются из файлов, содержащих набор графических вставок – изображений, которые создаются профессиональными художниками или дизайнерами и оформляются в виде файлов;

  • создаются пользователями с помощью специализированных ПС поддержки графики.

Классификация графических компонентов пока­зана на рис.1.1. По способу формирования изображения они подразделяются на матричные (растровые), векторные и функциональные [13].

Матричное (растровое) изображение представляет собой двумерный массив (мат­рицу, растр) точек – пикселов. Пиксел является минимальным адресуемым элементом матричного изображения. Его атрибуты (цвет, яркость и др.) не зависят от атрибутов дру­гих пикселов.

Достоинства растровой графики заключаются в ее универсальности, простоте формирования и высокой точности передачи оттенков цвета (рис.1.2,а). Ее недостатки обусловлены значительными объемами матричных компонентов, а также искажениями (снижением качества), возникающими при изменении их масштаба.

Векторное изображение образуется совокупностью векторных графических примитивов (линий, фигур и т.п.), соответствующих его типовым элементам и обладающих всеми необходимыми атрибутами, такими как координаты характерных точек, длина, цвет и толщина линии, цвет заливки и т.п. (рис.1.2,б). Важнейшей характеристикой системы векторной графики является состав используемых примитивов [13].

по способу

формирования

изображения

матричные

векторные

функциональные

по характеру

изображения

условные

рисунки и схемы с четкими контурами и ограниченным числом цветов

иллюстрации ГИП

рисунки схемы с регулярными цветовыми переходами

полутоновые схемы со сглаженными контурами

реалистичные

синтезированные

по цветовому разрешению

монохромные

с индексированными цветами

представленные в оттенках серого

полноцветные

по способу использования

статические изображения

спрайты

анимированные изображения

анимированные спрайты

Рис.1.1. Классификация графических компонентов

а) растровое изображение

б) векторное изображение

Рис.1.2. Примеры графических изображений

Например, синий круг на желтом фоне будет описан всего двумя математическими формулами – прямоугольника и круга соответствующих цветов, размеров и местоположения. Очевидно, такое описание займет значительно меньше места по сравнению с растровым.

При отображении векторного представления значения линейных геометрических атрибутов примитивов рассчитываются с учетом соотношения его требуемых и исходных размеров, а также разрешающей способности устройства вывода (дисплея, принтера). Такой механизм существенно расширяет возможности масштабирования. При любом увеличении масштаба качество векторного изображения не меняется. Искажения возникают только при значительном уменьшении масштаба за счет погрешностей округления и наложения линий примитивов друг на друга.

Векторная графика может быть не только плоской, но и пространственной (трехмерной, 3D). Кроме того, наряду с изменением масштаба она позволяет эффективно осуществлять более сложные трансформации изображения: поворот, наклон, растяжение и сжатие в соответствии с заданными функциями по осям координат, представление вида, наблюдаемого из указанной точки, и т.д. [13].

Объем векторного компонента зависит от числа используемых в нем примитивов. Для относительно простых изображений векторная форма является более компактной, чем матричная.

Главный недостаток векторной графики состоит в том, что она подходит не для всех изображений. В частности, с помощью нее нельзя представить изображения с размытыми контурами и полутонами. Выигрыш от применения векторной формы также теряется при представлении изображений, содержащих большое число мелких деталей (например, нерегулярно расположенных точечных элементов).

Сами по себе графические компоненты не трансформируются. Данные функции выполняются системой их отображения. Преимущество векторной формы заключается в том, что она обеспечивает более глубокие возможности для трансформации, а подобные преобразования проще реализуются и обычно не ухудшают качество изображения.

Существуют и так называемые формоопределенные форматы (метафайлы) могут содержать как растровые, так и векторные данные.

Функциональные изображения строятся программно с помощью графических средств приложения или устройства отображения. Функциональную графику нельзя отделить от системы, обеспечивающей ее формирование: вне рамок этой системы она не существует. Поскольку функциональные изображения не хранятся в файлах, а строятся в процессе работы приложения, они не занимают дисковой памяти. Другим достоинством данных графических компонентов является то, что их представление может быть не фиксированным, а ситуативным, т.е. меняющимся в зависимости от обстоятельств [13].

Растровая графика хранится во множестве различных форматов. Некоторые из них сохраняют изображение как необработанные данные, другие используют методы сжатия для уменьшения объема информации. Для мультимедиа, презентаций, видео и обработки изображений используются следующие форматы растровых графических файлов [4]:

  • Windiws BitMap (BMP) (.bmp) – формат файлов растровых рисунков Microsoft для обмена данными между приложениями Windows, 256 цветов, 16 и 24 бита, размер рисунка неограничен, поддерживает сжатие без потерь RLE;

  • Adobe Photoshop (.psd) – формат файлов растровых рисунков для программы Adobe Photoshop, размер рисунка до 30000×30000 пикселов, поддерживает сжатие без потерь RLE;

  • Graphics Interchange Format (GIF) (.gif) – формат файлов растровых рисунков для обмена графическими данными, 256 цветов, размер до 64000×64000 пикселов, поддерживает сжатие без потерь LZW (до 40%) и приемлемое быстродействие при просмотре сжатых файлов. Позволяет сохранять несколько рисунков в одном файле и поддерживает использование прозрачности (transparency). Поддерживает встроенные анимации;

  • Joint Photographic Experts Group (JPEG) (.jpg, .jpeg) – формат файлов растровых рисунков, 24 бита, размер до 64000×64000 пикселов, поддерживает сжатие (в 20-30 раз) с потерями JPEG (можно выбирать степень сжатия в зависимости от требований к качеству), имеет низкую скорость просмотра;

  • Fractal Image Format (FIF) (.fif) – формат файлов растровых рисунков, 24 бита, не зависит от разрешающей способности, поддерживает фрактальное сжатие изображения с потерей качества, основанное на представлении внешне случайных форм с помощью организованных структур из меняющихся узоров (фракталов). Разбив сложную структуру на набор фракталов, можно существенно уменьшить объем информации об изображении. Формат очень медленный при сжатии (когда даже может корректироваться качество), но приемлемый при просмотре сжатых изображений, разрешающая способность может быть любой и даже выше, чем в оригинале (масштабирование без искажений);

  • Wavelet Image Files (WIF) (.wif) – формат файлов растровых рисунков, основанный на оригинальной технологии волнового преобразования (wavelet), сокращающей размер графического образа в 30-50 раз и в отличие от JPEG не искажающей сжимаемого изображения;

  • Portable Network Graphics (PNG) (.png) – формат файлов растровых рисунков, разработанный для обмена графическими данными; 256 цветов, 24 бита, поддерживает сжатие LZW. Позволяет создавать изображения с прозрачным фоном;

  • TARGA (.tga) – формат файлов растровых рисунков для профессиональных графических и видео приложений, 256 цветов, 16, 24 и 32 бита (с альфа-каналом), размер неограничен, поддерживает сжатие без потерь RLE. Используется также для покадрового редактирования видеоизображений.

Итак, при использовании растровой графики с 256 цветами лучшим выбором будет формат GIF или PNG. В этом случае не следует использовать JPEG и другие 24-битные форматы. Для 16- или 24-цветных ММ проектов предпочтителен PNG, хотя формат JPEG позволяет достичь большей степени сжатия, но потеря качества делает невозможным его применение для растровых изображений с прозрачными областями [4].

Форматы векторной графики в большей степени связаны с конкретными популярными приложениями. Наибольший интерес представляют:

  • Windows Meta File (WMF) (.wmf) – формат ОС Windows, служит для передачи векторов через буфер обмена (clipboard). Однако, несмотря на кажущуюся простоту и универсальность, пользоваться форматом WMF стоит только в крайних случаях для передачи «чистых» векторов. WMF искажает цвет, не может сохранять ряд параметров, присвоенных объектам в различных векторных редакторах;

  • Encapsulated PostScript (EPS) (.eps) – упрощенный PostScript – используется для передачи векторов и растра в издательские системы, создается почти всеми программами, работающими с графикой. Файл EPS содержит точное описание рисунка на языке PostScript, а также изображение низкого разрешения для предварительного просмотра;

  • Adobe Illustrator Document (AI) – формат документа программы Adobe Illustrator. Может содержать в одном файле только одну страницу, имеет относительно малое рабочее поле (по меркам наружной рекламы, где этот параметр важен) – всего 3×3 метра, отличается наибольшей стабильностью и совместимостью с PostScript. AI поддерживают почти все программы, так или иначе связанные с векторной графикой. Он является наилучшим посредником при передаче векторов из одной программы в другую;

  • FreeHand Document (FH*) (.fh*) – формат документа программы FreeHand (* - номер версии программы). Поддерживает многостраничность. Некоторые эффекты FreeHand несовместимы с PostScript;

  • CorelDRAW Document (CDR) (.cdr) – формат документа программы CorelDRAW. Многие программы (FreeHand, Adobe Illustrator, PageMaker и др.) могут импортировать файлы CDR. В файлах этих версий применяется компрессия для векторов и растра отдельно, могут внедряться шрифты, файлы CDR имеют огромное рабочее поле 45×45 метров, поддерживается многостраничность;

  • DWF (.dwf)– формат компании Autodesk, используется в общецелевой САПР AutoCAD;

  • SWF (.swf) – формат компании Macromedia, используется в системе Macromedia Flash;

  • SPX – был разработан специально для векторной графики, хорошо подходит для Internet;

  • Vector Markup Language (VML) (.vml) – новый формат языка векторной разметки VML, который основан на языке XML. Благодаря VML, дизайнеры Web-узлов смогут создавать собственные теги, редактировать, вырезать и вставлять векторные изображения в прикладные программы, изменять масштаб векторных изображений на Web-страницах и загружать графику значительно быстрее, чем изображения в растровом формате;

  • Computer Graphics Metafile (CGM) (.cgm) – формат векторной графики, который решено использовать в качестве стандартного типа графических данных (Multipurpose Internet Mail Extension Image Type) для Internet. Формат CGM, широко используемый для хранения и передачи двумерных изображений в автоматизированных системах различного назначения (САПР, системах автоматизированного инжиниринга и других), стал третьим (после GIF и JPEG) стандартным средством кодирования графической информации в Internet. Он впервые предоставил официально санкционированную возможность обмениваться по сети графическими файлами в векторной кодировке.

Звуковые файлы. Как подчеркивают специалисты, звук является наиболее выразительным элементом ММ. Классификация звуковых компонентов приведена на рис.1.3 [13].

Наиболее часто используются следующие звуковые форматы [4, 14]:

  • wave (WAV) (.wav) – наиболее широко распространенный звуковой формат, 16 бит и выше, стерео. В его основе лежит файловый формат обмена ресурсами (Resourse Interchange File Format, RIFF), позволяющий сохранять произвольные данные в структурированном виде. WAV – универсальный контейнерный тип файлов, позволяющий хранить оцифрованные аудиоданные с различными параметрами оцифровки [15];

  • WavePack (.wv) – также включает уникальный гибридный режим, который предоставляет все преимущества сжатия без потерь с дополнительным бонусом: вместо создания одного файла в этом режиме создается относительно небольшой файл высокого качества с потерей (.wv), который может проигрываться сам по себе, а также файл коррекции (.wvс), который в комбинации с предыдущим позволяет полностью восстановить оригинал. Для некоторых пользователей это означает, что им никогда не придется выбирать между сжатием без потерь и с потерей качества. Поддерживается многоканальный звук, 32-битное разрешение аудиопотока, частота сэмплирования до 192 кГц;

по содержанию

речь

музыкальные произведения

звуки живой и неживой природы

технологические и другие сигналы, представляющие некоторые объекты и процессы

специальные аудиоэффекты

по способу

представления

звука

цифровое представление звуковых волн

информация для синтеза звуков и музыки

текст и настройки для синтеза речи

Рис.1.3. Классификация звуковых компонентов

  • цифровой интерфейс музыкальных инструментов (Musical Instrument Digital Interface, MIDI) (.mid, .midi) – определяет обмен данными музыкальными и звуковыми синтезаторами разных производителей. Представляет собой протокол передачи музыкальных нот и мелодий. MIDI-файл представляет собой последовательность 8-битных команд, которыми записаны действия, например, сыграть на таком-то инструменте такую-то ноту в течение стольких-то секунд. Это просто ссылки на ноты, способ записи команд, посылаемых музыкальным инструментам (компьютерные ноты, показывающие, как проигрывать музыку). Когда MIDI-совместимая звуковая карта получает такую ссылку, она ищет необходимый звук в таблице (Wave Table). Файлы MIDI значительно компактнее оцифрованной записи. Существует 3 разновидности стандарта MIDI:

  • General MIDI (GM), регламентирующий набор тембров (инструментов) фирмы Roland в музыкальных синтезаторах. Синтезатор должен иметь 128 мелодических тембров с возможностью воспроизведения звуков разной высоты в каналах 1-9 и 11-16, а также 46 ударных инструментов в канале 10. Мелодический набор состоит из 16 групп инструментов (фортепиано, органы, гитары, струнные, духовые, ударные и т.п.) по 8 в каждой группе. За всеми инструментами закреплены номера;

  • General Synth (GS) – общий стандарт фирмы Roland. Кроме инструментов General MIDI он включает дополнительные наборы мелодических и ударных инструментов, а также различные эффекты (скрип двери, звук мотора, крики и т.п.);

  • Extended General (XG) – новый стандарт фирмы Yamaha, включающий несколько сотен мелодических и ударных инструментов, применяемых в профессиональной музыке, а также более развитые средства управления синтезом. В частности, он обязывает синтезатор иметь по одному резонансному фильтру на канал и 3 независимых вида эффект-обработки, обеспечивает управление в РВ атакой/затуханием звуков, параметрами фильтров, раздельную настройку ударных звуков, подключение множества звуковых эффектов. Его использование позволяет создавать переносимые MIDI-файлы со звучанием, приближенным к профессиональному. Использует 3 типа эффект-обработки: reverb, chorus, variation (последний включает по несколько видов первых двух, также echo, delay, flanger, phaser, rotary speaker, wah-wah, distortion, jverdrive, equalizer и пр.);

  • CD (Digital) Audio (CD-DA) (.cda) – формат, в котором аудио треки формата WAV записываются на Audio CD;

  • Motion Picture Expert Group (MPEG) Audio Layer 3 (MP3) (.mp3) – самый распространенный формат сжатия музыки, 128-320 Кбит/с;

  • MP3Pro – в его основе лежит MP3, используется технология Spectral Band Replication (SBR), за счет чего кодек обеспечивает неплохое качество на низких битрейтах. Но качество кодирования на средних и высоких скоростях передачи данных уступает качеству почти всех других кодеков. Поэтому он применяется для трансляций в Сети и демонстрации фрагментов новых музыкальных композиций;

  • OGG Vorbis (OggVorbis) (.ogg) – свободный формат сжатия звука с потерями, появившийся в 2002 г. Его психоакустическая модель по принципам действия близка к модели MP3 и подобным, но ее математическая обработка и практическая реализация существенно отличаются, обеспечивая лучшую четкость воспроизведения при равной плотности потока. Поддерживает до 255 отдельных каналов с частотой дискретизации до 192 кГц до 32 битов (чего не обеспечивает ни один формат сжатия с потерями); прекрасно подходит для кодирования 6-канального звука DVD-Audio. Формат изначально разрабатывался с возможностью потокового вещания, что дает полезный эффект: в одном файле можно хранить несколько композиций с собственными тегами. При загрузке такого файла в плеер должны отобразиться все композиции, будто их загрузили из нескольких различных файлов. OggVorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жесткими значениями, и он может варьироваться даже на 1 Кб/c. При максимальных настройках кодирования варьируется в диапазоне 400-700 Кб/c. Частота дискретизации может выбираться в пределах 2-192 кГц;

  • продвинутое аудио кодирование (Advanced Audio Coding, AAC) (.aac) - формат аудиофайла с меньшей потерей качества при кодировании. Создавался как преемник MP3 с улучшенным качеством кодирования. Вышел в свет в 1997 г. как MPEG-2, часть 7. Существует и формат AAC, известный как MPEG-4, часть 3;

  • WMA (.wma) – формат, разработанный Microsoft для хранения и трансляции аудио, который входит в семейство форматов Windows Media, поддерживает битрейты до 192 Кбит/с. По степени компрессии WMA в два раза превышает МРЗ при том же качестве звучания, особенно на низких битрейтах; по параметрам конкурирует с OggVorbis и AAC;

  • WMA Lossless – поддерживает теги, высокие частоты сэмплирования, многоканальный до 7.1 звук, трансляцию аудио через Сеть [14-16];

  • VQF (.vqf) – новый формат фирмы Yamaha, использует сжатие с битрейтами 8-96 Кбит/с. Разработчиками деклариру­ется, что по качеству звука VQF-файл с битрейтом 80 Кбит/с эквивалентен MP3-файлу с битрейтом 128 Кбит/с;

  • свободный аудиокодек без потерь (Free Lossless Audio Codec, FLAC) (.fla) – предназначен для сжатия аудио. В отличие от кодеков с потерями OggVorbis, MP3 и AAC не удаляет никакой информации из аудиопотока и подходит как для ежедневного прослушивания, так и для хранения коллекции музыки в высоком качестве. Поддерживает любые частоты семплирования в диапазоне 1-65535 Гц, разрядность аудио 4-32 бита, а также возможность кодирования многоканального звука;

  • формат Monkey's Audio или APE (от английского ape – обезьяна, примат) (.ape) – популярный формат кодирования цифрового звука без потерь. Средний битрейт в аудиофайле составляет 600-700 Кбит/с, среднее сжатии – 40-50 % в зависимости от жанра музыки (лучше сжимаются классика и джаз). Существует 4 степени сжатия. Обеспечивает поддержку тегов для поиска композиций в музыкальной коллекции, а также проверку целостности файла при раскодировании. Поддерживается восстановление оригинального WAV-файла из сжатого APE-файла [14-16].

Гиперграфика реализуется путем наложения на изображение прозрачной маски, на которой определяется система зон, ассоциируемых с его фрагментами. В инструментальных средствах такие зоны называются контактными областями (hot spots – «горячие пятна»). В функциональном плане контактные области играют ту же роль, что и гиперссылки, т.е. обеспечивают интерактивность приложения. Наступление связанных с ними событий (подвод мыши к контактным областям, ее щелчки на них, отвод мыши за их границы и т.д.) может инициировать выполнение определенных действий.

Изображение, которое может многократно выводиться на экран и удаляться с него при наступлении определенных событий без смены текущего кадра или страницы, называется спрайтом. Например, представления отпущенной и нажатой кнопки, ассоциируемые с соответствующими состояниями данного элемента пользовательского интерфейса. К анимированным относятся графические компоненты (в том числе спрайты), которые могут двигаться в границах окна кадра или страницы [13].

Видеокомпоненты и анимации. Классификация видеокомпонентов и анимаций приведена на рис.1.4 [13].

по характеру

изображени

видеокомпоненты (содержат реалистичные изображения)

анимации (содержат условные и синтезированные изображения)

по динамич-

ности

изображений

показ слайдов (1-3 кадров/c)

демонстрация фаз процесса (4-6 кадров/c)

демонстрация процесса, не обладающего высокой динамикой (7-15 кадров/c)

видеоклип (более 15 кадров/с)

по способу реализации

представленные в одном из форматов для хранения видео или анимации

реализованные в виде анимации с помощью графического формата GIF

формируемые функционально

Рис. 1.4. Классификация видеокомпонентов и анимаций

Традиционный видеокомпонент содержит две синхронно воспроизводимые составляющие, называемые дорожками (tracks): визуальную (видеодорожку) и звуковую. Видеодорожка образована последовательностью кадров, представляю­щих собой неподвижные графические изображения. Различия между видеокомпонентами и анимациями определяются характером этих изображений. Изображения в видеокадрах являются реалистичными. Их источниками служат кадры фото- или видеосъемки реальных объектов. Изображения в анимациях имеют условный, искусственный характер. Они формируются с помощью программ создания анимации (аниматоров), графических редакторов и систем геометрического моделирования. Существуют форматы, допускающие наличие нескольких видео- и аудиодорожек.

Существует тенденция стирания границ между видео и анимацией. Она проявляется в нескольких аспектах. Во-первых, синтезированные изображения становятся все более реалистичными. Это достигается за счет моделирования оптических эффектов, учитывающих свойства визуализируемых объектов, а также включения в условные представления фотоизображений (чаще всего – текстур поверхностей). Во-вторых, при обработке видеокомпонентов используются разнообразные ви­зуальные эффекты. В-третьих, в рамках одной видеодорожки реалистичные представления могут сочетаться с искусственными, например, на кадры видеосъемки накладываются титры, на ее фоне могут действовать анимированные персонажи [13].

Файлы трехмерной графики и анимации. Если достаточно быстро и незначительно изменить расположение или форму объекта, то глаз будет воспринимать это как движение. Это явление и легло в основу анимации и кино. Компьютер не только упростил создание традиционной (2D) анимации, но привнес новые элементы: объем и глубину на основе использования трехмерной (3D) графики и анимации.

3D-изображения сохраняются в формате Open-SPX и могут легко использоваться в Web-приложениях.

Наибольшее распространение получили следующие форматы файлов компьютерной анимации [4]:

  • формат записи (чередующейся) аудио-видео информации (Audio-Video Interleaved, AVI) (.avi). Использует от 8 до 24 битов для кодирования цвета, скорость сжатия может варьироваться. Применяется для записи компьютерной анимации;

  • FLI (.fli) – формат записи компьютерной анимации для программы Autodesk Animator. Позволяет записывать информацию с разрешением 320×200 и 8-битным цветом. Сжатия не имеет, основан на внешней шифрации/дешифрации, подобной RLE;

  • FLC (.flc) – дальнейшее развитие формата FLI для программы Autodesk Animator Pro. Позволяет записывать информацию с разрешением 1280×1024 и 8-битным цветом. Сжатия не имеет, основан на внешней шифрации/дешифрации, подобной RLE;

  • MPEG (.mpg) – формат записи видеоинформации с цветовым разрешением от 8 до 24 битов, может использоваться для записи анимационных файлов;

  • GIF (.gif). Его спецификация GIF89a предусматривает возможность записи анимации. Записывая GIF-файл в виде серии кодов и последовательно отображая их с запрограммированными интервалами (сотые доли секунды), можно создавать простые анимационные изображения;

  • ShockWave (.dcr) – формат программного модуля Macromedia Shockwave для использования с программами Macromedia Director и Authorware.

Видеофайлы. Если анимация основана на «оживлении» рисованных картинок и персонажей, то видео и кино – это ожившее фотографическое изображение. Популярны следующие форматы видеофайлов [4]:

  • AVI (.avi) – является базовым форматом для представления видеокомпонентов в ОС семейства Windows. Информация в AVI-файле может быть несжатой или упакованной;

  • WMV (.wmv) – входит в семейство форматов Windows Media. В нем используются алгоритмы компрессии, разработанные в рамках данной технологии. WMV-файл содержит упакованную видеодорожку и звуковую дорожку в формате WMA;

  • Quick Time Movie (MOV) (.qt, .mov) – комплексный ММ формат, обеспечивающий инте­рактивные возможности. Может включать множество дорожек, содержащих ММ данные практически всех рассматриваемых здесь типов. Назначение формата MOV выходит далеко за рамки представления видео и анимаций;

  • MPEG (.mpg, .mpeg, .dat) – ориентирован на представление видеофильмов, видеоклипов и записей телепередач;

  • формат цифрового видео (Digital Video, DV) (.dv) – разработан для цифровых видеокамер и видеомагнитофонов, не является компактным форматом;

  • формат для сжатия цифрового видео Compression Engine Movie (.cem) – основан на технологии волнового преобразования (как и WIF).

Рассмотренные форматы файлов для представления видео и анимаций в большей или меньшей степени можно отнести к чис­лу универсальных. Наряду с ними существуют и другие форматы, используемые в различных инструментальных средствах для об­работки видео и создания анимаций [13, 17].

Интерактивные трехмерные представления. Недостатком традиционных графических компонентов, ви­део и анимаций является их низкая интерактивность, которая в основном сводится к управлению их отображением и воспроиз­ведением. К подобным возможностям относятся изменение масштаба изображения и его протяжка (сдвиг относительно границ окна), прерывание и возобновление воспроизведения, изменение его скорости и направления, переход к началу, кон­цу и произвольному кадру видео или анимации, демонстрация их в покадровом режиме и т.д. [13].

Один из путей повышения интерактивности данных информационных компонентов связан с их функциональной реализа­цией. При этом единые файлы видео и анимаций заменяются совокупностями их фрагментов, отдельных изображений (кад­ров), гиперграфики и спрайтов, выводимых на экран средства­ми воспроизведения в соответствии с определенным сценарием с учетом текущей ситуации и воздействий пользователя. Положительной чертой такого подхода является его универсальность. Его главные отрицательные стороны заключаются в трудоемкости разработки, как правило, связанной с программированием, и неотделимостью подобных ком­понентов от среды их воспроизведения.

Альтернативу функциональному способу составляют техно­логии, позволяющие создавать интерактивные визуальные представления в форматах, рассчитанных на применение в различных программных средствах. Данные информационные компоненты собирательно были названы интерактивными трехмерными представлениями. Они могут использоваться как в рамках приложе­ния, взаимодействуя с его функциями, так и воспроиз­водиться автономно с помощью подходящей программы-плеера [13].

Классификация интерактивных трехмерных представлений показана на рис. 1.5 [13].

Интерактивные трехмерные представления

по исполь-

зованию гео-

метрических

моделей

компоненты, образованные фиксированными

множествами взаимосвязанных видов

(геометрические модели не используются)

взависимости отпанорамы виртуальной характера связей реальности

между видамиобъекты виртуальной

реальности

компоненты,основанные на геометрических моделях, позволяющих динамически синтезировать изображения

по технологии использующие геометричес-

построения кие модели, сформированные

моделей с помощью трехмерных

графических редакторов

(средств геометрического

моделирования)

использующие геометричес-

кие модели, автоматически

сформированные по изобра-

жениям реальных объектов

Рис. 1.5. Классификация интерактивных трехмерных представлений

Для хранения интерактивных трехмерных представлений используются форматы [4]:

  • MOV (.qt, .mov), в котором для них предусмотрены специальные типы дорожек;

  • формат компании Interactive Picture (IPIX) – для создания виртуальных панорам на основе панорамных фотографий с возможностью перемещения по трем осям координат в произвольном направлении;

  • формат Image Object (IMOB) – для создания виртуальных панорам, но возможности уже, чем IPIX;

  • формат Cult 3D – для создания, рассмотрения (с разных сторон) и анимации трехмерных моделей (приближения и удаления);

  • формат языка моделирования виртуальной реальности (Virtual Reality Modeling Language, VRML) (.vrml);

  • формат SPX – для создания трехмерных представлений, которые обладают фотореалистическим качеством и имеют меньший объем, чем MOV [13, 17].