Тема 3. Электронные словари
Электронный (автоматический) словарь - это словарь в специальном машинном формате, функционирующий как часть программного обеспечения компьютера. Сегодня широко распространяются электронные версии самых различных словарей. В отличие от традиционных словарей электронный словарь наряду с текстом и графическими изображениями может содержать весь спектр ме- диаобъектов, включая видео- и анимационные фрагменты, звук, музыку и прочее.
Все электронные словари можно разделить на два типа:
автоматические словари конечного пользователя (о них и пойдет речь в данном разделе);
автоматические словари для программ обработки текста (это информационно-поисковые тезаурусы, частотные словари, рубрикаторы, классификаторы, словари морфологического анализа; словари для машинного перевода), которые включают подробную информацию о морфологических, синтаксических и семантических особенностях функционирования слова. Количество зон словарных статей в таких словарях варьируется от 1 до 100. Каждая зона содержит особый тип словарной информации: лемма, грамматическая информация или стилистические пометы, зоны значения и толкования. В электронных словарях количество зон больше, чем в обычных бумажных.
Важной особенностью электронного словаря является его гипертекстовое устройство. Ссылки, внедренные в слова, фразы или рисунки, позволяют пользователю выбрать текст или рисунок и немедленно вывести на экран связанные с ним сведения и мультимедийные материалы. Взаимоотношения между компонентами словарной статьи не являются линейными. Словарная статья имеет четкую логическую структуру с иерархическими связями между элементами. Каждая информационная категория занимает здесь строго фиксированное место - так называемую «зону». Пользователь, проявляя интерес к той или иной информации, запрашивает определенный параметр и получает доступ к отдельным фрагментам статьи. В соответствии с запросом активизируется лишь отдельно взятая зона, поэтому нет необходимости просматривать всю статью. Следовательно, создатели элекгронного словаря могут предусмотреть довольно большое количество словарных входов, позволяющее пользователю легко и быстро получать любую необходимую ему информацию, а проблемы алфавитного расположения словарных статей для массового пользователя не имеют принципиального значения.
Электронные словари имеют серьезные преимущества по сравнению со своими бумажными аналогами, что проявляется в быстром росте соответствующего рынка. Электронный словарь принципиально может обойти ключевое противоречие книжной лексикографии: чем больше информации предлагает словарь, чем больше развит его научный аппарат, тем сложнее им пользоваться. Поэтому классические словари разделяются на две категории. Первая - популярные, относительно удобные, но довольно простые. Вторая - обстоятельные академические издания, не всегда позволяющие быстро получить искомую информацию. Современные электронные словари не только значительно превосходят по объему книжные, но и находят искомое слово или словосочетание за несколько секунд.
При этом речь не идет об автоматическом выборе переводного эквивалента (если мы говорим о переводном словаре). Словарный ответ может давать весьма разнообразную информацию о слове или словосочетании, а не просто переводное соответствие, предполагает активный выбор пользователя из нескольких возможных хорошо обоснованных альтернатив. Электронный словарь может быть дву- и более направленным, то есть позволять переводить слова в обоих направлениях и даже с одного языка на другой при посредстве третьего.
Большую роль играет также фактор доступности. Далеко не в каждом крупном российском городе можно найти бумажные издания больших иностранных словарей. При этом существует значительное число бесплатных Интернет-проектов (как отечественных, так и зарубежных), представляющих разнообразные лексикографические материалы. Второй и не менее важный аспект доступности - ценовой: большинство отечественных словарей, распространяемых на CD/DVD-ROM, стоят значительно дешевле своих бумажных аналогов. Привлекательными факторами для пользователя являются также интерактивность современных электронных словарей, их актуальность, обновляемость, удобный для пользователя интерфейс.
Фактически многие словари, которые сформировались в языковой атмосфере середины прошлого века, сильно устарели. Появляются новые отрасли производства, науки, бизнеса, культуры. В обычную разговорную речь приходят новые слова, термины, устойчивые словосочетания. В них не указаны современные значения старых слов, а многие новые слова просто отсутствуют, так как бумажные словари слишком долго готовятся. Электронные словари могут оперативно обновляться.
Но, конечно, самое главное преимущество хороших электронных словарей - одновременный поиск не только по названию словарной статьи, но и по всему огромному объему толкований словника, что не представляется возможным в бумажном варианте. Такой поиск создает многомерный портрет слова, при этом из глубин словарной статьи извлекаются конкретные примеры его использования и устойчивые выражения, в которых слово встречается. Очень важно, что электронные словари используют последние достижения лексикографии. Каждое значение в электронном словаре сопровождается синонимами, антонимами, примерами употребления, лингвистической информацией. Удобно то, что не выходя из основной статьи, можно открыть окна синонимов, антонимов и т. д. и изучать их одновременно.
Однако разработка электронных словарных баз, так же как и создание бумажных словарей, является трудоемким делом, а лицензирование готовых словарей обходится очень дорого.
На сегодняшний день в России получили широкое распространение электронные словари разных издательств: Lingvo (ABBYY Software House), Мультилекс (МедиаЛингва),Polyglossum (ЭТС - "Электронные и традиционные словари"), Контекст (Ин- форматик),PROMT (ПРОМТ) и многие другие. Эти словари в большой степени универсальны, но вместе с тем каждый из них тяготеет к определённой нише.
Два самых известных электронных словаря - Lingvo компанииAbbyy и МультиЛекс, разработанный фирмой МедиаЛингва. Специалисты, создающие эти словари, исповедуют разные взгляды на принципы электронной лексикографии. Компания МедиаЛингва придерживается при разработке словарей МультиЛекс стратегии, которая заключается в создании цифровых копий известных книжных изданий. В основе электронных словарей от этой компании лежат авторитетные современные словари ведущих издательств России. Словари МультиЛекс - это усовершенствованные копии своих печатных оригиналов. В них последовательно воспроизводится содержание печатных словарей, включая предисловия авторов оригинальных изданий и сопутствующие справочные материалы. В качестве объёма словника указывается объём словника оригинала. В распоряжении пользователей имеются мощные и разнообразные средства поиска (распознавание слов и выражений во всех грамматических формах, поиск идиом, выражений, примеров употребления, алфавитный поиск с подсказкой). При работе со словарями МультиЛекс предоставляется точная и полная словарная информация (транскрипция, отраслевые и стилистические пометы, ударения, толкования, примеры).
Подход МедиаЛингва имеет и недостатки, так как жесткая привязка к бумажному прототипу не дает возможности исправлять и дополнять электронный словарь, а тем более изменять структуру построения словарной статьи. Традиционные словари довольно серьезно отстают от языковой реальности - обычно это не менее десяти лет. А электронные словари можно пополнять чуть ли не ежедневно.
По другому пути пошла компания Abbyy. ОсновуLingvo составляет электронный словарь собственной разработки. Каждая новая версияLingvo дополняется актуальной лексикой, и в ней исправляются найденные ошибки и неточности. Таким образом, благодаря лексикографическим исследованиям англо-русский словарь фирмыAbbyy близок к языковой практике. Словари"Lingvo" не являются точными копиями бумажных аналогов. Так, в качестве источников для подготовки экономического словаря"LingvoEconomics" указаны семь словарей различных авторов. Продукты линейкиAbbyy Lingvo давно пользуются заслуженной популярностью у пользователей благодаря полноте и современности лексической базы, удобству в работе, быстроте поиска.
Электронные словари не только содержат транскрипцию, но и могут произносить слова. Здесь тоже существует два подхода. В МультиЛекс встроен синтезатор звука и произносятся все слова. Однако полностью доверять такому подходу, не контролируя его по транскрипции, опасно. Синтезатор может неправильно поставить ударение или вообще исказить произношение слова. В Abbyy Lingvo основную лексику озвучивает диктор с оксфордским произношением, считающимся для английского языка классическим.
Базы данных "Polyglossum" формируются из единого источника с выпускаемыми издательством бумажными словарями и снабжены развитой системой индексации данных, позволяющей вести полнотекстовый поиск в любом направлении. Объём словарей указывается в "терминах", что учитывает особенности и новые возможности электронных версий словарей. Количество "терминов" равно количеству уникальных словарных входов. Устойчивые сочетания, идиомы и т.д. считаются единым целым, а варианты перевода - отдельными вхождениями. Среди словарей"Polyglossum" есть бумажные словари, переведённые в электронный формат без права внесения изменений. Имеются бумажные словари, в отношении которых издательство ЭТС имеет права на дальнейшее развитие (обновление, внесение поправок и толкований), а также издание в любой форме. Есть электронные словари, не имеющие бумажных аналогов. Словари"Polyglossum" являются отличным рабочим инструментом профессионального технического переводчика, инженера, учёного. Издательство ЭТС - безусловный лидер по количеству, разнообразию и точности отраслевых и технических словарей. Спектр языков словарей ЭТС явно ориентирован на страны северной Европы, имеющие тесные связи с Россией.
Электронные словари "Контекст" подготавливаются и пополняются лексикографическим отделом компании "Информатик" по материалам печатных и авторских словарей. Они организованы так, чтобы работа с ними была максимально быстрой и удобной.
Основу каждой статьи составляет множество синонимичных слов или словосочетаний на двух языках. Каждый из синонимов рассматривается как единица, которая может служить ключевым словом для поиска. Синонимы могут быть снабжены пометами (часть речи, транскрипция и т.п.). Статья может содержать примеры переводов фраз, также рассматриваемых в качестве поисковых единиц. Объём словарей подсчитывается в поисковых единицах, приходящихся на синонимы, и не включает в себя примеры, хотя по примерам также ведётся поиск. "Контекст" удобен для иностранцев, изучающих русский язык; благодаря распознаванию вводимых слов в любой форме он хорош для получения справки без отвлечения от основного занятия, но в первую очередь его аудиторией считаются переводчики. Основными достоинствами "Контекста" с точки зрения перевода можно считать достаточно большой набор тематических словарей, поиск словосочетаний в любой форме и возможность показать список переводов всех фраз с интересующим словом в словаре.
Различные словари используют совершенно разные подходы и, соответственно, методы представления словарных данных. В результате объёмы включённых в них словарей указаны разными способами: в словарных статьях, поисковых терминах или "единицах". "Статья" соответствует обыкновенной словарной статье при алфавитном поиске (как в бумажном словаре). Однако количество словарных статей как показатель объёма - величина весьма обманчивая. На практике значимым оказывается то количество возможных вопросов, на которые в словаре содержатся ответы.
На сегодняшний день в магазинах, специализирующихся на продаже программного обеспечения, можно найти целый ряд словарей и энциклопедий на компакт-дисках. Конечно, словари и энциклопедии широко представлены и в российском Интернете - от крупных проектов до не менее интересных тематических словарей, созданных и пополняемых энтузиастами.
Один из самых популярных порталов онлайн-словарей в российской Сети - ИПС flndex. Словари(http://slovari.yandex.ru/). Портал осуществляет перевод как на, так и с английского, немецкого, французского, итальянского, испанского, украинского языков. Помимо словарей общей лексики, предлагаются справочники медицинские, юридические, технические и многие другие. Портал очень прост и удобен в использовании.
Портал Mail.ru (http://multilex.maii.ru/) представляет словари на семи языках. Онлайн-справочники включают в себя как общую лексику, так и медицинскую, экономическую, а также словари терминов нефтяной, газовой отраслей, солнечной энергетики и другие отраслевые словари.
Существуют онлайн-словари и на ИПС Rambler - Словари(http://www.rambler.ru/dict/). Выбор языков на портале пока небольшой: английский и немецкий.
Сейчас все более популярными становятся электронные словари на карманных персональных компьютерах (SlovoED/Multilex, Abbyy Lingvo, Pocket Context, Absolute Word Roadlingua, Diet, VVS Словарь,Pocket Multitran, Pocket Promt и т.д.).