Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Булдакова - Компьютерная лексикография.docx
Скачиваний:
220
Добавлен:
26.03.2015
Размер:
58.24 Кб
Скачать

Тема 3. Электронные словари

Электронный (автоматический) словарь - это словарь в специ­альном машинном формате, функционирующий как часть про­граммного обеспечения компьютера. Сегодня широко распростра­няются электронные версии самых различных словарей. В отличие от традиционных словарей электронный словарь наряду с текстом и графическими изображениями может содержать весь спектр ме- диаобъектов, включая видео- и анимационные фрагменты, звук, музыку и прочее.

Все электронные словари можно разделить на два типа:

  1. автоматические словари конечного пользователя (о них и пойдет речь в данном разделе);

  2. автоматические словари для программ обработки текста (это информационно-поисковые тезаурусы, частотные словари, рубрикаторы, классификаторы, словари морфологического анали­за; словари для машинного перевода), которые включают подроб­ную информацию о морфологических, синтаксических и семанти­ческих особенностях функционирования слова. Количество зон словарных статей в таких словарях варьируется от 1 до 100. Каж­дая зона содержит особый тип словарной информации: лемма, грамматическая информация или стилистические пометы, зоны значения и толкования. В электронных словарях количество зон больше, чем в обычных бумажных.

Важной особенностью электронного словаря является его ги­пертекстовое устройство. Ссылки, внедренные в слова, фразы или рисунки, позволяют пользователю выбрать текст или рисунок и немедленно вывести на экран связанные с ним сведения и мульти­медийные материалы. Взаимоотношения между компонентами словарной статьи не являются линейными. Словарная статья имеет четкую логическую структуру с иерархическими связями между элементами. Каждая информационная категория занимает здесь строго фиксированное место - так называемую «зону». Пользова­тель, проявляя интерес к той или иной информации, запрашивает определенный параметр и получает доступ к отдельным фрагмен­там статьи. В соответствии с запросом активизируется лишь от­дельно взятая зона, поэтому нет необходимости просматривать всю статью. Следовательно, создатели элекгронного словаря могут предусмотреть довольно большое количество словарных входов, позволяющее пользователю легко и быстро получать любую необ­ходимую ему информацию, а проблемы алфавитного расположе­ния словарных статей для массового пользователя не имеют прин­ципиального значения.

Электронные словари имеют серьезные преимущества по сравнению со своими бумажными аналогами, что проявляется в быстром росте соответствующего рынка. Электронный словарь принципиально может обойти ключевое противоречие книжной лексикографии: чем больше информации предлагает словарь, чем больше развит его научный аппарат, тем сложнее им пользоваться. Поэтому классические словари разделяются на две категории. Первая - популярные, относительно удобные, но довольно про­стые. Вторая - обстоятельные академические издания, не всегда позволяющие быстро получить искомую информацию. Современ­ные электронные словари не только значительно превосходят по объему книжные, но и находят искомое слово или словосочетание за несколько секунд.

При этом речь не идет об автоматическом выборе переводного эквивалента (если мы говорим о переводном словаре). Словарный ответ может давать весьма разнообразную информацию о слове или словосочетании, а не просто переводное соответствие, пред­полагает активный выбор пользователя из нескольких возможных хорошо обоснованных альтернатив. Электронный словарь может быть дву- и более направленным, то есть позволять переводить слова в обоих направлениях и даже с одного языка на другой при посредстве третьего.

Большую роль играет также фактор доступности. Далеко не в каждом крупном российском городе можно найти бумажные изда­ния больших иностранных словарей. При этом существует значи­тельное число бесплатных Интернет-проектов (как отечественных, так и зарубежных), представляющих разнообразные лексикогра­фические материалы. Второй и не менее важный аспект доступно­сти - ценовой: большинство отечественных словарей, распростра­няемых на CD/DVD-ROM, стоят значительно дешевле своих бу­мажных аналогов. Привлекательными факторами для пользователя являются также интерактивность современных электронных сло­варей, их актуальность, обновляемость, удобный для пользователя интерфейс.

Фактически многие словари, которые сформировались в язы­ковой атмосфере середины прошлого века, сильно устарели. Появ­ляются новые отрасли производства, науки, бизнеса, культуры. В обычную разговорную речь приходят новые слова, термины, ус­тойчивые словосочетания. В них не указаны современные значе­ния старых слов, а многие новые слова просто отсутствуют, так как бумажные словари слишком долго готовятся. Электронные словари могут оперативно обновляться.

Но, конечно, самое главное преимущество хороших электрон­ных словарей - одновременный поиск не только по названию сло­варной статьи, но и по всему огромному объему толкований слов­ника, что не представляется возможным в бумажном варианте. Та­кой поиск создает многомерный портрет слова, при этом из глубин словарной статьи извлекаются конкретные примеры его использо­вания и устойчивые выражения, в которых слово встречается. Очень важно, что электронные словари используют последние достижения лексикографии. Каждое значение в электронном сло­варе сопровождается синонимами, антонимами, примерами упот­ребления, лингвистической информацией. Удобно то, что не выхо­дя из основной статьи, можно открыть окна синонимов, антонимов и т. д. и изучать их одновременно.

Однако разработка электронных словарных баз, так же как и создание бумажных словарей, является трудоемким делом, а ли­цензирование готовых словарей обходится очень дорого.

На сегодняшний день в России получили широкое распро­странение электронные словари разных издательств: Lingvo (ABBYY Software House), Мультилекс (МедиаЛингва),Polyglossum (ЭТС - "Электронные и традиционные словари"), Контекст (Ин- форматик),PROMT (ПРОМТ) и многие другие. Эти словари в большой степени универсальны, но вместе с тем каждый из них тяготеет к определённой нише.

Два самых известных электронных словаря - Lingvo компа­нииAbbyy и МультиЛекс, разработанный фирмой МедиаЛингва. Специалисты, создающие эти словари, исповедуют разные взгляды на принципы электронной лексикографии. Компания МедиаЛингва придерживается при разработке словарей МультиЛекс стратегии, которая заключается в создании цифровых копий известных книж­ных изданий. В основе электронных словарей от этой компании лежат авторитетные современные словари ведущих издательств России. Словари МультиЛекс - это усовершенствованные копии своих печатных оригиналов. В них последовательно воспроизво­дится содержание печатных словарей, включая предисловия авто­ров оригинальных изданий и сопутствующие справочные материа­лы. В качестве объёма словника указывается объём словника ори­гинала. В распоряжении пользователей имеются мощные и разно­образные средства поиска (распознавание слов и выражений во всех грамматических формах, поиск идиом, выражений, примеров употребления, алфавитный поиск с подсказкой). При работе со словарями МультиЛекс предоставляется точная и полная словар­ная информация (транскрипция, отраслевые и стилистические по­меты, ударения, толкования, примеры).

Подход МедиаЛингва имеет и недостатки, так как жесткая привязка к бумажному прототипу не дает возможности исправлять и дополнять электронный словарь, а тем более изменять структуру построения словарной статьи. Традиционные словари довольно серьезно отстают от языковой реальности - обычно это не менее десяти лет. А электронные словари можно пополнять чуть ли не ежедневно.

По другому пути пошла компания Abbyy. ОсновуLingvo со­ставляет электронный словарь собственной разработки. Каждая новая версияLingvo дополняется актуальной лексикой, и в ней ис­правляются найденные ошибки и неточности. Таким образом, бла­годаря лексикографическим исследованиям англо-русский словарь фирмыAbbyy близок к языковой практике. Словари"Lingvo" не являются точными копиями бумажных аналогов. Так, в качестве источников для подготовки экономического словаря"LingvoEconomics" указаны семь словарей различных авторов. Продукты линейкиAbbyy Lingvo давно пользуются заслуженной популярностью у пользователей благодаря полноте и современно­сти лексической базы, удобству в работе, быстроте поиска.

Электронные словари не только содержат транскрипцию, но и могут произносить слова. Здесь тоже существует два подхода. В МультиЛекс встроен синтезатор звука и произносятся все слова. Однако полностью доверять такому подходу, не контролируя его по транскрипции, опасно. Синтезатор может неправильно поставить ударение или вообще исказить произношение слова. В Abbyy Lingvo основную лексику озвучивает диктор с оксфордским про­изношением, считающимся для английского языка классическим.

Базы данных "Polyglossum" формируются из единого источни­ка с выпускаемыми издательством бумажными словарями и снаб­жены развитой системой индексации данных, позволяющей вести полнотекстовый поиск в любом направлении. Объём словарей ука­зывается в "терминах", что учитывает особенности и новые воз­можности электронных версий словарей. Количество "терминов" равно количеству уникальных словарных входов. Устойчивые со­четания, идиомы и т.д. считаются единым целым, а варианты пере­вода - отдельными вхождениями. Среди словарей"Polyglossum" есть бумажные словари, переведённые в электронный формат без права внесения изменений. Имеются бумажные словари, в отно­шении которых издательство ЭТС имеет права на дальнейшее раз­витие (обновление, внесение поправок и толкований), а также из­дание в любой форме. Есть электронные словари, не имеющие бу­мажных аналогов. Словари"Polyglossum" являются отличным ра­бочим инструментом профессионального технического переводчи­ка, инженера, учёного. Издательство ЭТС - безусловный лидер по количеству, разнообразию и точности отраслевых и технических словарей. Спектр языков словарей ЭТС явно ориентирован на страны северной Европы, имеющие тесные связи с Россией.

Электронные словари "Контекст" подготавливаются и попол­няются лексикографическим отделом компании "Информатик" по материалам печатных и авторских словарей. Они организованы так, чтобы работа с ними была максимально быстрой и удобной.

Основу каждой статьи составляет множество синонимичных слов или словосочетаний на двух языках. Каждый из синонимов рас­сматривается как единица, которая может служить ключевым сло­вом для поиска. Синонимы могут быть снабжены пометами (часть речи, транскрипция и т.п.). Статья может содержать примеры пере­водов фраз, также рассматриваемых в качестве поисковых единиц. Объём словарей подсчитывается в поисковых единицах, приходя­щихся на синонимы, и не включает в себя примеры, хотя по при­мерам также ведётся поиск. "Контекст" удобен для иностранцев, изучающих русский язык; благодаря распознаванию вводимых слов в любой форме он хорош для получения справки без отвлече­ния от основного занятия, но в первую очередь его аудиторией считаются переводчики. Основными достоинствами "Контекста" с точки зрения перевода можно считать достаточно большой набор тематических словарей, поиск словосочетаний в любой форме и возможность показать список переводов всех фраз с интересую­щим словом в словаре.

Различные словари используют совершенно разные подходы и, соответственно, методы представления словарных данных. В ре­зультате объёмы включённых в них словарей указаны разными способами: в словарных статьях, поисковых терминах или "едини­цах". "Статья" соответствует обыкновенной словарной статье при алфавитном поиске (как в бумажном словаре). Однако количество словарных статей как показатель объёма - величина весьма обман­чивая. На практике значимым оказывается то количество возмож­ных вопросов, на которые в словаре содержатся ответы.

На сегодняшний день в магазинах, специализирующихся на продаже программного обеспечения, можно найти целый ряд сло­варей и энциклопедий на компакт-дисках. Конечно, словари и эн­циклопедии широко представлены и в российском Интернете - от крупных проектов до не менее интересных тематических словарей, созданных и пополняемых энтузиастами.

Один из самых популярных порталов онлайн-словарей в рос­сийской Сети - ИПС flndex. Словари(http://slovari.yandex.ru/). Портал осуществляет перевод как на, так и с английского, немец­кого, французского, итальянского, испанского, украинского языков. Помимо словарей общей лексики, предлагаются справочники ме­дицинские, юридические, технические и многие другие. Портал очень прост и удобен в использовании.

Портал Mail.ru (http://multilex.maii.ru/) представляет словари на семи языках. Онлайн-справочники включают в себя как общую лексику, так и медицинскую, экономическую, а также словари тер­минов нефтяной, газовой отраслей, солнечной энергетики и другие отраслевые словари.

Существуют онлайн-словари и на ИПС Rambler - Словари(http://www.rambler.ru/dict/). Выбор языков на портале пока не­большой: английский и немецкий.

Сейчас все более популярными становятся электронные сло­вари на карманных персональных компьютерах (SlovoED/Multilex, Abbyy Lingvo, Pocket Context, Absolute Word Roadlingua, Diet, VVS Словарь,Pocket Multitran, Pocket Promt и т.д.).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]