- •11. Прикладные аспекты лексикографии. Типология словарей.
- •15. Компьютерная поддержка лексикографических работ. Автоматические словари.
- •Эпоха, описываемая словарем:
- •По способу упорядочивания входов:
- •Отображение реалий:
- •Основные структурные компоненты словаря
- •12. Структурные компоненты (зоны) словарной статьи. Параметризация лексики.
- •13. «Новый объяснительный словарь синонимов ря» (рук. Ю.Д. Апресян) как словарь нового типа, отражающий системные связи лексики.
- •14. Частотные словари. Их создание и использование. Специфика инфо, содержащейся в частотных словарях. Строение словарной статьи частотного словаря.
Соотношение описываемых единиц со словом: равны (слово, лексема), меньше (корни, служебные морфемы), больше (цитаты, пословицы)
По форме, в которой представлен словарь: компьютерный, полиграфический
Эпоха, описываемая словарем:
современные
исторические: проспективные (этимологический), перспективные (словари новых слов и значений)
По способу упорядочивания входов:
прямой (алфавитный порядок)
обратный (напр., гр. словарь Зализняка)
частотный (для того, чтобы делать учебники, напр.)
аналогические словари (по семантическим полям)
тематические
алфавитно-гнездовой порядок (по родственным словам, напр. Словарь Даля)
Отображение реалий:
реальный мир
вымышленный (напр., словари писателей)
Основные структурные компоненты словаря
1. Словник: сюда включаются все ед-цы, которые формируют область описания словаря и являются входами словарных статей. Отдельно обычно не выделяется. Может состоять из морфем (для словарей морфем и грамм. словарей), лексем (для тс), словоформ (для грамм-ких словарей) и словосочет. (для фразеол. словарей, идиом, синтагм).
2. Словарная статья — элементарная ед-ца словаря. Каждый отдельно взятый объект описания словаря и сопоставл. ему словарные характер-ки.
3. Указатели, или индексы. В тс указатели встречаются редко. Но часто в сл. фразеол. и идиом. Для облегч. поиска нужной идиомы во фразеол. словарях создаются указатели, которые позволяют находить идиому по любому из ее компонентов. Часто включаются и в структуру тезаурусов и двуязычных сл.. Указатели тезауруса дают возможность определить, в какие таксоны входит то или иное слово, а указатели двуязычных словарей отчасти выполняют функции обратного словаря по отношению к данному.
4. Список источников. Необходим, ибо использование любых уже опублик. текстовых материалов (в том числе в примерах) требует соответств. разрешения от держателя авторского права.
5. Вводная статья: как пользоваться словарем + info о структуре словарной статьи. Иногда структура словарн. статьи выносится в особый раздел словаря.
6. Список условных сокращений и алфавит.
Компьютерная поддержка создания и использования словарей.
Компьютерная поддержка лексикографических работ.
Специальные программы — базы данных, компьютерные картотеки, программы обработки текста — позволяют в автоматич. режиме формировать словарные статьи, хранить словарную info и обрабатывать ее.
Компьют. лексикогр-е прогр. делятся на 2 группы:
- программы поддержки лексикографических работ (ППЛгрР),
- автоматические словари (АС) разных типов, включающие лексикографич. базы данных.
ППЛгрР: традиционная форма фиксации словарных данных — каталожная карточка, где указывается описываемое слово, пример употребления, источник примера, автор, дополн. инфо. Комп. технологии позволяют упростить процесс сбора и хранения лексикогр. инфо, используя вместо картотеки базу данных. В отличие от обычной картотеки, записи базы данных дают возможность автоматически сортировать массив по выбранным параметрам, отбирать нужные примеры, объединять их в группы и т. д. Спец-ных лграф. баз данных нет. Но базы данных типа D-Base, ACCESS, FOX-Base, PARADOX вполне подходят.
#ЗАПИСЬ 28982 ID {идиома}
у черта на куличках EXAMPLE {пример}
поперся к Баранову к черту на кулички
SOURCE {источник}
Шапка
AUTH {автор} Войнович В.
Этап поиска примеров на слово и формирование картотеки примеров. В традиц. технологии сбор примеров производится вручную и отнимает много t. Компьютерные программы дают возможность выбирать примеры на нужное слово из корпусов текстов, хранящихся в машинном формате на компьютере, в автоматич режиме. Поиск примеров на употребл слова называется построением конкордансов. Некоторые компьютерные программы построения конкордансов по желанию пользователя могут преобр. найденные контексты в записи базы данных. # DIALEX позволяет получать конкордансы как в традиц форме (в виде файла для текстового редактора), так и в формате базы данных PARADOX.
После подготовки первичного словарного материала — словарной картотеки — следует этап составления словарной статьи. Новая словарная статья вводится в базу данных. Редактирование словарных статей также происходит в базе данных. Все это сокращает время разработки словаря, ибо упрощается обработка системы отсылок, в автомат режиме происходят сортировки (в том числе алфавитизация слов статей), легко порождаются различные указатели. Для редактирования словаря можно привлекать компьютерные программы проверки орфографии.
Последний этап — формирование текста словаря, создание оригинал-макета книги — тоже облегчается. ПО позволяет выдать текстовый материал сразу из базы данных с разметкой под топографематические выделения. Поля записи базы данных трансформируются в автоматическом режиме в зоны словарной статьи с соответствующими шрифтами, кеглями, курсивом, подчеркиваниями и пр.
Традиционная технология |
Компьютерная технология |
|
|
Для создания оригинал-макета (верстки) словарей существуют специальные издательские системы: например, пакет программ Quark-X-Press, различные версии программ Page-Maker и WinWord. Позволяют редактировать и верстать текст, изменять стили и оформление текста, положение на странице и т.п.
Автоматические словари - словари в машинном формате, бывают:
- автоматические словари конечного пользователя-человека (АСКП),
- автоматические словари для программ обработки текста (АСПОТ).
АСКП по интерфейсу и структуре словарной статьи отличаются от АС, включ. в системы машинного перевода и т. д. Чаще всего они — компьют. версии хорошо известных обычных словарей. #компьют. аналоги толковых словарей англ. яза (автоматич. Версия ТС «Коллинз», автом. вар. «Нового большого англо-русск. словаря» Апресяна), компьют. версия словаря Ожегова. АСКП почти повторяют структуру словарной статьи обычных словарей, но есть преимущ-ва: многие АСКП позволяют сортировать данные по полям словарной статьи, проводить автоматич. поиск всех вокабул, имеющих в толковании определенный семантический компонент и т. д.
АСПОТ обычно не предназн. для пользователя. Особенности их структуры, сфера охвата словарного материала задаются теми программами, которые с ними взаимодейств. #количество зон словарной статьи такого словаря может варьировать от одной до сотни.
Области Лгр описания: может быть синтакс. словарь, семантич. сл., сл. морфем, словарь и т.д. АС, используемые в системах ИП, имеют вид тезаурусов, а АС систем машинного перевода включают подробную инфо о морфологических, синтаксических и семантических особенностях функционир. слова.
АС можно классиф. по тем же парам-рам, что и обычные словари.
«Грамматический словарь» Зализняка в машинной форме реализуется как часть большинства компьютерных программ, предусматривающих морфолог. анализ или синтез словоформ РЯ. #системы проверки орфографии, распознавания письм. текста.
Компьютерная форма представления словарной инфо и целевая ориентация АСПОТ позволяет создавать комплексные словари с разнообразной грамм. и лексич. инфо. #один из стандартов автомат. переводных словарей, разраб. во Всероссийском центре переводов (ВЦП), включает:
1) заглавная единица, или лексический вход (морфема, слово, словосочет. в канонич. форме);
2) лексико-грамматический класс (принадлежн. к части речи; для словосоч. часть речи определяется в зав-ти от синтаксич. ф-ции); 2 а) лексико-грамматический класс русского переводного эквивалента;
3) морфолого-грамматическая инфо (включает не только инфо о словоизменении, но и о стандартных сокращениях заглавной единицы); 3 а) сокращения русского переводного эквивалента;
4) тематическая рубрика и стилевая характеристика;
5) индекс надежности перевода, отражающий степень общепринятости русского эквивалента;
6) русские переводные эквиваленты (с порядковыми номерами); если перевода нет, то ставится спец маркер и заполняется зона толкования;
7) пояснительные пометы, уточняющие значение заглавной единицы;
8) толкование заглавной единицы;
9) примеры употребления;
10) фразеол сочетания с заглавной единицей;
11) инфо об авторе или редакторе словарной статьи;
12) источник переводного эквивалента;
13) дата составления или редактирования словарной статьи.
Самые известные автом. переводные словари — многоязычные. #AC LEXIC содержит лексикогр. данные по нем, англ, франц, русск, итал, датск и португ язам.
Автоматические словари конкордансов содержат в машинном виде примеры на употребление всех слов (словоформ), представл. в конкретном произвед. или в творческом наследии писателя.