Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекція 8.docx
Скачиваний:
1
Добавлен:
13.11.2018
Размер:
74.89 Кб
Скачать

19

8. Комп’ютерна лексикографія.

Сучасна лексикографія значно розширила й посилила свій інструментарій комп’ютерними технологіями створення й експлуатації словників. Спеціальні програми – бази даних. комп’ютерні картотеки, програми оброблення тексту – дають змогу в автоматичному режимі формувати словникові статті, зберігати словникову інформацію й обробляти її. Багато різних комп’ютерних лексикографічних програм можна розділити на дві великі групи: програми підтримування лексикографічних робіт та автоматичні словники (АС) різних типів, зокрема лексикографічні бази даних.

Комп’ютерні програми підтримування лексикографічних робіт.

Традиційна форма фіксації словникових даних – каталожна картка, на якій раніше фіксували необхідну інформацію. Сучасні комп’ютерні технології значно спрощують процес збирання інформації. Наприклад, на відміну від паперових носіїв, комп’ютерні програми дають змогу автоматично сортувати масив за вибраними параметрами, добирати необхідні приклади, об’єднувати їх у групи тощо. Є спеціалізовані лексикографічні бази даних.

Ще один важливий етап лексикографічної роботи – пошук прикладів на слово і формування картотеки прикладів. Сучасні комп’ютерні програми дають змогу вибирати приклади на певне слово з корпусів текстів. які зберігаються в машинному форматі на комп’ютері, в автоматичному режимі. Пошук прикладів на вживання слова називають побудовою конкордансів. Деякі комп’ютерні програми побудови конкордансів за бажанням користувача можуть перетворювати знайдені контексти у бази даних.

Після підготовки первинного словникового матеріалу – словникової картотеки – безпосередньо слідує етап складання словникової статті. Технологічний ланцюжок словникових робіт і тут підтримують комп’ютерні програми. Нову словникову статтю вводять у базу даних, яка стає вихідною базою даних створюваного словника. Редагування словникових статей теж відбувається в базі даних, а не у звичайному текстовому файлі. Усе це суттєво скорочує час укладання словника, оскільки спрощується опрацювання системи покликань, в автоматичному режимі відбувається сортування (зокрема абеткування словникових статей), порівняно легко породжуються різноманітні покажчики. Для редагування можна використовувати комп’ютерні системи перевірки орфографії.

Нарешті, останній етап – формування тексту словника, створення оригінал-макету книги - також суттєво полегшується. Наявне програмне забезпечення дає змогу видати текстовий матеріал відраз з бази даних із розміткою під топографематичні виокремлення. Поля запису бази даних трансформуються в автоматичному режимі у зони словникової статті з відповідними шрифтами, кеглями, курсивом тощо.

Автоматичні словники. Автоматичний словник - це словник у спеціальному машинному форматі, призначений для використання на ЕОМ користувачем чи комп’ютерною програмою оброблення тексту. Іншими словами, розрізняють автоматичні словники кінцевого користувача-людини та автоматичні словники для програм обпрацювання тексту. Автоматичні словники, призначені для кінцевого користувача, за інтерфейсом і структурою словникової статті суттєво відрізняються від АС, залучених до систем машинного перекладу, систем автоматичного реферування, інформаційного пошуку тощо. Найчастіше вони є комп’ютерними версіями добре відомих звичайних словників. Автоматичні словники такого типу фактично повторюють структуру словникові статті звичайних словників, однак мають функції, недоступні для прототипів. Наприклад, такі словники дають змогу сортувати дані за полями словникової статті (наприклад відібрати всі прикметники), шукати всі вокабули, які мають у тлумаченні певний семантичний компонент.

Автоматичні словники для програм опрацювання тексту можна назвати автоматичними словниками в точному сенсі. Вони, як правило, не призначені для звичайного користувача. Особливості їхньої структури, сфера охоплення словникового матеріалу задаються тими програмами, які з ними взаємодіють. Так, кількість зон словникової статті такого словника може змінюватися від однієї до сотні. Дуже різноманітні й сфери лексикографічного опису. Це може бути синтаксичний словник, семантичний словник, словник морфем, словник стійких словосполук тощо. АС, використовувані в системах інформаційного пошуку, мають вигляд тезаурусів, а АС систем машинного перекладу містять детальну інформацію про морфологічні, синтаксичні та семантичні особливості функціювання слова.

Загалом до автоматичних словників можна застосувати ті самі параметри класифікування, які підходять для звичайних словників.

1. Комп'ютерна копія і комп'ютерна версія паперового словника

2. Укладання комп'ютерної версії паперового словника

3. Автоматичні словники:

а) для ви значення мови, якою написано текст;

б) для машинного перекладу;

в) для інформаційного пошуку;

г) для комп'ютерного розуміння смислу тексту.

Комп'ютерні словники повністю відповідають класифікації словників, прийнятій у традиційній лексикографії. Отже, в кожному класі словників існують паперові та комп'ютерні словники.

Але поряд із загальною класифікацією словників, словники комп'ютерні, або електронні, підпадають під окрему класифікацію комп'ютерних словників, яка базується на мірі використання комп'ютера та комп'ютерних технологій в укладанні словника, комп'ютерні копії паперових словників, комп'ютерні версії паперових словників, або комп'ютеризовані словники й автоматичні словники. Останні розпадаються на підкласи залежно від сфери їх використання.

1. Комп'ютерна копія і комп'ютерна версія паперового словника

Як уже зазначалося, комп'ютерна лексикографія далеко не відразу розпочала автоматичне укладання словників у системі "текст - словник". Спочатку був досить довгий період автоматизації трудомістких лексикографічних процесів. Наступний етап - копіювання паперових словників, щоб забезпечити можливість їх машинного прочитання (make them machine-readable). У цих копіях нічого не змінювалося, програмне забезпечення обмежувалося пошуком реєстрового слова. Спосіб користування таким словником не набагато відрізнявся від способу використання паперового словника. Зручність полягала в тому, що комп'ютер знаходив потрібне реєстрове слово швидше, не треба було гортати словник, а також у тому, що габарити записаного на дискету словника були значно меншими від розмірів паперового словника, тому дискету можна було легко мати завжди при собі.

Пізніше почали конвертувати паперовий словник у машинний формат і створювати комп'ютерну версію паперового словника, яка значно відрізнялася від словника паперового, переважно за рахунок будови словникових статей. У них уточнено функції розділових знаків, кожне значення, кожна зона та кожен приклад подають з нового рядка, не використовують тильди, тобто реєстрове слово в усіх прикладах дають повністю. При цьому ніяка змістова інформація не додається ні щодо кількості значень, ні щодо кількості ілюстративних словосполучень або речень. Отже, словник містить усе, що було в паперовому словнику, але формат його змінений. Тому з повним правом можна його назвати комп'ютерною версією паперового словника.

Змінений формат дозволяє розширити програмне забезпечення, яке містить пошук словникової статті, пошук реєстрового слова в інших статтях, зіставлення двох чи кількох статей як відносно значень їхніх реєстрових слів, так і відносно вжитих у них видів словосполучень. Отже, способи використання комп'ютерної версії словника значно ширші, ніж словника паперового. Тому комп'ютерні версії паперових словників, або комп'ютеризовані словники, як їх ще називають, набули великого поширення.

Існують комп'ютерні копії та комп'ютерні версії майже всіх типів паперових словників перекладних, навчальних, тлумачних, спеціальних (синонімів, антонімів, омонімів) та інших. Усі вони призначені для звичайного користувача - людини, забезпечуючи його потреби пошуку не лише реєстрових слів, а й уживання реєстрових слів в інших статтях словника, забезпечують можливість зіставлення та класифікації, сортування даних за окремими зонами словникової статті, за перекладами чи тлумаченнями, за спільністю дефініцій.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]