Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Українська мова за проф. спрямув..doc
Скачиваний:
136
Добавлен:
13.04.2015
Размер:
2.56 Mб
Скачать
    • частково автоматизоване перекладання: наприклад, використання перекладачем-людиною комп’ютерних словників;

    • системи з розподілом роботи: комп’ютер навчений перекладати тільки фрази чітко заданої структури (але робить це так, щоб виправляти за ним не було потрібно), а все, що не вклалося в схему, виконує людина.

  • Т

    ЦЕ ЦІКАВО

    Історія виникнення комп’ютерного перекладання

    Уперше думка про можливості машинного перекладання висловив Чарльз Беббідж, який розробив 1836-1848 рр. проект цифрової аналітичної машини – механічного прототипу електронних цифрових обчислювальних машин, що з’явилися тільки через 100 років. Ідея Ч. Беббіджа полягала в тому, що пам’ять обсягом тисячі 50-розрядних десяткових чисел можна використати для збереження словників. Ч. Беббідж цю ідею обґрунтував, щоб запросити в англійського уряду гроші, які необхідні були для створення аналітичної машини. Але йому це зробити так і не вдалося. Фактично історія машинного перекладання починається з «Джоурджтаунського експерименту». 1954 р. відбулася перша публічна демонстрація машинного перекладання з російської мови англійською. Було випробувано систему перекладання, створену для однієї пари мов; словник мав тільки 250 слів, а граматика складалася з шести синтаксичних правил. Реферат радянського вченого Д. Ю. Панова про цю подію з’явився в журналі «Математика», 1954, №10 і мав назву «Перевод с одного языка на другой при помощи машины: отчет о первом успешном испытании». Це повідомлення стало поштовхом для початку робіт з машинного перекладання в СРСР.

    Перше покоління систем машинного перекладання ґрунтувалося на алгоритмах поступового перекладання «слово за словом», «фраза за фразою». Можливості таких систем визначалися доступними розмірами словників, що залежали від обсягів пам’яті комп’ютера. Перекладаннятексту здійснювалося окремими реченнями, змістові зв’язки не враховувались. Згодом їх замінили системи наступних поколінь, в яких перекладання від мови до мови здійснювалося на рівні синтаксичних структур.

    ермінологічні банки даних (ТБД).Звернення до них відбувається не під час самого процесу перекладання, а ще до його початку. До банку даних може не передбачатися доступ в режимі «он-лайн» – він може застосовуватися тільки для підготування друкованих глосаріїв відповідно до предметних галузей. ТБД включає тільки технічну термінологію. Основною перевагою ТБД є те, що вони містять усі найсвіжіші дані: технічна термінологія постійно змінюється, а паперові словники ще до того часу, як виходять друком, встигають застаріти. Крім того, ТБД можуть перевершувати такі словники за обсягом, оскільки в створенні банків даних бере участь велика кількість фахівців, навіть усі його користувачі.

Які існують методи комп’ютерного перекладання?

Усі системи комп’ютерного перекладання використовують двомовні словники й модулі базових граматичних правил. Але індивідуальні методи перекладання відрізняються. Існують такі методи машинного перекладання:

  • Метод прямого комп’ютерного перекладання. Це найдавніший і найпростіший метод, сутність якого полягає в тому, що слова вихідного тексту перекладаються окремо і в однаковій послідовності. Після цього порядок слів та їхні закінчення пристосовуються до відповідної мови.

  • Метод трансферу. Це класичний метод комп’ютерного перекладання, який здійснюється у три етапи: аналіз, трансфер, генерування. На першому етапі аналізується граматична структура вихідного речення, потім визначається семантична структура і ці структури переносяться у відповідну мову. На останньому етапі текст, що перекладається, генерується, тобто мовні структури перетворюються на речення.

  • Метод інтерлінгви. Граматична інформація вихідного тексту спочатку виражається нейтральною мовою «інтерлінгва», з якої потім утворюється граматична інформація відповідної мови. Цей метод продуктивний для перекладання комплексних висловів.

  • Метод EBMT. Цей метод машинного перекладання ґрунтується на прикладах. Ядро системи EBMT – блок памяті перекладача, в якому зберігаються речення або фрази, які часто повторюються, та їхній переклад. Система за допомогою методів інформаційного пошуку статистично вираховує, чи є готові перекладені записи, схожі на речення вихідної мови. Генерування перекладу відбувається таким чином, що найбільш схожі речення перекладаються і комбінуються.

  • Метод SBMT. Цей метод ґрунтується на даних статистики. Перед процесом перекладання програма аналізує великий корпус двомовних текстів. Слова і граматичні форми різних мов розміщуються таким чином, що знаходяться поруч залежно від частоти використання та змістової близькості. Таким чином, генерується словник та граматичні правила, на основі яких перекладаються тексти.

  • Метод HAMT. Цей метод перекладання здійснюється з участю людини. Перекладання здійснюється машиною, але людина контролює роботу комп’ютера, втручається в процес перекладання, обираючи потрібне слово або змінюючи структуру речень.

Які існують сучасні програми комп’ютерного перекладання текстів українською мовою?

Перші комерційні продукти комп’ютерного перекладання з’явилися в середині 80-х рр. Вони були реалізовані на персональних комп’ютерах і були системами прямого перекладання. Їх можливості ґрунтувалися на використанні великих словників, а не на вмінні аналізувати та синтезувати інформацію. 1995 року з’явилися комерційні системи автоматичного перекладання в Росії, наприклад, система англо-російського (та російсько-англійського) комп’ютерного перекладання Stylus, комплект перекладацьких програм Лексикон, серія систем комп’ютерного перекладання Silod-multis.

Розглянемо принципи роботи деяких сучасних програм комп’ютерного перекладання.

Системи Promt Translation Office – це програми-перекладачі, які швидко й точно здійснюють автоматичне перекладання зв’язних текстів будь-якого обсягу, враховуючи морфологічні та синтаксичні правила природних мов. Унікальні технології дозволяють створювати системи будь-якого рівня – як додатки для недосвідчених користувачів, так і складні корпоративні системи.

Можливості системи Promt:

  • Перекладання, редагування, робота зі словником.

  • Забезпечення швидкого доступу до інформації іноземними мовами, перекладання текстових документів різних форматів. Перекладаючи документи, що містять спеціалізовану лексику (наприклад, з телекомунікаційної тематики), підключення спеціалізованих словників забезпечує коректне перекладання термінології.

  • Можливість вибору об’єктів: тематика, словник, документ і список зарезервованих слів.

  • Забезпечення зв’язного перекладання текстів з урахуванням морфологічних і синтаксичних зв’язків.

  • Зорієнтованість системи на середовище Windows.

  • Можливість створення власних словників користувача.

  • Забезпечення можливості залишити без перекладання спеціально зазначені слова тієї чи іншої мови.

  • Містить три типи словників: генеральні, спеціалізовані, словники користувача. Словники містять переклади слів і словосполучень та граматичну інформацію для отримання зв’язного тексту перекладу. Одиницею словника є словникова стаття. Для доповнення словникового складу вводяться нові слова (словосполучення) або відредаговані словникові статті з генерального й іншого словників.

Генеральні словники містять загальновживану лексику, багатофункціональні та службові слова і словосполучення. Їх можна використовувати для перекладання простих текстів.

Спеціалізовані словники призначено для текстів визначеної тематики й зорієнтовано на конкретну предметну галузь. У комплект обов’язкового постачання вони не входять.

У процесі роботи програма спочатку шукає у цих слов­никах значення перекладних слів і словосполучень, а по­тім переходить до пошуку в генеральному словнику. Прі­оритет цього звернення можна змінити. Словники можуть містити від 10 до 90 тис. словникових одиниць. Вони за­безпечують високий рівень перекладу. Це пояснюється тим, що спеціалізовані словники містять не тільки пере­клад слів, але й значну інформацію про структуру ре­чень, характерних для текстів заданої тематики. Такі словники не підлягають корекції чи поповненню, їх мож­на тільки копіювати у власні словники.

Словники користувача створюються самим користува­чем, їх можна поповнювати та коригувати. Якщо в спеціа­лізованому та генеральному словниках немає потрібного варіанта, користувач може створити власну словникову статтю. У переліку підключених словників для кожного напряму перекладу можна укласти тільки один словник користувача. Укладання таких словників дає найбільший ефект під час перекладання великих за обсягом текстів.

Система Pragma 6.x – окремий комерційний програмний продукт, що встановлюється на комп’ютер споживача. Існує також версія «он-лайн» даного перекладача. Продукт Pragma 6.x підтримує вісім мов.

Головна проблема перекладання – багатозначність слів – вирішена двома способами: шляхом спеціального маркування слів за тематичною спрямованістю (близько 100 тематик) та шляхом об’єднання слів у фрази, які мають вищий пріоритет під час перекладання.

Система Google Translate представлена тільки в режимі «он-лайн». Вона дозволяє автоматично перекладати слова, фрази та web-сторінки з однієї мови іншою. Система Google працює за таким принципом: аналізує великі обсяги тексту різними мовами, а також оригінали та переклади, зроблені професійними лінгвістами; потім за допомогою спеціальних методик формується модель для перекладання тексту з однієї мови іншою.

Система Pars має такі особливості: одночасна робота багатьох користувачів; проста процедура поповнення словників, що дає можливість налаштувати систему на потрібні стилі, теми. Система надає користувачам такі можливості: задавати словники потрібної тематики і встановлювати їхню пріоритетність (це буває зручно, коли зустрічається слово, що має кілька перекладів; у такому випадку система вибирає ті значення, що знаходяться в словнику з найбільшим пріоритетом); вибирати той варіант перекладу, що найбільше підходить за змістом з пропонованих системою варіантів; працювати безпосередньо у Windows Word із збереженням формату вхідного тексту.

Система Pars містить такі словники: словник загальновживаної лексики (35 тис. слів); словник з програмування (25 тис. термінів); технічний словник (77 тис. термінів); словник з радіоелектроніки (50 тис.); словник з мікроелектроніки (20 тис.) та ін. Усього в спеціалізованих словниках системи 400 тис. термінів.

Які помилки виникають під час комп’ютерного перекладання?

Студентам частіше доводиться працювати не з оригіналом наукового тексту, а з його комп’ютерним перекладом. Саме тому, редагуючи, важливо знати типові помилки, які допускають автоматизовані програми перевірки правопису чи розпізнавання текстів, з метою виявлення їх і виправлення в ручному варіанті. Якими осучасненими не були б комп’ютерні програми, замінити людський фактор – досвідчене людське око, розум і творчий підхід – вони не зможуть.

Перед редактором комп’ютерного перекладу часто постають очевидні вади, до яких вже звикли й навчилися розпізнавати. Наприклад, під час перекладання трапляються такі змістові помилки: російське словосполучення «женский пол» перекладається українською мовою як «жіноча підлога»; «раздел третий» – «роздягнув третій»; «в заключении пришли к выводу» – «в ув’язненні прийшли до висновку»; «в конце предложения стоит точка» – «у кінці речення коштує крапка» та ін.

Але крім змістових помилок трапляються на перший погляд непомітні, але дуже суттєві помилки. Проаналізуємо типові помилки, що з’являються під час комп’ютерного перекладання наукових текстів з російської мови українською.

Таблиця 1. 18 – Типові помилки, що часто виникають під час комп’ютерного перекладання

Вид помилок

Приклад неправильного перекладу

Виправлення помилок

1

2

3

Неправильний переклад усталених словосполучень наукового стилю

дослідження представляє собою…; звідси витікає; підняти питання; тема являється дискусійною; приймати участь; прийняти міри; пред’являти вимогу

дослідження є…; звідси випливає; порушити питання; тема є дискусійною; взяти участь; вжити заходів; ставити вимогу

Неточності у перекладі термінів

алгебраїчне число; мережевий звязок; працюючі частоти

алгебричне число; мережний зв’язок; робочі частоти

Вживання слів у невластивому для них значенні

область використання; в області інформаційних технологій; об’єм продукції; основні напрямки розвитку; вірні показники

галузь використання; в гілузі інформаційних технологій; обсяг продукції; основні напрями розвитку; правильні показники

Неправильне вживання дієприкметників

виконуємі роботи; розробляєма проблема; модем, передаючий інформацію;

роботи, що виконуються; проблема, що розробляється; модем, що передає інформацію

Помилки в перекладі ініціалів, розбіжності у відмінюванні прізвищ

А. А. Васильєв;

праці В. І. Бойко

О. А. Васильєв (Олександр Андрійович); праці В. І. Бойка (йдеться про автора чоловічої статі)

Помилки в перекладі прийменників

згідно тези Тьюрінга; збій в мережі виник по технічним причинам; у відповідності до проведеного дослідження

згідно з тезою Тьюрінга; збій в мережі виник через технічні причини; відповідно до проведеного дослідження

1

2

3

(або згідно з проведеним до слідженням)

Помилки у передачі цифрової інформації, що виникають у результаті сканування

цифра 30 передається як ЗО; 111 як ІІІ; 6 як б; 8 як 0 та ін.