Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Trados.docx
Скачиваний:
15
Добавлен:
08.02.2016
Размер:
54.55 Кб
Скачать

Київський національний лінгвістичний університет Кафедра інформаційних технологій

Проектна робота на тему «Система автоматичного перекладу Trados»

Виконала студентка 1 курсу факультету сходознавства групи Пперс 16-13 Набокова Анастасія

Київ 2014

ВСТУП

Автоматизований переклад (АП, англ. Computer-Aided Translation) - переклад текстів на комп'ютері з використанням комп'ютерних технологій. Від машинного перекладу (МП) він відрізняється тим, що весь процес перекладу здійснюється людиною, комп'ютер лише допомагає йому призвести готовий текст або за менший час, або з кращою якістю.

В даний час найбільш поширеними способами використання комп'ютерів при письмовому перекладі є робота зі словниками та глосаріями, пам'яттю перекладів (англ. Translation Memory, TM), що містить приклади раніше перекладених текстів, а також використання так званих корпусів, великих колекцій текстів на одному або декількох мовах, що дає стислий опис того, як слова і вирази реально використовуються в мові в цілому або в конкретній предметній області.

Ідея Автоматизованого перекладу з'явилася з моменту появи комп'ютерів: перекладачі завжди виступали проти стандартної в ті роки концепції МП, на яку було направлено більшість досліджень в області комп'ютерної лінгвістики, але підтримували використання комп'ютерів для допомоги перекладачам. У 1960-ті роки Європейське об'єднання вугілля і сталі (попередник сучасного Євросоюзу) стало створювати термінологічні бази даних під загальною назвою Eurodicautom. У Радянському Союзі для створення баз такого роду був створений ВІНІТІ. Говорячи про автоматизований переклад слід сказати про так звану пам'ять перекладів або Translation memory. Пам'ять перекладів (ПП, англ. Translation memory, TM іноді звана «Накопичувач перекладів») - база даних, що містить набір раніше перекладених текстів.

Крім прискорення процесу перекладу повторюваних фрагментів і змін, внесених у вже перекладені тексти (наприклад, нових версій програмних продуктів або змін у законодавстві), системи Translation Memory також забезпечують однаковість перекладу термінології в однакових фрагментах, що особливо важливо при технічному перекладі. З іншого боку, якщо перекладач регулярно підставляє в свій переклад точні відповідності, витягнуті з баз перекладів, без контролю їх використання в новому контексті, якість перекладеного тексту може погіршитися.

У кожній конкретній системі Translation Memory дані зберігаються у своєму власному форматі (текстовий формат в Wordfast, база даних Access в Deja Vu), але існує міжнародний стандарт TMX (англ. Translation Memory eXchange format), який заснований на XML і який можуть породжувати практично всі системи ПП. Завдяки цьому результати роботи перекладачів можна обмінювати між додатками, тобто перекладач працює з OmegaT може використовувати пам'ять перекладів, створену в Традос (Trados) і навпаки.

Одною з найбільш популярних систем автоматизованої системи перекладу є Trados (Традос).

Концепція Translation Memory передбачає виявлення в перекладному тексті фрагментів , переклади яких вже є в базі даних перекладів , і за рахунок цього скорочення обсягу роботи перекладача. Це виявлення отримало назву вирівнювання або зіставлення ( alignment ) . Фрагменти , що залишилися не перекладеним після вирівнювання ( зіставлення ), передаються далі для ручної обробки перекладачеві або системі машинного перекладу ( Machine Translation , MT) . Перекладач на цьому етапі може виділити знову перекладені фрагменти і занести нові пари паралельних текстів на двох мовах в базу даних. Така схема найкращим чином працює на однотипних текстах , де повторюваність словосполучень досить висока.

Розділ пам'ять перекладів або translation memory Загальні відомості про пам'ять перекладів або Translation Memory

Пам'ять перекладів (ПП, англ. Translation memory, TM іноді ще її називають базою даних, що містить набір раніше перекладених текстів. Один) запис у такій базі даних відповідає «одиниці перекладу» (англ. translation unit ), за яку зазвичай приймається одне речення (рідше - частина Складносурядні пропозиції, або абзац). Якщо чергову пропозицію вихідного тексту в точності збігається з пропозицією, що зберігаються в базі ( точну відповідність, англ. Exact match ), воно може бути автоматично підставлено в переклад. Нова пропозиція може також злегка відрізнятися від зберігається в базі ( неточне відповідність, англ. Fuzzy match ). Таку пропозицію може бути також підставлено в переклад, але перекладач буде повинен внести необхідні зміни.

Крім прискорення процесу перекладу повторюваних фрагментів і змін, внесених у вже перекладені тексти (наприклад, нових версій програмних продуктів або змін у законодавстві), системи Translation Memory також забезпечують однаковість перекладу термінології в однакових фрагментах, що особливо важливо при технічному перекладі. З іншого боку, якщо перекладач регулярно підставляє в свій переклад точні відповідності, витягнуті з баз перекладів, без контролю їх використання в новому контексті якість перекладеного тексту може погіршитися.

У кожній конкретній системі Translation Memory дані зберігаються у своєму власному форматі (текстовий формат в Wordfast, база даних Access в Deja Vu), але існує міжнародний стандарт TMX (англ. Translation Memory eXchange format ), який заснований на XML і який можуть породжувати практично всі системи ПП. Завдяки цьому результати роботи перекладачів можна обмінювати між додатками, тобто перекладач працює з OmegaT може використовувати пам'ять перекладів, створену в Традос ( Trados ) і навпаки. Більшість систем Translation Memory як мінімум підтримують створення і використання словників користувача, створення нових баз даних на основі паралельних текстів (англ. alignment ), а також напівавтоматичне витяг термінології з оригінальних і паралельних текстів.

Історія створення автоматизованого перекладу

Автоматизований переклад (АП , англ. Computer- Aided Translation ) - переклад текстів на комп'ютері з використанням комп'ютерних технологій. Від машинного перекладу (МП) він відрізняється тим , що весь процес перекладу здійснюється людиною , комп'ютер лише допомагає йому призвести готовий текст або за менший час , або з кращою якістю.

Ідея Автоматизованого перекладу з'явилася з моменту появи комп'ютерів : перекладачі завжди виступали проти стандартної в ті роки концепції МП , на яку було направлено більшість досліджень в області комп'ютерної лінгвістики , але підтримували використання комп'ютерів для допомоги перекладачам . У 1960 -ті роки Європейське об'єднання вугілля і сталі ( попередник сучасного Євросоюзу) стало створювати термінологічні бази даних під загальною назвою Eurodicautom . У Радянському Союзі для створення баз такого роду був створений ВІНІТІ .

У сучасній формі ідея АП була розвинена у статті Мартіна Кея 1980 року, який висунув наступну тезу : " by taking over what is mechanical and routine , it ( computer ) frees human beings for what is essentially human " (комп'ютер бере на себе рутинні операції і звільняє людину для операцій, що вимагають людського мислення).

В даний час найбільш поширеними способами використання комп'ютерів при письмовому перекладі є робота зі словниками та глосаріями , пам'яттю перекладів ( англ. Translation Memory , TM ) , що містить приклади раніше перекладених текстів , а також використання так званих корпусів , великих колекцій текстів на одному або декількох мовах , що дає стислий опис того , як слова і вирази реально використовуються в мові в цілому або в конкретній предметній області.

Для локалізації програмного забезпечення часто застосовуються спеціалізовані засоби , наприклад , Passolo , які дозволяють переводити меню та повідомлення у програмних ресурсах і безпосередньо в компільованих програмах , а також тестувати коректність локалізації. Для перекладу аудіовізуальних матеріалів (головним чином фільмів) також використовуються спеціалізовані засоби , наприклад , Swift , які об'єднують в собі деякі аспекти пам'яті перекладів , але додатково забезпечують можливість появи субтитрів за часом , їх форматування на екрані , прямування відеостандарті і т.п.

При синхронному перекладі використання засобів автоматизованого перекладу з потреби обмежена. Одним із прикладів є використання словників, що завантажуються на КПК. Іншим прикладів може служити напівавтоматичне витяг списків термінів при підготовці до синхронного перекладу у вузькій предметній області.

У вузьких предметних областях при великій кількості вихідних текстів і сталої термінології перекладачі можуть використовувати і машинний переклад , який може забезпечити гарну якість перекладу термінології та стійких виразів у вузькій області. Перекладач в цьому випадку здійснює пост- редагування отриманого тексту . Більше половини текстів всередині Єврокомісії ( головним чином юридичні тести і поточна кореспонденція ) перекладається з використанням машинного перекладу (МП)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]