- •Чинники, що зумовили формування комп’ютерної лінгвістики як науки
- •Поняття кл. Історія розвитку кл
- •Зв’язки кл з іншими нелінгвістичними науками
- •Поняття кл. Основні напрямки кл
- •Основні напрямки кл. Комп’ютерна лексикографія
- •Основні напрямки кл. Аналіз текстів на природній мові
- •Історія розвитку та сучасний стан систем машинного перекладу
- •Прикладні системи розробку яких, забезпечує кл
- •Характеристика об’єкту досліджень в кл
- •Характеристика предмету досліджень в кл
- •Два типи моделей опису мовленнєвої діяльності. Розширена класифікація моделей
- •Класифікація моделей опису мовленнєвої діяльності
- •Етапи створення лінгвістичної моделі
- •Вимоги до побудови лінгвістичних моделей
- •Класифікація лінгвістичних моделей за способом побудови
- •Класифікація лінгвістичних моделей за способом аналізу мовних об’єктів
- •22. Система рівнів абстракції опису лінгвістичних явищ в кл
- •23. Критерії вибору формалізму для представлення лінгвістичних явищ в кл
- •24. Граматики, що використовуються для опису в кл
- •25.Загальна схема опрацювання текстів на природній мові
- •26. Аналіз окремих слів. Характеристика етапу
- •27. Аналіз окремих речень. Характеристика етапу
- •28. Аналіз тексту в цілому. Характеристика етапу
- •29. Поняття автоматизована система опрацювання текстів. Характеристика основних підходів до її розробки
- •30. Які задачі вирішує модуль ама в системах автоматичного опрацювання текстів природною мовою
- •Загальна умовна структура системи ама
- •32. Основні принципи розробки систем ама
- •33.34.35 Основні групи методів ама
- •37. Етапи ма з використанням словників
- •38. Етапи створення швидкодіючого алгоритму ма
- •39. Які основні вимоги висуваються до систем ама
- •40.Основні поняття морфологічної моделі мови флективного типу
- •41.Основні складові лінгвістичного забезпечення систем ма.
- •43. Які складові необхідні для опису мови в її морфологічній моделі?
- •44. Поняття таблиці морфів. Навести приклад
- •45. Поняття списки масок. Навести приклад
- •46. Поняття списки морфів. Навести приклад
- •47. Поняття технічної частини мови
- •48 Яку інформацію повинен містити кожен запис у словнику основ
- •49. Порівняння методів ма «справа-наліво» і «зліва-направо»
- •50. Переваги методів ма «зліва-направо»
- •51. Характеристика задачі побудови словника основ і пошуку в ньому, як задачі керування базою даних
- •52. Загальна структура словника основ, яка забезпечує мінімум звертань до диска
- •53. Алгоритм пошуку у словнику основ. Навести приклад
- •54.Алгоритм роботи «стека вкладених ключів». Навести приклад
- •55.Алгоритм формування словника основ. Навести приклад
- •57.Типи граматичних правил для зняття омонімії
- •58.Використання прихованої моделі Маркова в алгоритмах зняття омонімії
- •60.Алгоритм зняття омонімії методом на основі нормалізуючи підстановок і позицій сусідніх слів
Основні напрямки кл. Комп’ютерна лексикографія
Основні напрямки: 1) корпусна лінгвістика
2) машинний переклад
3) системи пошуку
4) комп. лексикографія
5) автоматичний аналіз текстів природною мовою
Комп’ютерна лексикографія – розробка словників, які будуть функціонувати окремо або в інф. системах. Потреба в розробці словників величезна, і не тільки для перекладу, а й весь спектр словників (синонімів, частотних, тлумачних, морфологічних)
Основні напрямки кл. Аналіз текстів на природній мові
Основні напрямки: 1) корпусна лінгвістика
2) машинний переклад
3) системи пошуку
4) комп. лексикографія
5) автоматичний аналіз текстів природною мовою
Автоматизований аналіз текстів природної мовою
передбачає розробку систем морф. аналізу слів, синтаксичного та семантичного аналізу речень
побудова прагматик. структур всього тексту
розробка систем синтезу і генерації тексту
Ці дослідження потрібні для розробки систем автоматичного реферування, розробки систем пошуку за змістом, для опрацювання баз знань в експертних системах.
Історія розвитку та сучасний стан систем машинного перекладу
Ідея використовувати ЕОМ для перекладу виникла ще в 1946 році, одразу після виникнення перших ЕОМ. Перша публічна демонстрація машинного перекладу відбулася в 1954 році. Незважаючи на те, що та система була досить примітивною (словник на 250 слів, граматика із 6 правил, переклад декількох простих фраз), цей експеримент отримав широкий резонанс: почалися дослідження в Англії, Болгарії, Італії, Китаї, Франції, Японії та інших країнах; в тому ж 1954 році і в СРСР.
До середини 1960-х в США для практичного використання було представлено дві системи російсько-англійського перекладу:
MARK (у Департаменті закордонної техніки ВПС США);
GAT (використовувалась у Національній лабораторії атомної енергії в Окриджі).
Проте, створена для оцінки подібних систем комісія ALPAC дійшла висновку, що через низьку якість машинно- перекладених текстів ця діяльність в умовах США нерентабельна. Хоча комісія рекомендувала продовжувати та поглиблювати теоретичні розробки, її висновки призвели до зниження фінансування та поступового загасання розробок у цій сфері в США.
В деяких країнах дослідження не припинялись, цьому сприяв постійний розвиток обчислювальної техніки. Особливо суттєвим фактором стало виникнення міні- та персональних комп’ютерів, а з ними складніших словникових, пошукових та т. п. систем. Через ріст міжнародних відносин зростала й потреба в перекладі. Все це призвело до нового підйому у перекладацькій галузі, який прийшов приблизно на середину 1970-х. У 1980-ті прийшов час широкого практичного використання перекладацьких систем, сформувався ринок комерційних розробок у цій галузі.
На даному етапі розвитку людство досягло значних успіхів у машинному перекладі, але якість перекладу дуже часто нас не задовольняє.
На сучасному українському ринку вітчизняні фірми пропонують такі продукти машинного перекладу:
– "Віста Текнолоджіз" і "Адвентіс", створені в 1991 р.( включає політематичний машинний словник , обсяг – близько 3,4 млн слів, причому 20 % з них є словами, а 80 % стійкими словосполученнями. );
– ПРОМТ, розроблена також в 1991 р.;
– "Медіа Лінгва" випустила електронні словники (можуть бути розміщені на кишенькових комп'ютерах)