- •Чинники, що зумовили формування комп’ютерної лінгвістики як науки
- •Поняття кл. Історія розвитку кл
- •Зв’язки кл з іншими нелінгвістичними науками
- •Поняття кл. Основні напрямки кл
- •Основні напрямки кл. Комп’ютерна лексикографія
- •Основні напрямки кл. Аналіз текстів на природній мові
- •Історія розвитку та сучасний стан систем машинного перекладу
- •Прикладні системи розробку яких, забезпечує кл
- •Характеристика об’єкту досліджень в кл
- •Характеристика предмету досліджень в кл
- •Два типи моделей опису мовленнєвої діяльності. Розширена класифікація моделей
- •Класифікація моделей опису мовленнєвої діяльності
- •Етапи створення лінгвістичної моделі
- •Вимоги до побудови лінгвістичних моделей
- •Класифікація лінгвістичних моделей за способом побудови
- •Класифікація лінгвістичних моделей за способом аналізу мовних об’єктів
- •22. Система рівнів абстракції опису лінгвістичних явищ в кл
- •23. Критерії вибору формалізму для представлення лінгвістичних явищ в кл
- •24. Граматики, що використовуються для опису в кл
- •25.Загальна схема опрацювання текстів на природній мові
- •26. Аналіз окремих слів. Характеристика етапу
- •27. Аналіз окремих речень. Характеристика етапу
- •28. Аналіз тексту в цілому. Характеристика етапу
- •29. Поняття автоматизована система опрацювання текстів. Характеристика основних підходів до її розробки
- •30. Які задачі вирішує модуль ама в системах автоматичного опрацювання текстів природною мовою
- •Загальна умовна структура системи ама
- •32. Основні принципи розробки систем ама
- •33.34.35 Основні групи методів ама
- •37. Етапи ма з використанням словників
- •38. Етапи створення швидкодіючого алгоритму ма
- •39. Які основні вимоги висуваються до систем ама
- •40.Основні поняття морфологічної моделі мови флективного типу
- •41.Основні складові лінгвістичного забезпечення систем ма.
- •43. Які складові необхідні для опису мови в її морфологічній моделі?
- •44. Поняття таблиці морфів. Навести приклад
- •45. Поняття списки масок. Навести приклад
- •46. Поняття списки морфів. Навести приклад
- •47. Поняття технічної частини мови
- •48 Яку інформацію повинен містити кожен запис у словнику основ
- •49. Порівняння методів ма «справа-наліво» і «зліва-направо»
- •50. Переваги методів ма «зліва-направо»
- •51. Характеристика задачі побудови словника основ і пошуку в ньому, як задачі керування базою даних
- •52. Загальна структура словника основ, яка забезпечує мінімум звертань до диска
- •53. Алгоритм пошуку у словнику основ. Навести приклад
- •54.Алгоритм роботи «стека вкладених ключів». Навести приклад
- •55.Алгоритм формування словника основ. Навести приклад
- •57.Типи граматичних правил для зняття омонімії
- •58.Використання прихованої моделі Маркова в алгоритмах зняття омонімії
- •60.Алгоритм зняття омонімії методом на основі нормалізуючи підстановок і позицій сусідніх слів
37. Етапи ма з використанням словників
морфологічний аналіз з використаням словників містить такі етапи:
1)пошук словоформ або її залишку в списку морфем
2)вибір потрібного елемента з кількох можливих
3)відбір інформації за окремими морфемами і обєднання їх у загальну інформацію про словоформу
4)врахування індивідуальних особливостей морфем та їх вплив на загальну інформацію про словоформу
5)вибір подальших дій після того як закінчилася обробка чергової морфеми
ці етапи надають можливість створити алгоритм МА різних мов і програмні засоби загального аналізу невідомої мови.
38. Етапи створення швидкодіючого алгоритму ма
- наявність великого політематичного словника, який би забезпечував покриття текстів будь-якої тематики, не менш ніж на 98%
-алгоритм аналізу має бути словозмінним, що дозволить при одному й тому ж обсязі розпізнавати приблизно у 8 разів більше словоформ, ніж кількість лексичних одиниць у словнику
-нові слова повинні опрацьовуватись поряд із словами, наявними у словнику.
-на обсяг вихідного тексту не повинні накладатися обмеження
-система повинна бути навчальною, тобто мати засоби для поповнення складу слоника
-необхідно мати синтаксичні засоби контролю і корегування граматичної інфи про нові слови
-масиви готових банків даних морфем на сучасному етапі повинні мати такий обсяг:
----політематичний словник словозмінних основ(не менше 100000слів)
---словник словоформ, створений на базі опрацювання текстів( не ме5нше 30 млн слів
39. Які основні вимоги висуваються до систем ама
-чим більший словник, тим краще
-економія оперативної пам”яті
-висока швидкодія при умові роботи з великими словниками
-словник повинен мати значний обєм(не менше 100000слів)
-повинна виконуватись вимога відділення лінгвістичної інформації від програмної
40.Основні поняття морфологічної моделі мови флективного типу
флективною мовою вважається мова, словоформи якої утворюються шляхом поєднання ланцюгів букв, флексій або морфів з кожним з яких повязаний набір морфологічних характеристик. Морфи поєднуються в словоформах мови у відповідністю з з певними закономірностями. Перший морф визначає лексему. Поєднання значень морфологічних характеристик,ь які виражаються одним морфом будем називати грамемою. Кількість морфів, що складають словоформу фіксована для словоформ даної частини мови. Словоформа розбита на певну кількість позицій. Позиції нумеруються з нуля. Основа = 0, перший суфікс =1.
41.Основні складові лінгвістичного забезпечення систем ма.
Вони складаються з 2-х блоків: таблиць, які задають загальні закономірності граматики даної мови і словника, який задає лексику мови і особливості зміни окремих слів.
42.Яка інформація представляється у складовій лінгвістичного забезпечення.
Таблиці містять інформацію про морфеми і грамеми і про зв*язки між ними.Словник містить інформацію про основи і їх властивості .В таблицях представлена інформація трьох типів : 1) морфи відповідають грамемам (граматемам).Так називний відмінок однини прикметний -ий, а орудний множини –ими.2)морфеми керують морфами;3)грамеми керують грамемами (грамеми певних типів не можуть бути поєднані).