Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
vidpovidi.doc
Скачиваний:
5
Добавлен:
07.09.2019
Размер:
18.75 Mб
Скачать
  1. Місце автоматичного синтаксичного аналізу в загальній схемі опрацювання текстів природною мовою.

Кожен із нас щодня будує десятки, сотні речень. Як це вміння передати машині? Як навчити машину розуміти синтаксичну структуру речення, а також будувати нові правильні речення? Зрозуміло, що наше знання про синтаксичну структуру речення, тобто про лексико-граматичні зв'язки слів у ньому передати ЕОМ неможливо. Адже машина розуміє тільки мову команд, а не мову їхнього розв'язання. Для того, щоб ці правила створити, необхідно пізнати ті закони, які діють у процесі побудови речення.

Із суми спостережень над текстом лінгвіст здобуває первісну уяву про спосіб організації тексту й у вигляді чітких процедур - правил алгоритму - повідомляє автомату свої дії, а потім за його допомогою одержує на більшому матеріалі дані, що цікавлять дослідника.

Завдання АСА полягає у тому, щоб, використовуючи морфологічну інформацію про словоформи, одержану на попередньому морфологічному етапі, побудувати синтаксичну структуру вхідного речення. Об'єктом аналізу є речення, яке до моменту синтаксичного аналізу подається у вигляді інформаційних ланцюжків до словоформ. Виконувати синтаксичний аналіз повинен алгоритм СА, тобто інструкція, яка складається зі стандартних елементів, що здійснюють певну послідовність операцій над словоформами. Результатом аналізу є синтаксична структура речення, представлена як сукупність даних про синтаксичні зв'язки між його одиницями.

  1. Поняття автоматичного синтаксичного аналізу.

Синтакси́чний ана́ліз (англ. parsing) — в інформатиці це процес аналізу вхідної послідовності символів, з метою розбору граматичної структури згідно із заданою формальною граматикою. Синтаксичний аналізатор (англ. parser) — це програма або частина програми, яка виконує синтаксичний аналіз.

Під час синтаксичного аналізу текст оформлюється у структуру даних, зазвичай — в дерево, яке відповідає синтаксичній структурі вхідної послідовності, і добре підходить для подальшої обробки. Зазвичай синтаксичні аналізатори працюють в два етапи: на першому ідентифікуються осмислені токени (виконується лексичний аналіз), на другому створюється дерево розбору.

Мови програмування

Найчастіше парсери використовуються для розбору тексту вихідного коду комп'ютерних мов програмування. Вони мають відносно просту граматику з невеликою кількістю виключень. Парсер мови програмування звичайно заснований на контекстно-вільній граматиці, оскільки на її основі можна написати простий та ефективний парсер.

  1. Класифікація систем автоматичного синтаксичного аналізу (АСА) в залежності від сфери застосування.

  • УНІВЕРСАЛЬНІ (ГЛОБАЛЬНІ) (значення форм)

  • ЧАСТКОВІ (значення форм)

  1. Класифікація систем автоматичного синтаксичного аналізу (АСА) в залежності від вхідних даних.

  • СИНТАКСИЧНІ СТРУКТУРИ ВСТАНОВЛЮЮТЬСЯ ЗА ЧАСТИНАМИ МОВИ СЛОВОФОРМ ТА ЇХ СИНТАКСИЧНИМИ РОЛЯМИ

  1. Класифікація систем автоматичного синтаксичного аналізу (АСА) в залежності від способів виконання.

  • БЕЗПЕРЕРВНИЙ ПЕРЕГЛЯД ТЕКСТУ

  • ЦИКЛІЧНИЙ ПЕРЕГЛЯД ТЕКСТУ

  1. Параметри оцінки систем АСА.

ЯКІСТЬ СИНТАКСИЧНОГО АНАЛІЗУ

  • ТОЧНІСТЬ – РІВЕНЬ ПОМИЛОК В ПОБУДОВАНИХ СИНТАКСИЧНИХ СТРУКТУРАХ РЕЧЕНЬ

  • ПОВНОТА – СТЕПІНЬ ПОКРИТТЯ ТЕКСТУ СИНТАКСИЧНИМИ ЗВ’ЯЗКАМИ

ШВИДКІСТЬ СИНТАКСИЧНОГО АНАЛІЗУ

  1. Основні методи АСА.

МЕТОДИ З ФІКСОВАНИМИ, ЗАДАНИМИ НАБОРАМИ ПРАВИЛ

МЕТОДИ ЗДАТНІ ДО САМОНАВЧАННЯ

  1. Використання формальних граматик в АСА.

  • КОНТЕКСНО-ВІЛЬНА ГРАМАТИКА (Для КВ граматик визначено різні нормальні форми. В нормальних формах Чомскі (НФЧ) скорочуюють праву частину правил виводу, тобто, права частина може складатись або з одного термінального символу, або з двох нетермінальних. Якщо в лівій частині знаходиться початковий символ, права частина може породжувати порожнє слово. Існує алгоритм, який переводить довільну КВ граматику в НФЧ.)

  • ПРАВИЛА КОНТЕКСТНО-ВІЛЬНОЇ ГРАМАТИКИ ДЛЯ АНГЛІЙСЬКОЇ МОВИ

  • TREEBANKS – СИНТАКСИЧНО РОЗМІЧЕНІ КОРПУСИ(корпус являє собою текстовий орпус, в якому кожне речення розібране, тобто з анотацією синтаксичних структур. Синтаксична структура зазвичай представляється у вигляді дерева, звідси і назва Treebank.)

  • ГРАМАТИКИ ЗАЛЕЖНОСТЕЙ (СИНТАКСИЧНА СТРУКТУРА ОПИСУЄТЬСЯ В ТЕРМІНАХ ОКРЕМИХ СЛІВ ТА І БІНАРНИХ СИНТАКСИЧНИХ АБО СЕМАНТИЧНИХ ЗВЯЗКАХ МІЖ ЦИМИ СЛОВАМИ. Особливість КЗ граматик в тому, що правила виводу здійснюють заміну нетермільнального символу лише у визначеному контексті.)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]