Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Тульский Государственный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Lektsia_11SistProg.doc

Скачиваний:

Добавлен:

10.05.2015

Размер:

1.46 Mб

Скачать

☆

<<< < Предыдущая 1 2 34 / 124 5 6 7 8 9 10 11 12 > Следующая >>>

Структура Lex-программы

Lex-программа состоит из трех частей: описаний, правил трансляции и процедур. Каждая часть отделяется от следующей строкой, содержащей два символа %%.

Секция описаний включает описания переменных, констант и регулярных определений. Раздел описаний содержит определения макросимволов (метасимволов) в виде:

ИМЯ ВЫРАЖЕНИЕ

Если в последующем тексте в регулярном выражении встречается {ИМЯ}, то оно заменяется на ВЫРАЖЕНИЕ. Если строка описаний начинается с пробелов или заключена в скобки %{ ... }%, то она просто копируется в выходной файл.

Регулярные определения - это последовательность определений вида

d₁ r₁

…

d_n r_n,

где каждое d_i - некоторое имя, а каждое r_i - регулярное выражение над алфавитом

Правила трансляции - это операторы вида

p₁ {action₁}

…

p_n{action_n}

где p_i - регулярное выражение, action_i - фрагмент программы, описывающий, какие действия должен выполнять лексический анализатор для лексемы, определяемой p_i.

Третья секция содержит процедуры, выполняемые при разборе. В частности, здесь описывается функция yywrap(), которая определяет, что делать при достижении автоматом конца входного файла. Ненулевое возвращаемое значение приводит к завершению разбора, нулевое - к продолжению (перед продолжением, естественно, надо открыть какой-нибудь файл как yyin ). Вообще говоря, эти процедуры могут быть скомпилированы отдельно.

Способы записи регулярных выражений в Lex-программе

Рассмотрим способы записи регулярных выражений во входном языке Lex'а. Символ из входного алфавита, естественно, представляет регулярное выражение из одного символа. Специальные символы (в том числе +-*?()[]{}|/\^$.<> ) записываются после префикса \. Символы и цепочки можно брать в кавычки, например допустимы следующие три способа кодирования символа а: а, "а" и \а.

Имеется возможность задания класса символов:

[0-9] или [0123456789] - любая цифра

[A-Za-z] - любая буква

[^0-7] - любая литера, кроме цифр от 0 до 7

. - любая литера, кроме \n

Грамматика для записи регулярных выражений (в порядке убывания приоритета):

<р>* - повторение 0 или более раз

<р>+ - повторение 1 или более раз

<р>? - необязательный фрагмент

<р><р> - конкатенация

<р>{m,n} - повторение от m до n раз

<р>{m} - повторение m раз

<р>{m,} - повторение m или более раз

^<р> - фрагмент в начале строки

<р>$ - фрагмент в конце строки

<р>|<р> - любое из выражений

<р>/<р> - первое выражение, если за ним следует второе

(р) - скобки, используются для группировки

Пример. Регулярное выражение ^[^aeiou]*$ означает любую строку, не содержащую букв a, e, i, o .

Лекция 12

Нисходящий синтаксический анализ. Основные понятия. Критерии принятия решений. LL(1)-грамматики. Рекурсивный спуск.

Синтаксический анализ

Синтаксический анализатор (syntax analyzer, parser) получает на вход результат работы лексического анализатора и разбирает его в соответствии с некоторой грамматикой. Эта грамматика аналогична грамматике, используемой при описании входного языка. Однако грамматика входного языка обычно не уточняет, какие конструкции следует считать лексемами.

Синтаксический анализ является одной из наиболее формализованных и хорошо изученных фаз компиляции.

После синтаксического анализа можно считать, что исходная программа преобразована в некоторое промежуточное представление. Некоторые распространенные формы промежуточного представления программы будут рассмотрены позже . Пока же мы остановимся на одной форме промежуточного представления, которая будет использована в нашем курсе, - на дереве разбора программы (иногда его также называют синтаксическим деревом). В дереве разбора программы внутренние узлы соответствуют операциям, а листья представляют операнды.

<<< < Предыдущая 1 2 34 / 124 5 6 7 8 9 10 11 12 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
10.05.20156.31 Mб14lec_08-03-01_2014.pdf
#
20.11.2019143.87 Кб3lekcii_marketingovye_kommunikacii.doc
#
21.11.2019148.99 Кб2Lektsia2.doc
#
17.04.2019256.51 Кб7Lektsia_10.doc
#
07.12.2018628.74 Кб2lektsia_10.doc
#
10.05.20151.46 Mб68Lektsia_11SistProg.doc
#
21.07.2019105.98 Кб3lektsia_11_PO.doc
#
03.08.2019118.78 Кб16Lektsia_12.doc
#
03.08.2019130.05 Кб2Lektsia_13.doc
#
17.04.2019105.98 Кб4Lektsia_14.doc
#
17.04.2019237.57 Кб3Lektsia_15nov.doc