Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Самарский национальный исследовательский университет им. ак. С.П. Королёва (бывш. СГАУ, СамГУ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Компиляторы.doc

Скачиваний:

Добавлен:

04.11.2018

Размер:

5.13 Mб

Скачать

☆

<<< < Предыдущая 11 12 13 14 15 16 17 18 19 20 21 2223 / 4223 24 25 26 27 28 29 30 31 32 33 34 35 > Следующая >>>

Xy, если  u  xy

То есть xy , если они стоят рядом в правой части какой-либо продукции именно в отмеченном порядке (x, а сразу следом за ним y).

X  y, если  u  xU1)  (y  l(u1))

Если в правой части продукции стоит символ x (терминал или нетерминал), а следом за ним нетерминал U₁, то x будет  всех левых U₁ (L(U₁)).

X  y, если  (u  u1y)  (X  r(u1)) or

 (U U₁U₂)  (x  R(U₁))  (y  L(U₂))

Если в правой части какой–либо продукции указан нетерминал U₁, а следом за ним терминал x (напомним, что разбор канонический), то все правые символы U₁ (R(U₁)) будут  x. И далее, если в правой части продукции два нетерминала U₁ и U₂ стоят рядом, то все самые правые символы U₁ (R(U₁)) будут  левых символов U₂ (L(U₂)).

# b ( a a ) b #

   

# b ( M a ) b #

  

# b ( L b #

 

# b M b #

 

# S #

Рис. 5.10

Как использовать полученные отношения? Если между парой символов более одного отношения предшествования, то они бесполезны. Если же не более одного, то они позволяют достаточно просто найти основу.

Для любой сентенциальной формы x₁. . .x_n основой является самая левая подцепочка x_j. . . x_i, такая что x_j
–₁ x_j, x_jx_j
+₁, ..., x_i
-1 x_i , x_i  x_i_{+ 1} . 

Пример 5.10. На рис. 5.10 представлены шаги свертки цепочки b(aa)b к начальному символу грамматики S. Основы, получаемые на каждом шаге свертки, выделены здесь курсивом и подчеркнуты. Для осуществления последней свертки к цепочке добавляется ограничитель слева и справа (x₀ и x_n). В качестве символа ограничителя здесь взят символ # и предполагается, что #  x и x  # для любого x     из G. 

Контекстно–свободная грамматика G называется грамматикой простого предшествования, или грамматикой (1,1) предшествования или грамматикой предшествования Вирта если:

грамматика G однозначно обратима, то есть никакие два правила грамматики не имеют одинаковых правых частей;
между любыми двумя символами грамматики существует не более одного отношения предшествования. 

5.2.1. Алгоритм Вирта–Вебера для анализа языков простого предшествования

При практическом применении отношений предшествования для распознавания предложений языка потребуется способ компактного представления отношений. Обычно этой цели служит матрица P, элементы которой принимают значения:

P[i,j] = 0, если x_iи x_j несравнимы (x_iy_j);

P[i,j] = 1, если x_i x_j ;

P[i,j] = 2, если x_ix_j ;

P[i,j] = 3, если x_i x_j .

Для грамматики предшествования такое представление возможно, так как известно что между любыми двумя символами грамматики определено не более одного отношения. Таким образом, под каждый элемент матрицы можно отвести всего два разряда, но для того чтобы не выполнять лишних действий на выделение разрядов следует, видимо, использовать байтовый массив.

Сами правила грамматики должны располагаться в таблице, имеющей такую структуру, которая позволяет по полученной основе найти правило, содержащее данную основу в качестве правой части продукции, а затем указать соответствующую левую часть.

Неформально работу алгоритма Вирта–Вебера, а именно Н. Виртом и Х. Вебером были определены отношения простого предшествования и данный алгоритм в 1966 году, можно представить следующим образом. Символы входной цепочки просматриваются слева направо и заносятся в магазин (стек) до тех пор, пока не окажется, что верхний символ стека находится в отношении  к следующему входному символу. Это означает, что верхний символ стека является хвостом основы и, следовательно, вся основа уже в стеке. Затем полученную основу находят в списке правил грамматики и заменяют тем нетерминалом, из которого она выводится. Процесс повторяется до тех пор, пока в стеке не окажется символ S (начальный символ грамматики) и следующим входным символом станет ограничитель цепочки (в нашем случае – #).

На рис. 5.11 представлена функциональная схема данного алгоритма. Здесь C – стек, Т – входная цепочка, i – номер (позиция) верхнего символа в стеке, k – текущая позиция входной цепочки. Ограничимся небольшими комментариями к отдельным блокам или их группе, используя номера блоков из схемы:

1). В стек заносится ограничитель цепочки – # и индексам по стеку и входной строке присваиваются начальные (0–ые) значения.

2) – 3). Если между символом из вершины стека – C[i] и очередным входным символом – T[k] отношения не определены, то сообщить об ошибке и завершить работу. В противном случае перейти к блоку 4.

4) – 5). Ищется хвост основы. До тех пор, пока между C[i] и T[k] не обнаружится отношения , текущий входной символ помещается в стек, извлекается следующий входной символ и осуществляется переход к блоку 2. Если хвост основы найден (C[i]  T[k]), то переходим к блоку 6.

6) – 8). Осуществляется поиск головы основы в стеке. На нее будет указывать индекс j.

9). Найденная основа ищется среди правых частей продукций заданной грамматики. Если поиск успешен, то осуществляется переход к блоку 10, иначе – к блоку 12.

10) – 11). Основа в стеке заменяется нетерминалом U – левой частью правила, обнаруженного в блоке 9. Затем выполняется семантическая подпрограмма, связанная с данным правилом грамматики и осуществляется переход к блоку 2.

12)–14). Сюда мы попадаем, когда обнаруженная основа ни к чему не приводится. Это может случиться тогда, когда в стеке кроме левого ограничителя цепочки записан начальный символ грамматики и очередной входной символ – правый ограничитель. В этом случае вся цепочка была свернута к начальному символу грамматики, исходная цепочка принадлежит рассматриваемому языку и алгоритм завершает работу сообщив об успешном окончании. В противном случае, для найденной основы просто не обнаружено соответствующего правила грамматики, и алгоритм также завершит работу, сообщив об ошибке.

Пример 5.11. На рис. 5.12 разобрана по шагам работа изложенного алгоритма для правильной цепочки b(aa)b языка из примера 5.8 с матрицей предшествования с рис. 5.9 б.

Шаги

С₀

С₁

С₂

С₃

С₄

С₅

Отношение

Т_k



(

)



(

)

(



)

(



)

(

)

(

)

(

)



(



Рис. 5.12

На рис. 5.13 а представлен пример разбора ошибочной цепочки babb, где причиной ошибки является отсутствие отношений между символами b и b, а на рис. 5.13 б показан пример цепочки ba , где ошибка возникает из–за отсутствия обнаруженной основы bM среди правых частей правил грамматики. 

Завершая обсуждение алгоритма Вирта–Вебера, заметим, что в нем и других подобных распознавателях есть одно очень привлекательное свойство: нет необходимости хранить в памяти одновременно всю цепочку входных символов (если только грамматика не из ряда вон выходящая). Символы считываются с входного носителя по одному и заносятся в стек, но после редукции основы те символы, что входили в нее исчезают. Всю цепочку приходится хранить в памяти только в том случае, когда основа находится в правом конце цепочки, но грамматики языков программирования никогда не строятся подобным образом.

<<< < Предыдущая 11 12 13 14 15 16 17 18 19 20 21 2223 / 4223 24 25 26 27 28 29 30 31 32 33 34 35 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
18.08.20191.08 Mб6Коблова Настя.doc
#
16.03.20152.1 Mб73когерентная оптика.doc
#
21.08.201987.55 Кб3КОД.doc
#
07.06.2015291.63 Кб13кодекс спортивного что где когда.pdf
#
16.03.2015248.32 Кб5КОЛЛЕКТИВНЫЙ ДОГОВОР.doc
#
04.11.20185.13 Mб99Компиляторы.doc
#
07.06.2015151.04 Кб28КомплЗИконЧасть1.doc
#
07.06.2015286.72 Кб46КомплЗИконЧасть2.doc
#
16.03.20153.47 Mб43Компоненты и корпуса ИМС.doc
#
07.06.20151.57 Mб46Кон И.С. В поисках себя.doc
#
16.03.20151.45 Mб49Конспект леккций по экономике.doc