Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Metodichka_po_lab_TOI.doc
Скачиваний:
53
Добавлен:
10.02.2015
Размер:
3.64 Mб
Скачать

1.3 Представление грамматики в виде графа

Граф грамматики в качестве вершин содержит цепочки, выводимые из начального символа. Ниже на рисунке дано представление грамматики , где{a,b,c}, {S}, {S→ aSa | bSb | c}.

1.5 Классификация формальных грамматик

Множество формальных грамматик можно разложить на классы в зависимости от ограничений, накладываемых на продукции. Такие ограничения формируют особые свойства грамматик и особые методы анализа и синтеза цепочек символов. Общепринятой классификацией грамматик и порождаемых ими языков является иерархия грамматик Хомского, содержащая четыре типа грамматик.

Грамматика типа 0- грамматика произвольного типа без каких-либо ограничений на цепочки символов. Продукции этой грамматики имеют вид:

.

В обеих частях продукции могут быть в произвольном порядке и любом количестве терминальные и нетерминальные символы, т.е.  V*, где верхним левым индексом «*» обозначено множество с пустым символом e, а знак "::=" означает: "...присвоить значение...". Такой тип грамматики порождает множество перечислимых языков, для которых существует перечисляющий алгоритм. Такой алгоритм может быть реализован на машине Тьюринга, являющейся классической моделью рекурсивной функции. Поэтому такие языки называют также рекурсивно-перечислимыми. Однако такой тип грамматики не нашел применения в языках программирования.

Пример 1. Пусть дана грамматика G1 = < VT; VH; P; J > , где

VT = { a; b } ; VH = { A;B;C;J };

P = { р1 : J ::= AbBb; р2 : J ::= AbJBb; р3 : Ab ::= Bba;

р4 : Bb ::= Cba; р5 : Cb ::= ba } .

Какие цепочки терминальных символов формирует грамматика ?

Рассмотрим левосторонний вывод:

J =>AbBb =>BbaBb =>CbaaBb =>baaaBb =>baaaCba = ( ba3)(ba2);

J =>AbJBb => BbaJBb => CbaaJBb => baaaJBb =>baaaAbBbBb => baaaBbaBbBb => baaaCbaaBbBb => baaabaaaBbBb => baaabaaaCbaBb =>

baaabaaabaaBb => baaabaaabaaCba => baaabaaabaabaa = (ba3)2(ba2)2;

J =>AbJBb => BbaJBb => CbaaJBb => baaaJBb => baaaAbJBb => baaaBbaJBb =>...=> baaabaaabaaabaabaabaa = (ba3)3(ba2)3; и т.д.

Грамматика G1 формирует множество цепочек, используя процедуру итерации:

L(G1) = { (ba3)i (ba2)i | i = 1;2;3;... }.

Пример 2. Пусть дана грамматика G2 = < VT; VH; P; J > , где

VT = { a; b } ; VH = { A;J } ;

P = { р1 : J ::= JAa | b; р2 : aA ::= Aa ; р3 : bA ::= ab }

Какие цепочки терминальных символов формирует грамматика ?

Используем также левосторонний вывод терминальных цепочек:

J => b;

J => JAa => bAa => aba;

J => JAa => JAaAa => bAaAa => abaAa => abAaa => aabaa = a2ba2;

J => JAa => JAaAa =>JAaAaAa => ... => aaabaaa = a3ba3; и т.д.

Грамматика G2 формирует множество цепочек, также используя процедуру итерации:

L(G2) = { aibai | i = 0;1;2;3;... }.

Грамматика типа 1 - это контекстно-зависимая грамматика или грамматика непосредственных составляющих (НС-грамматика). Второе название грамматики объясняется тем, что любую цепочку можно разложить на синтаксические составляющие (члены предложения естественного языка) и выполнить разбор каждой синтаксической переменной (части речи естественного языка) в составе синтаксической составляющей. В естественных языках для этого проводят грамматической разбор структуры предложения. В языках программирования - грамматический разбор структуры программы, что всегда необходимо при трансляции исходной программы на язык вычислительной машины.

Продукции этой грамматики имеют вид:

1212 ,

где AVH;

1, 2, V*,

1 левый контекст,

2  правый контекст.

Каждый шаг вывода состоит в замене одного вхождения нетерминального символа вхождением цепочки терминальных и/или нетерминальных символов. Эта замена обусловлена наличием левого и правого контекстов.

Для НС-грамматики существенным является исполнение условия:

1212

где |...| означает длину цепочки символов, заключенных между вертикальными линиями.

Это требует исполнения в каждом правиле второго условия:

.

Грамматики, в которых все правила обладают этими свойствами называют неукорачивающими.

Множество языков НС-грамматики является собственным подмножеством языков грамматики типа 0.

Для НС-грамматики возможны случаи:

1) 11когда 2 ;

2) 22 , когда 1 .

Для НС-грамматик также допустим лево- и правосторонний вывод, когда продукции грамматики применяются к самому левому или самому правому нетерминальному символу анализируемой цепочки.

Пример 3. Пусть дана грамматика G3 = < VT; VH; P; J > , где

VT = { a; b; c} ; VH = {B; C; J } ;

P = { р1 : J ::= aJBC | aBC; р2 : CB ::= DB;

р3 : DB ::= DC; р4 : DC ;;= BC; р15 : aB ::= ab;

р6 : bB ::= bb; р7 : bC ::= bc; р8 : cC ::= cc }.

Какие цепочки терминальных символов формирует грамматика ?

В каждом правиле есть либо левый, либо правый контексты.

Используем также левосторонний вывод терминальных цепочек:

J => aBC => abC => abc;

J => aJBC => aaBCBC => aabCBC =aabDBC => aabDCC => aabBCC => aabbCC => aabbcC => aabbcc = a2b2c2;

J => aJBC => aaJBCBC => ... => aaabbbccc = a3b3c3 и т.д.

Грамматика G3 формирует цепочки терминальных символов, используя операцию итерации:

L(G3) = { aibici | i = 1;2;3;... }.

Грамматика типа 2 - это контекстно-свободная грамматика (КС-грамматика). Правила этой грамматики не зависят от контекста, т.е. в левой части каждого правила находится только один нетерминальный символ, а в правой части цепочка терминальных и/или нетерминальных символов.

Продукции этой грамматики имеют вид:

A ::= ,

где V*.

Каждый шаг вывода связан с заменой в цепочке одного нетерминального символа на цепочку терминальных и/или нетерминальных символов.

Множество КС-языков при выполнении условий 1 , 2  и    является подмножеством НС-языков.

КС-грамматики наиболее эффективно описывают состав и структуру формального языка. Поэтому они нашли применение в большинстве языков программирования. Для унификации языков программирования были разработаны метаязыковые средства описания синтаксических конструкций. Особое место среди этих средств занимают формулы Бэкуса-Наура (БНФ).

Для КС-грамматик также удобен фиксированный способ вывода (лево- или правосторонний ).

Пример 4. Пусть дана грамматика G4 = < VT; VN; P; J > ,

где VT = { буква; цифра} ; VH = {A; B; J } ;

P = { р1 : J ::= JA | JB | A;

р2 : A ::= буква;

р3 : B ::= цифра }.

Какие цепочки терминальных символов формирует грамматики?

Для удобства доказательства сохраним левосторонний вывод:

J => A => буква;

J => JA => AA => буква буква;

J => JB => AB => буква цифра;

J => JA => JAA => AAA => ... => буква буква буква;

J => JA => JBA => ABA => ... => буква цифра буква;

J => JB => JAB => AAB => ...=> буква буква цифра;

J => JB => JBB => ABB => ...=> буква цифра цифра и т.д.

Грамматика G4 формирует следующие цепочки терминальных символов:

L(G4) = { буква { буква | цифра } }.

Такова грамматика для формирования идентификаторов большинства языков программирования.

Грамматика типа 3 (регулярная) - это линейная грамматика, правила которой содержат в правой части не более одного нетерминального символа.

Продукции этой грамматики имеют вид:

A ::= 1B2 или A ::= 

где 1, 2, V*\VN.

Продукция линейной грамматики называется праволинейной (леволинейной), если единственный нетерминальный символ в правой части продукции всегда находится крайним справа (слева).

Например, А ::= 1B - праволинейная продукция,

A ::= B2 - леволинейная продукция.

Если все продукции грамматики праволинейные или леволинейные, то грамматика также называется праволинейной или леволинейной. Каждой праволинейной грамматике соответствует эквивалентная ей леволинейная грамматика. В зависимости от типа грамматики различают праволинейные и леволинейные языки.

Языки линейной грамматики представляют собственное подмножество множества КС-языков.

Пример 5. Пусть дана грамматика G5 = < VT; VH; P; J >

где VT = {a; b; c } ; VH = { A; B; J; } ;

P = { р1 : J ::= Bb; р2 : A ::= Aa | a; р3 : B ::= Bb | Aac | ac }.

Какие цепочки терминальных символов формирует грамматика ?

Можно отметить, что все правила этой грамматики -леволинейные.

Проведем левосторонний вывод терминальных цепочек:

J  Bb  acb

Aacb  aacb

acbb  Bbb 

 



aacbb Aacbb  Aaacb  aaacb

   

aaacbb  Aaacb  

 Bbbb  acbbb





Грамматика G5 формирует цепочки вида:

L( G5 ) = { aicbj | i,j = 1;2;3;... }.

  1. Примеры решения задач

Пример 1. Приведите примеры не менее чем пяти языков в алфавите:

Σ={a,b,c,d,e}

Пример 2. Построить праволинейную грамматику для языка, состоящего из 1 и 0 с четным числом нулей и единиц.

Пример 3. Построить КС-грамматику, порождающую правильно расставленные скобки

Пример 4. Даны грамматики G1 = ({0,1}, {A,S}, P1, S) и G2 = ({0,1}, {S}, P2, S).

P1: S→0A1, 0A→00A1, A→ и P2: S→0S1 | 01. Определить языки грамматик и их типы.

Пример 5. Построить грамматику, порождающую язык L = {anbncn | n>0}. Получить вывод терминальной цепочки aaabbbccc.

  1. Задание

Для выбранной в соответствии с вариантом задания задачи:

  1. Разработать формальную грамматику Хомского G, порождающую цепочки языка L(G).

  2. Построить вывод заданной в варианте задания цепочки.

  3. Представить грамматику в виде графа.

  4. Определить класс, к которому принадлежит грамматика.

  5. Сделать выводы.

  1. Содержание отчета

  1. Определение понятия «Формальная грамматика Хомского».

  2. Определение алфавита терминальных символов.

  3. Определение алфавита нетерминальных символов.

  4. Определение начального символа.

  5. Определение правил вывода.

  6. Вывод заданной цепочки языка.

  7. Разработка графа грамматики.

  8. Определение класса грамматики.

  9. Анализ результатов и выводы.

  1. Варианты задания

Ниже даны варианты задания, в каждом из которых в качестве способа описания формального языка выбран алгебраический способ. Помимо алгебраического описания языка вариант задания включает цепочку, для которой должен быть построен вывод в грамматике.

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13.

14.

15.

16.

17. L(G) = {13n+2 0n | n≥0}, 1111111100;

18. L(G) = {0n 1m | n>m и n,m >0 }, 00000000011111;

19. L(G) = { anb3mcma2n | n>1 и m>1 }, aabbbbbbccaaaa.

  1. Список литературы

  1. Волкова И.А., Руденко Т.В. Формальные грамматики и языки. Элементы теории трансляции. / Учебное пособие для студентов II курса. Издание второе. - М: ВМиК МГУ, 1999.

  2. Пономарев В.Ф. Формальные языки и грамматики. / Учебное пособие. - Калининград: КГТУ, 1998.