Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Самарский национальный исследовательский университет им. ак. С.П. Королёва (бывш. СГАУ, СамГУ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лекции_Теория_формальных_грамматик.docx

Скачиваний:

Добавлен:

16.03.2015

Размер:

81.14 Кб

Скачать

☆

<<< < Предыдущая 1 2 34 / 44

Тема 4: свойства контекстно-свободных и автоматных языков.

Теорема об общем виде цепочек КС-языков и слов из него.
Определение операций над языками.
Операции над автоматными языками.
Операции над КС-языками.
Операции над контекстными языками.
Выводы для практики.
Неоднозначность контекстно-свободных грамматик.

Теорема об общем виде цепочек КС-языков (теорема о разрастании).

Для любого КС-языка Lсуществует такое натуральное числоp>0 что для любой цепочки, принадлежащей языкуL, длина которой большеp, существует хотя бы один вариант разбиения этой цепочки на 5 частей такой что выполняется условие теоремы.

Доказательство: в качестве pрассмотрим максимальную длину цепочки, полученную бесповторным деревом вывода. Каждый нетерминал используется 1 раз.

Sαβ²jφ²µ € L, в общем виде:αβⁱjφⁱµ € L

αAµ

βφ

Следствие 1: Для любого автоматного языкаLсуществует такое натуральное числоp, что для любой цепочки ψ €L, |ψ|>pсуществует хотя бы один вариант разбиения этой цепочки на три части такой что выполняется условие теоремы.

С учётом особенностей автоматных грамматик, положив часть цепочек ψ и µ, равные пустым цепочкам (см. теорему о КС-языках), получим доказательство следствия.

Следствие 2: язык цепочек видаxⁿyⁿz^w,n=(1,∞) нет ни одного варианта, удовлетворяющего условию теоремы.

При p=3, ψ =xxyyzz

x(1) = α,x(2) =β,y(1) =j,yz=φ,z= µ

или x(1) = α,x(2) =β,yy=j,z(1) =φ,z(2) = µ

xxxyyzyzz/€L

Максимальное число, которе можно получить из повторного дерева вывода: p=2.

xⁿyⁿ,n>1ψxxyy

x(1) = α,xy=β,y(2) =j

или x(1) = α,x(2) =β,yy=j

xxyxyy/€L

Следствие 3: любой конечный язык является автоматным.

Доказательство: если в качестве самой длинной цепочки взять L, то ни одна из цепочек языка не удовлетворяет условию теорему, а значит теорема верна.

Следствие 4: язык арфметических выражений не является автоматным языком.

Доказательство аналогично предыдущему. Парное количество чего-то и вложенность циклов – это контекстно-свободный язык.

Следствие 5: языки программирования в общем случае не являются КС-языками (но являются контекстными).

Например, каждая процедура имеет одинаковое число параметров в каждом месте где она упоминается.

Язык, требующий описания идентификаторов, длина которых может быть произвольной до их использования, также не является контекстно-свободным.

На практике идентификатора обрабатываются на этапе лексического анализа, а контроль за их использованием выполняется в виде семантических процедур. Аналогично с описанием процедур.

Определение операций над языками.

Смысл: описываются маленькие языки, и, выполняя маленькие процедуры над этими языками, получают грамматики, которые порождают данные языки.

Операции, допустимые над множествами:

Объединение: L=L₁⋃L₂= { α | α €L₁vα €L₂}
Пересечение: L=L₁⋂L₂= { α | α €L₁л α €L₂}
Разность: L=L₁\L₂= { α | α €L₁л α /€L₂}
Дополнение: L=L₁–L₂= { α | α €L₁vα €L₂}
Конкатенация: L₁®L₂= { α =βj|β€L₁,j€L₂}
Итерация: L* = {φ* |φ€L}
Обращение: L^R= {φ^R|φ€L}L= {abc,bm,aca}
Подстановка: L₁_aL₂– подстановка в первый язык вместо терминального символа «a» любой цепочки второго языка:
1. L₁ = {cab, al}
2. L₂ = {a, b}
3. L^L2_1a= {cab, cbb, al, bl}

Задания к контрольной:

Составление автоматных грамматик.
Составление контекстно-свободных грамматик.
Программа-анализатор.
Конечные автоматы.

Операции над автоматными языками.

Класс называется замкнутым относительно некоторых операций, если в результате выполнения операций не происходит выхода за рамки класса.

Теорема: автоматные языки замкнуты относительно операций объединения, конкатенации, итерации, обращения, подстановки, пересечение, дополнения и разности.

Последние две операции рассматривать не будем. Все остальные рассматриваются на графе.

Операция объединения.

S₁

S₂

A₂

C₂

F₂

D₂

B₂

A₁

C₁

D₁

B₁

F₁

В операции объединения выполняется индексация нетерминалов обеих грамматик, добавляются вершины SиF. дуги, идущие изS₁иS₂дублируются и направляются из вершиныS. Аналогично дублируются дуги, идущие вF₁иF₂и направляются вF.F₁иF₂удаляются вместе с входящими в них дугами.S₁иS₂можно удалить, если отсутствуют петли и возвраты в эти вершины.

Операция конкатенации: после индексации нетерминалов обеих грамматик выполняется слияние вершин в вершину F₁иS₂.
S₁

A₁

C₁

F₁

D₁

B₁

S₂

A₂

C₂

F₂

D₂

B₂

A₁

B₁

C₁

D₁

Операция итерации: все дуги, идущие в F, дублируются и направляются вS.

Операция обращения: расщепляем SнаS’ иS’’ (если есть петли), получив вершину, в которую не будет ничего входить – будут только исходящие дуги. Стрелки ставим в обратном направлении.

S’

A₁

B₁

C₁

D₁

A₁

B₁

C₁

D₁

При наличии возвратов и петель для Sвыполняется операция расщепления исходной вершины на две.S’ дублирует дуги, исходящие изS’’. После этогоS’ становитсяF,FстановитсяSи меняется ориентация всех дуг на противоположные.

Операция обращения: берётся столько экземпляров автоматных грамматик, сколько символов, вместо которых происходит подстановка:

S₁^’’

A₁

C₁

F₁

D₁

B₁

S₀

S₂^’’

A₂

C₂

F₂

D₂

B₂

S₁^’

S₂^’

F₀

A₀

C₀

D₀

B₀

Грамматика, в которую выполняется подстановка, индексируется нулём. Каждый экземпляр, в который подставляется грамматика, индексируется от 1 до i, гдеi– число буквAвL₁. Если подставляемая грамматика имеет циклы или возвраты в начальные вершины, для каждого экземпляра выполняется операция расщепления начальной вершины. После этого выполняется слияние вершиныS_i’ с вершинами грамматикиG₁, из которых исходят дуги, помеченныеA. АналогичноF_iи вершины, в которые входят дуги, помеченныеA. После этого дуги, помеченныеAграмматикиG₁, исключаются.

Операция пересечения выполняется не на графах, а на грамматике:

G₁ = <V_N1, V_T1, S₁, R = {A₁  aB₁}>

G₂ = <V_N2, V_T2, S₂, R = {A₂  aB₂}>

G₁⋂ G₂ = <V_N1⋂ V_N2, V_T1⋂ V_T2, S₁⋂ S₂, R₁ ⋂ R₂ = {A₁  aB₁⋂ A₂  aB₂}>

G₁: S₁  aB₁ и B₁  cF₁ | αF₁

G₂: S₂  aK₂ | cK₂ и K₂  cF₂

G₁⋂ G₂: <S₁S₂>  a<B₁K₂> и <B₁S₂>  c<F₁K₂> - тупик, можно убрать и <B₁K₂>  c<F₁F₂>.

_{12
октября 2013 г.}

Практика №3.

Задание 1: Опишите словами множество состояний автоматов:

\	A	B	C
0	B	B	C
1	A	C	C
	0	0	1

\	A	B	C
0	B	C	C
1	C	B	C
	0	1	0

\	A	B	C	D
0	B	D	C	D
1	C	B	D	D
	0	1	1	0

\	A	B	C	D
0	B	D	C	D
1	A	C	D	D
	0	0	1	0

Автоматы детерминированные, так как в каждом состоянии только один символ.

Решение…

Для 1 таблицы:

1ⁿ0ⁿ1 – произвольное число нулей и единиц, которых может не быть.

m=(0, ∞).

n=(0, ∞).

Для 2 таблицы:

01ⁿ– произвольное число нулей и единиц, которых может не быть.

n=(0, ∞).

Для 3 таблицы:

01ⁿ– произвольное число нулей и единиц, которых может не быть.

10^m

m=(0, ∞).

n=(0, ∞).

Для 4 таблицы:

1ⁿ010^m

m=(0, ∞).

n=(0, ∞).

Рассмотрим недетерминированные автоматы:

\	A	B	C
0	A,B		C
1		B,C
	0	0	1

\	A	B	C
0	B
1		C,A
	0	0	1

\	A	B	C	D
0	B	C,D	B
1		B
	0	0	0	1

Для 1 таблицы:

0ⁿ1^m0^k– произвольное число нулей и единиц, которых может не быть.

m=(1, ∞).

n=(1, ∞).

k=(0, ∞).

Для 2 таблицы:

0ⁿ1ⁿ– произвольное число нулей и единиц, которых может не быть.

n=(1, ∞).

Для 3 таблицы:

Из нуля можем попасть в B(0), изB– вCиD(00), оттуда – вB(0 или 00).

0(1ⁿ(00)^m)^k0

n=(0, ∞).

m=(0, 1).

k=(1, ∞).

Задание 2: Построить конечный автомат с входным алфавитом (0,1), который допускает следующее множество цепочек:

Все возможные цепочки, включая пустую.
Все цепочки кроме пустой.
Ни одной входной цепочки (автомат будет работать и ничего не распознавать).
Одну входную цепочку: 1,0,1.
Две входные цепочки: 0,1 и 0,1,0,0.
Входные цепочки, начинающиеся с 0 и заканчивающиеся на 1.
Все цепочки, состоящие из нулей и не содержащие единиц.
Все цепочки, содержащие в точности 1,1,1. Нулей может быть сколько угодно.
Все цепочки, в которых перед и после каждой единицы стоит 0.

\	A
0	A
1	A
	1

2. Aне допускает обрыв цепочки.

\	A	B
0	B	B
1	B	B
	0	1

3. Распознаёт пустую цепочку.

\	A
0
1
	0

\	A	B	C	D
0		C
1	B		D
	0	0	0	1

\	A	B	C	D	E
0	B		D	E
1		C
	0	0	1	0	1

\	A	B	C
0	B	B
1		B,C
	0	0	1

\	A	B	C	D
0	A	B	C	D
1	B	C	D
	0	0	0	1

\	A	B	C	D
0	A,B		D	A
1		C
	1	0	0	1

Задание 3:Построить детерминированный автомат, эквивалентный следующему недетерминированному.

\	1	2	3
a	2,3		1
b	2	1	3
	0	0	1

В 1 столбец вставляется новое состояние, включающее все начальные состояния НДА (если на пересечении строк и столбцов имеется несколько состояний и у которого несколько начальных состояний).

\	{1}	{2,3}	{2}	{1,3}	{1,2,3}
a	{2,3}	{1}		{1,2,3}	{1,2,3}
b	{2}	{1,3}	{1}	{2,3}	{1,2,3}
	0	1	0	1	1

0 - без обрыва цепочки, 1 - допускает обрыв цепочки.

Если в имени новых состояний хотя бы одно состояние допускало обрыв цепочки, то всё состояние допускает обрыв.

Заменяем:

{1} – 1, {2,3} – 2, {2} – 3, {1,3} – 4, {1,2,3} – 5

Самостоятельно привести недетерминированные в детерминированные.

______________________________

Несколько слов по построению анализатора:

if<условие>then<оператор 1> [ELSE<оператор 2>];

<условие> ::= {<идентификатор>|<константа>} <оператор отношения <,>,= и т.п.> {<идентификатор>|<константа>}

<оператор 1> ::= <идентификатор>:= {<идентификатор>|<константа>} <арифметическая операция> {<идентификатор>|<константа>}

Граф:

0 if0условие0then0оператор 10;0else0оператор 20;(F).

Борьба с пробелами:

0 _1 состояние_1 состояние (пока есть пробелы)условие…

0 идентификатор или константа0оператор отношения0идентификатор или константа⊥

_{26
октября 2013 г.}

Практика №3.

SaA|aB|bB|bD

AaB|aS|bD

BcS|cB|bD|bF’

DdD|dB|bB|bA|aF’|cF’

F’  ⊥F

<F’>  ⊥<F>

<DF’>  a<AB>|b<BDF’>|c<BS>

<DF’>  d<BD>|b<AB>|b<F’>|c<F’>|⊥<F>

<BSF’>  a<AB>|b<BDF’>|c<BS>|⊥<F>

<DF’AB>  a<BSF’>|b<DF’AB>|d<BD>|c<BSF’>|⊥<F>

<BDF’>  c<BSF’>|b<DF’AB>|d<BD>|a<F’>|c<F’>|⊥<F>

<S> = S, <AB> = A, <BD> = B; <BS> = C; <DF> = D; <BSF’> = E; <DF’AB> = G; <BDF’> = H; <F’> = F’; <F> = F.

S  aA|bB

A  aC|bD|cC

B  cE|bG|dB|aF’

C  aA|bH|cC

D  dB|bA|aF’|cF’|⊥F

E  aA|bH|cC|⊥F

G  aE|bG|dB|cE|⊥F

H  cE|bG|dB|aF’|cF’|⊥F

Задача №2: устранить и исключить тупики из следующих правил…

S  aBcD|kLMp

B  cLpDq|pDc|f

D  fDr|f

F  a|b

L  fM

M  Lk|pMLc

K  rF

Шаг 1.

X₀ = V_T

X₁ = {B,D,F}

X₂ = {B,D,F,S,K}

X₃= {B,D,F,S,K}

L,M– циклический тупик внешнего типа, поскольку изLмы никуда не попадаем кромеLиMи также изM– только вLиM.

Шаг 2:

DfDr|f

Fa|b

KrF

Y₀= {S} – множество нетерминаловS.

Y₁= {S,B,D} – множество нетерминалов, в которые можно попасть не более чем за 1 шаг изS.

Y₂= {S,B,D}

K,F– тупики внутреннего типа.

Задача №3.

SAB|BC|kL

BBS|AL

CQS|dC

MxN|yM|zS|h

A aA|bL|c

L  cB|f

Q  qQ|aC

N  xC|a|bM

Шаг 1.

x₀ = {V_T}

x₁= {M,A,L,N} – вMесть терминалh.

x₂ = {M,A,L,N,S,B}

x₃ = {M,A,L,N,S,B}

Q,C– циклический тупик внешнего цикла.

Шаг 2.

S  AB|BC|kL

B  BS|AL

A aA|bL|c

y₀ = {S}

y₁ = {S,A,B,L}

y₂= {S,A,B,L}

M,N– циклический тупик внутреннего типа.

Задача №4: устранить аннулирующее правило из следующих грамматик:

S  aCDe|Kp

C  dSa|ε

D  dD|DD|a|fK|ε

K a|b

Шаг 1.

x₀ = ε;

x₁ = {C,D}

x₂ = {C,D}

S € x₂  ε € L

S  aCDe|aDe|aCe|ae|Kp

C  dSa

D  dD|d|DD|D|a|fK

Ka|b

Задача №5: устранить аннулирующее правило из следующих грамматик:

S  aSbS|bSaS|ε

Шаг 1.

x₀ = ε

x₁ = {S}

S € x₁

ε € α

S  S₁|ε

S₁  aS₁BS₁|bS₁aS₁|abS₁|aS₁b|ab|baS₁|bS₁a|ba

Задача №6: устранить аннулирующее правило из следующих грамматик:

S  ABC

B  CC|a

A  BB|ε

C  AA|b

Шаг 1.

x₀ = ε

x₁ = {A}

x₂ = {A,C}

x₃ = {A,C,B}

x₄ = {A,C,B,S}

Шаг 2.

Делается замена и добавляется правило SS₁.

S₁  ABC|AC|AB|BC|A|B|C

B  CC|a|C

A  BB|B

C  AA|b|A

Задача №7: устранить цепные правила из грамматики.

S  S+T|T

T  T*F|F

F  (S)|a

Шаг 1.

S  S+T|T*F|(S)|a – ответ.

TT*F|(S)|a– подставляем вместоF: (S)|a

F(S)|a

Задача №8: найти приведённую грамматику, эквивалентную следующей…

S  A|B

B  D|E

A  C|D

C  S|a|ε

DS|b

ES|c|ε

Приведённой является грамматика, в которой нет тупиковых, обобщённых и цепных правил.

Шаг 1.

x₀=V_T

x₁= {C,D,E} – там, где есть терминальные символы.

x₂ = {C,D,E,B,A}

x₃ = {C,D,E,B,A,S}

Нет тупиков внешнего типа. Изо всех правил можно перейти в другое.

Шаг 2.

y₀= {S}

y₁= {A,B} – куда попадаем изSне более чем за 1 шаг.

y₂= {S,A,B,C,D,E}

Нет тупиков внутреннего типа аналогично.

Шаг 3.

x₀=ε

x₁= {C,E}

x₂ = {C,E,A,B}

x₃ = {C,E,A,B,S}

x₄ = {C,E,A,B,S,D}

S € x₄  ε € L.

S  a|b|c| ε.

_{9
ноября 2013 г.}

Практика №4.

Задание №1: устранить левую рекурсию.

S  AB

A  Aa|Ab|d|c

B  qK|rB|Bf|Bg

K  aS|b

S  AB

A  dA’|cA’

A’  aA’|bA’|ε

B  qKB’|rBB’

B’  fB’|gB’|ε

k  aS|b

Свойства языков.

Задание №2: доказать что язык автоматный.

{0ⁿ10ⁿ},n>= 1;

ψ=αβ¥,p= 3;

αβ^j¥ €α

ψ= 00100, 00 + 10 + 0

Размножаем: 00 (α) + 1010 (β²) + 0 (¥)

Или: 00 (α) + 11 (β²) + 00 (¥)

Значит не существует ни одного варианта, удовлетворяющего условию теоремы, и язык не автоматный.

Задание №3: {aⁱbⁱc^j},i,j>= 1;j<=i; - доказать что цепочка не принадлежит КС-языку. Для КС-языка нужно разбить цепочку уже на 5 частей

Рассмотрим цепочку, у которой i=j:

αβ¥φµ:

ψ = aabbcc,a(α) +ab(β) +b(¥) +c(φ) +c(µ):

Размножаем: a + abab + b + cc + c € L

ψ = aabbcc, a (α) + a (β) + b (¥) + b (φ) + cc (µ):

aa + bb + b + cc + c € L

Задание №4: выполнить все допустимые операции над следующими автоматными грамматиками:

G₁: S  aA|bB|c

A  aS|a

S  B

G₂: S  aA

A  bA|bC

C  aA|cS|d

Объединение
Конкатенация
Итерация для 1 грамматики
Обращение для 2 грамматики
Подстановка первой вместо второй
Пересечение
Первые пять выполняем как графы на страницах 21-25.
Шестая операция: ищем общие нетерминалы между каждыми группами:
<S₁, S₂>  a <A1, A2> - тупик // из S₁ или S₂ попадаем в A1 A2.
<S₁, A₂>  b <B₁, A₂> | b <B₁, C₂>
<S₁, C₂>  a <A₁, A₂> | c <F₁, s₂>
<A₁, S₂>  a <S₁, A₂> | a <F₁, C₂>
<A₁, C₂>  a <S₁, A₂> | a <F₁, A₂>
<B₁,A₂>b<F₁,A₂> |b<F₁,C₂>
Ответ: G₁в объединении сG₂дают пустое множество.
Грамматики предшествования Вирта – к следующей
Лекция №5.
Контекстно-свободные языки замкнуты относительно операций объединения, конкатенации, итерации, обращения и подстановки, и не замкнуты относительно операций пересечения, дополнения и разности (автоматные языки замкнуты относительно всех операций).
Имеются языки L₁(G₁) и L₂(G₂).
G₁ = (V_T1, V_N1, R₁, S₁)
G₂ = (V_T2, V_N2, R₂, S₂)

Объединение: G₁ v G₂ = (V_T1v V_T2, V_N1 v V_N2 v {S}, R₁ v R₂ v {S  S₁|S₂}, S)
Конкатенация: G₁ ® G₂ = (V_T1v V_T2, V_N1 v V_N2 v {S}, R₁ v R₂ v {S  S₁S₂}, S)
Итерация: G₁* = (V_T1, V_N1 v {S}, R₁ v {S  S₁S|S₂}, S)
1. S  SS₁|S₁
2. S  SS|S
Обращение: G₁^R= (V_T₁,V_N₁,R₁^R,S₁), гдеR₁^R– правила с обращёнными правыми частями правил вывода.

R₁A  α A  abCAm|ba
R₁^R A  α^R A  maCba|ab

G₁^G2_a = ((V_T1\{a}) v V_T2, V_N1 v V_N2, (R₁ \ {A  αaβ}) v {A  αS₂β}, S₁)

Если имеются L₁= {a^jb^jcⁱ}L₁⋂L₂= {aⁱbⁱcⁱ}не КС-язык
Если множества не замкнуты относительно операции пересечения, то они не замкнуты относительно операции дополнения и разности.
Операции над контекстными языками:
7 декабря 2013 г.
Практика №7.
Грамматика предшествования по Флойду.
Выполнить разбор правильной и неправильной цепочек:
S  |A.B|
A aA|a
B  (B)|C
C  0|…|0|0C|…|9C
U L R
S | |
A a a
B (, 0|…|9 ), 0|…|9
C 0|…|9 0|…|9
S1/S2 | . a ( ) 0|…|9
| = <
. = < <
A > <
( < = <
) > >
0|…|9 > > <

- нетерминал, затем терминал

<<< < Предыдущая 1 2 34 / 44

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
15.11.2018488.45 Кб10ЛЕКЦИИ_все_инМен.doc
#
16.03.2015532.48 Кб60лекции_Интегр_устр_рэ.doc
#
04.05.2019634.88 Кб4ЛЕКЦИИ_ИЭТ_ЗАОЧНИКИ 11лист.doc
#
16.03.2015642.56 Кб12ЛЕКЦИИ_МИ книжного рынка2.doc
#
16.03.2015641.02 Кб16ЛЕКЦИИ_МИ книжного рынка2.doc
#
16.03.201581.14 Кб79Лекции_Теория_формальных_грамматик.docx
#
18.11.20192.07 Mб10ЛЕКЦИиВсе.DOC
#
12.11.201934.92 Кб0Лекция 1 по Правоведению.docx
#
16.03.201517.78 Кб21лекция 14 (возможно).docx
#
16.03.201524.95 Кб21лекция 17.docx
#
07.06.2015380.93 Кб25Лекция 2Бюджетный процесс в муницобразовании.doc