Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Томский Государственный Университет Систем Управления и Радиоэлектроники

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

сиаод_ответы_16_79.doc

Скачиваний:

211

Добавлен:

11.05.2015

Размер:

7.84 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1920 / 2520 21 22 23 24 25 > Следующая >>>

69 Алгоритм Кнута-Морриса-Пратта.

Пусть дан текст в виде массива T[n] и образец (то что ищем) P[1…m]; mn. Символы принадлежат алфавиту в бинарном коде; в текстовом файле.

Р входит в Т со сдвигом S, если T[S+1…S+m]=P[1…m]; S от 0 до n-m, такой сдвиг называется допустимым.

#T=abcabaabc;

P=abaa;

Pabaa, сдвиг S=3.

Пусть дана строка символов X[1…n], тогда для любой пары i, j; 1 определяем подстроку X[i…j]=X[i] X[i+1]…X[j].

Будем говорить, что подстрока X[i…j], начинается с позиции i и её длина равна j-i+1, если величина меньше чем n, то подстрока называется собственной подстрокой строки X.

(сигма) X=

Для произвольного целого j от 0 до n подстрока X[1…j] называется префиксом подстроки.

Если j<n собственный префикс подстроки X.

Для произвольного целого i от 1 до n+1 подстрока X[i…n] называется суффиксом строки X. Если i>1 то подстрока называется собственным суффиксом X.

Например, X=abaab

-префиксы a, ab, aba, abaa, abaab;

-суфиксы b, ab, aab, baab, abaab=X.

Алгоритм поиска образца:

Алгоритм NSM (T[1…n], P[1…m])

for S=0 to n-m do;
if P[1…m]=T[S+1…S+m] then;
printf “подстрока Р входит в Т”.

Вычислительная сложность: O((n-m+1)m).

Алгоритм КМР для поиска:

Префикс функция ассоциирующаяся с образом Р несет информацию, где в Р встречаются префиксы строки, использование этой информации не считывает заведомо не подходящие сдвиги.

#Т=bacbababababcbab

P=ababaca, сдвиг = 4

T[S+1…S+q]=P[1…q]

Некоторые последующие сдвиги будут недостимыми.

CPF(p[1..m])

s[1]←0
for q=2 to m do
k←s[q-1]
while (P[q]≠P[k+1]) and (k>0) do
k←s[k]
if (P[q]≠P[k+1] and (k=0) then s[q] ←0
else s[q] ←k+1
end for
return s

KMP(T[1..n],P[1..m])

s←CPF(P)
q←0
for k=1 to n do
while T[k]≠P
q←s[q]
if T[k]=P[q+1] then
q←q+1
if q=m then
printf “Образец входит со сдвигом”,k-m
q←s[q]
end for

70 Поиск подстрок. Алгоритм Бойера-Мура.

Использование алгоритма Кнута-Морисса-Пратта в большинстве случаев поиска в обычных текстах весьма незначителен. Метод же, предложенный Р. Боуером и Д. Муром в 1975 г., улучшает обработку самого плохого случая.

БМ-поиск основывается на необычном соображении сравнение символов начинается с конца слова, а не с начала. Как и в случае КМП-поиска, слово перед фактическим поиском трансформируется в некоторую таблицу. Пусть для каждого символа x из алфавита величина dx расстояние от самого правого в слове вхождения x до правого конца слова. Представим себе, что обнаружено расхождение между словом и текстом. В этом случае слово сразу же можно сдвинуть вправо на dpM-1 позиций, т.е. на число позиций, скорее всего большее единицы. Если несовпадающий символ текста в слове вообще не встречается, то сдвиг становится даже больше, а именно сдвигать можно на длину всего слова.

Например,

T=ABCABCABFABCABD

P=ABCABD (сравниваем то что подчеркнуто, идем с конца, не совпало D с C, сдвиг =3, чтоб С=С)

ABCABD (не совпало D и F, так как F нет в образце)

ABCABD(полное совпадение слово найдено)

CLOF(p[1..m], sum) sum это значок суммы

for all a sum do
l[a]←0
for k=1 to m do
l[P[k]] ←k
return l

CGSF(p[1..m])

s←CPF(P)
P’ ← обращение строки P
S’ ← CPF(P’)
For j=0 to m do
Y[j] ←m-s[m]
For k=1 to m do
J ← m-s’[k]
Y[j] ← min(y[j],k-s’[k])
End for
Return y

BM(T[1..n],P[1..m])

L ← CLOF(P,m,sum)
Y ← CGSF(p,m)
S ← 0
While S<=n-m do
k←m
while (k>0) and (P[k]=T[S+k]) do
k←k-1
if k=0 then
printf “Образец со сдвигом”,S
s←s+y[0]
else s←s+max(y[k],k-y[T[s+k]])
end while

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1920 / 2520 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.11.2019508.42 Кб1сверт 6.doc
#
11.11.2019253.95 Кб3сводка доп разделов.doc
#
11.05.20152.37 Mб11Семинар по теме 1..doc
#
11.05.2015179.2 Кб19Семинарские занятия по Правоведению.doc
#
11.05.2015288.77 Кб30семинары и экзам. вопросы по истории Отечества.doc
#
11.05.20157.84 Mб211сиаод_ответы_16_79.doc
#
11.05.20152.17 Mб792Силич М.П. МиАБ. Учебник.pdf
#
11.05.2015946.54 Кб167системы искусственного интеллекты часть1.pdf
#
11.05.20153.93 Mб205системы искусственного интеллекты часть2.pdf
#
11.05.2015220.03 Кб19Скалярный анализатор.docx
#
11.05.2015159.57 Кб27Смирнова_КИ_-_ПМиН_(УМПпВКП__2007).pdf