Структуры данных для непересекающихся множеств (отношения эквивалентности). [4 гл.21]

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казанский федеральный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

lekt1_sd4_1.doc

Скачиваний:

Добавлен:

12.03.2015

Размер:

2.44 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1920 / 2220 21 22 > Следующая >>>

Структуры данных для непересекающихся множеств (отношения эквивалентности). [4 гл.21]

Основные принципы организации таких структур данных и методов работы с ними были проиллюстрированы во введении (Пример 3 Связность).

Отметим, что представление таких семейств множеств лесом деревьев позволяет выполнять (в префиксном режиме) последовательность n операций «Объединить-Найти» за почти линейное время благодаря двум основополагающим методам (важным и в других приложениях, как методы для хороших алгоритмов):

Вливание меньшего множества в большее. Это позволяет поддерживать приемлемую сбалансированность деревьев по их объему (а в результате и по длине путей).
Сжатие пути. Такая перестройка данных позволяет уменьшать длину путей в деревьях за счет увеличения их ширины, а значит уменьшать время доступа к листьям. Если удается сбалансировать время, затрачиваемое на такую перестройку, с общим расходом ресурса времени (например, за счет обоснованного выбора моментов, когда такую перестройку делать), то удается получить хорошие характеристики алгоритма по общему времени.

Рандомизированные структуры данных.

Идея использовать в разработке алгоритмов статистические основания (соображения) удивительно плодотворно себя проявляет^²². Рандомизированные структуры данных полностью ставят на удачу, но статистически хорошо обоснованную. Если для какой-то структуры данных оценка времени в среднем оказывается хорошей, то вместо ставки на случайность входной последовательности можно встроить случайность в алгоритм построения (и реорганизации) этой структуры данных. Особую привлекательность этот прием получает, если исходная структура данных проста и легко реализуема.

Хеш-таблицы. [4 гл.11; 3 гл.14; 7 п.4.7-8]

Хеш-таблица – это структура данных, предназначенная для хранения и поиска данных с ключом.

Пусть на входе последовательность длины n обрабатываемых данных (с ключами). Пусть хеш-функция h(k) по значению ключа k дает целое в интервале [0..m), причем статистически равномерно отображает ключи элементов входной последовательности в этот интервал. Представим хеш-таблицу вектором H[0..m) с элементами типа обрабатываемых данных и будем хранить данное с ключом k в H[h(k)]. Это откроет нам возможность прямого доступа к данным по ключу. Тогда:

С одной стороны, при mn высока вероятность того, что каждому элементу входной последовательности найдется свое место в хеш-таблице.
С другой стороны, возможно появление коллизий - новый элемент входной последовательности претендует на уже занятое место в хеш-таблице. Нужна подходящая схема разрешения таких коллизий - например, можно для каждого индекса хеш-таблицы заводить список переполнения для хранения таких элементов.
Пока в хеш-таблице не появились коллизии, работа с ней отличается от работы с массивом только вычислением хеш-функции, поэтому операции АТД «Словарь» (Вставить, Удалить, Найти элемент) выполняются за время O(1). Но при наличии коллизий основное время уходит на работу со структурой данных, использованной для разрешения коллизий, например, на работу со списками переполнения. Поэтому в общем случае для операции поиска время в худшем O(n). Однако в среднем размер списков переполнения равен n/m, и при n/m<C время в среднем для операций АТД «Словарь» получается O(1), конечно при условии, что хеш-функция действительно равномерно распределяет ключи по хеш-таблице. Это очень хорошо, если (редко) случающиеся задержки выполнения операций некритичны.

Для хеш-таблиц разработаны и исследуются разнообразные методы разрешения коллизий, в частности методы её регулярного пересоздания с увеличением размера. Отдельный теоретический вопрос – методы построения и выбора хеш-функций, а также исследования их свойств.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1920 / 2220 21 22 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
10.02.201534.95 Кб190Lekcija_3.docx
#
10.02.201544.09 Кб128Lekcija_4.docx
#
10.02.201542.47 Кб25Lekcija_5-6.docx
#
10.02.201543.18 Кб36Lekcija_7.docx
#
10.02.201538.19 Кб16Lekcija_8-9.docx
#
12.03.20152.44 Mб40lekt1_sd4_1.doc
#
10.02.2015232.42 Кб20Lektsia01_2013.pdf
#
10.02.2015249.47 Кб17Lektsia02_2013.pdf
#
10.02.2015741.53 Кб21Lektsia03_2013.pdf
#
10.02.20151.14 Mб19Lektsia04_2013.pdf
#
10.02.20151.39 Mб50Lektsia05_2013.pdf

Структуры данных для непересекающихся множеств (отношения эквивалентности). [4 гл.21]

Рандомизированные структуры данных.