Число кортежей, блоков и мощности атрибутов в соединении

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный технический университет им. H.Э.Баумана

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Оптимизация SQL.doc

Скачиваний:

Добавлен:

29.08.2019

Размер:

1.7 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 78 / 118 9 10 11 > Следующая >>>

Число кортежей, блоков и мощности атрибутов в соединении

Приведенные ниже формулы являются общими для всех рассмотренных выше методов (NLJ, SMJ и HJ).

1. Число кортежей в соединении.

(5.10)

2. Число блоков.

3. Мощности атрибутов:

а) мощность атрибута соединения ("а") в результирующей таблице

;

б) мощности остальных атрибутов (b)

Здесь T(Q₁), T(Q₂) – число кортежей в таблицах Q₁и Q₂;

- оценка числа кортежей в таблице, полученной после соединения;

I(Q_i,a) – мощность атрибута "а" в таблице Q_i (i=1,2);

L_JOIN – число кортежей соединения в одном блоке.

Поясним 1-ую формулу из 3-х, приведённых выше. Пусть . В этом случае каждая запись из соединяется в среднем с записями из (считается, что если , то значение атрибута связи в записи из таблицы совпадёт со значением соответствующего атрибута какой-либо записи из ).

Поиск физического плана с минимальной стоимостью

Для поиска оптимального физического плана используется один из алгоритмов динамического программирования.

Алгоритм поиска для левостороннего дерева соединений

Вход: логический план выполнения SQL-запроса с таблицами R₁, …, R_n (см. раздел 1.2).

Выход: квазиоптимальный физический план выполнения запроса.

//Алгоритм динамического программирования

ДЛЯ i=1,n

AccessPlan(R_i) //определение

КОНЕЦ ДЛЯ

ДЛЯ i=2,n

ДЛЯ всех подмножеств таких, что |P|=i

// |P| - количество таблиц в P

ДЛЯ всех таблиц

// определение метода соединения , дерево

// соединения таблиц (P – Q_j) уже создано при выполнении

// предыдущих циклов

JoinPlan(P – Q_j,Q_j)

КОНЕЦ ДЛЯ

OptPlanReturn({Q₁, …, Q_n}) //вывод оптимального плана

//Конец алгоритма

Формат экземпляра структуры данных

Алгоритм работает с массивом структур. Экземпляр структуры имеет следующий формат:

1. W – множество имен таблиц {Q_i} таких, что W=XY, если |W| > 1, и W – имя таблицы Q_i, если |W| = 1.

2. X – подмножество исходных таблиц {Q_i}, которые использованы для получения левого аргумента соединения X Y.

3. Y – имя таблицы Q_i, которая используется в качестве правого аргумента соединения X Y.

Примечание. Если W содержит имя только одной таблицы, т.е. |W| = 1, то X и Y – пустые поля.

4. Z – текущая стоимость выполнения плана, включающая стоимости выполнения подзапросов и промежуточных соединений, а также стоимость соединения X Y, если |W| > 1, или стоимость выполнения подзапроса, если |W| = 1.

5. ZIO – составляющая ввода-вывода в Z (C_I/O).

6. V – опции:

1) T(W) – прогнозируемое число кортежей (записей) в таблице W (т.е. T(X Y), если |W| > 1, или T(Q_i), если |W| = 1);

2) B(W) – прогнозируемое число блоков в W;

3) {I(W, A_i)}_i – мощности атрибутов в W, по которым было выполнено или будет выполняться соединение;

4) к – идентификатор метода выбора записей из исходной таблицы (если |W| = 1) или метода соединения таблиц (если |W| > 1).

Спецификации процедуры AccessPlan

Вход: R_i – имя исходной таблицы.

Выход: заполненный экземпляр структуры str[i].

Алгоритм.

// оценка стоимости выбора записей из R_i для различных методов:

// j=1 – чтение всей таблицы, j=2 – использование индекса.

ДЛЯ j=1,2

C_j= C_CPUj + C_I_/_Oj

// C_CPUj и C_I_/_Oj вычисляются с помощью формул (5.4) (для j=1)

// или с помощью формул (5.5) и (5.6) (для j=2).

КОНЕЦ ДЛЯ

// определение оптимального метода выбора записей из таблицы R_i,

// т.е. k{1,2}, заполнение экземпляра структуры str[i] (см. п. 1.7.2)

C=min (C₁, C₂) // здесь С=С_k

str[i] = {

{Q_i}, Ø, Ø, // W, X, Y

C, C_I/O
k, // Z, ZIO

{T(Q_i), B(Q_i), {min{T(Q_i), I(R_i, A_j)}_j, k} // V

// для заполнения полей T(Q_i), B(Q_i) используются формулы

// пунктов 1.4.4 и 1.4.5

}

Конец алгоритма.

<<< < Предыдущая 1 2 3 4 5 6 78 / 118 9 10 11 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
10.07.2019312.32 Кб8Определение прокаливаемости стали.doc
#
10.02.20151.48 Mб37ОПРОГ-А.pdf
#
23.08.2019445.24 Кб12Оптика (лекции).docx
#
22.09.20191.62 Mб18Оптика кристаллов.doc
#
09.02.2015119.33 Кб29Оптика, часть 1, редакция 2008 года.docx
#
29.08.20191.7 Mб14Оптимизация SQL.doc
#
17.08.20191.99 Mб5Оракул.doc
#
17.08.20191.1 Mб6Организационно-технологический подход к макроэк...doc
#
30.07.2019259.58 Кб7Организационно-экономический анализ бизнеса.doc
#
09.02.201514.62 Кб179организация и планирование производства.docx
#
23.03.2016789.16 Кб101Организация и планирование производства.docx

Число кортежей, блоков и мощности атрибутов в соединении

Поиск физического плана с минимальной стоимостью

Алгоритм поиска для левостороннего дерева соединений

Формат экземпляра структуры данных

Спецификации процедуры AccessPlan