6.4. Критерии оптимизации для бд с одним сервером.

При проектировании систем с единым сервером БД эффективность системы зависит от показателей LRA и связанных с ним временных показателей эффективности. Как уже упоминалось, простая минимизация LRA может привести к слишком большим по размеру записям и в общем случае снизить эффективность системы. Поэтому в качестве целевой функции естественно использовать временной показатель, основой для расчета которого является TIO для последовательного (индекс s) и прямого (индекс r) доступа к файлу. С учетом возможности буферизации время обработки будет определяться следующим образом:

, (6.13)

где T_cash определяет время последовательного считывания таблиц или их частей в кэш памяти, T_f определяет время выбора LRA записей для ответа на запрос, T_t - время передачи ответа на запрос на рабочую станцию пользователя.

6.5.Построение эффективной логической структуры на основе алгоритма кластеризации атрибутов данных.

В качестве основы для поиска оптимальной логической структуры ИС был выбран алгоритм кластеризации атрибутов данных, то есть такая модификация таблиц БД, при которой время выполнения клиентских заданий уменьшается в соответствии с критериями. Основой анализа таблиц – кандидатов на слияние является исследование функциональных требований пользователя F={f_p} и, в частности, бинарного вектора ω_k={ω_pk}, где ω_pk=1, если p-я функция обращается к k-й таблице, и 0 в противоположном случае. Простой анализ значений этого вектора позволяет определить круг таблиц – кандидатов на слияние. Фиксируя p , и выбирая ненулевые элементы ω_pk=1, можно получить список таблиц, с которыми манипулирует клиентское приложение.

Для того, чтобы определить наиболее часто совместно используемые таблицы, построим матрицу

, (6.14)

в которой отличные от нуля недиагональные элементы указывают на совместно используемые таблицы при выполнении определенной (p-ой) функции над данными. Определим теперь матрицу

, (6.15)

где P – число функций над данными в данной ИС. В отличие от матрицы cr^p, элементы последней матрицы могут принимать любые целые положительные значения или значение ноль. Ненулевой элемент дает общее число совместного использования таблиц при выполнении всех функций над данными.

Легко заметить, что процесс определения элементов матрицы cr довольно просто алгоритмизируется.

Следующий шаг в процессе кластеризации атрибутов данных заключается в сортировке элементов матрицы cr по возрастанию, после чего программный комплекс предлагает проектировщику принять объединение наиболее часто совместно используемых таблиц и дальнейшая работа происходит в интерактивном режиме.

Интерактивный режим выбран по следующим соображениям. Во-первых, проектировщик имеет в виду реальный объем таблиц, от которого зависит скорость обработки данных. Нет смысла сливать несколько таблиц в одну, если объем такой таблицы превышает некоторый пороговый уровень. Во-вторых, объединение не должно противоречить требованиям структурного системного анализа, поскольку тогда ИС становится слишком специфичной и теряет наглядность представления данных. Наконец, опытный проектировщик должен учитывать перспективу развития ИС, когда происходит расширение функций системы как за счет роста объема и структуры информации, содержащейся в БД, так и за счет увеличения числа функций над данными. Наконец, если проектировщик не отвергнет ни одного варианта кластеризации, это приведет лишь к увеличению времени расчета.

Алгоритм кластеризации предусматривает многоступенчатость. Это означает, что после принятия решения о кластеризации и анализе новой структуры в рамках CASE-системы, программа предусматривает возможность кластеризации данных новых таблиц, и процесс циклически повторяется. Окончание процесса кластеризации возможно либо по решению разработчика, либо когда элементы матрицы cr^p примут нулевые значения.

А лгоритм оптимизации структуры БД на основе метода кластеризации атрибутов данных представлен на рисунке 3.7.

Принятие решения

Каждый из вариантов структуры, прошедший контроль разработчика, используется для моделирования времен T_q (среднего времени выполнения функций над данными) и σ_q– средне-квадратичных отклонений от T_q. Вариант принимается, если время T_q и σ_q лучше, чем в предыдущем варианте структуры. Точный критерий принятия варианта вытекает из сравнения средних и записывается в виде:

или , (6.16)

где – среднее время выполнения функций над данными в предыдущем варианте структуры таблиц, N – общее число выполненных функций (запросов), а -объединенная оценка дисперсии:

. (6.17)

<<< < Предыдущая 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 2324 / 3124 25 26 27 28 29 30 31 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
22.11.2019424.45 Кб3Nabor_Novyy_start.doc
#
13.05.2015300.54 Кб505namefix.doc
#
13.05.2015709.12 Кб75nasp2013-030900.doc
#
21.11.20191.92 Mб12Naumchuk_O.A._Finansoviy_oblik1.doc
#
18.07.2019293.89 Кб6nem_igry.doc
#
24.12.2018930.3 Кб17new_metod.doc
#
13.05.2015327.9 Кб43novaya_istoria.docx
#
04.09.201982.94 Кб2novaya_metodiichka_Nalogi_Glukhova.doc
#
19.09.2019169.13 Кб2novoe_ob_org.docx
#
13.05.201566.68 Кб7numericperformance.pdf
#
13.05.201579.75 Кб5obratnye_matritsy.docx