Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Малинин_3.doc
Скачиваний:
9
Добавлен:
06.11.2018
Размер:
233.98 Кб
Скачать
    1. Понятие нормализации исходных данных

Учитывая исключительно большое значение нормального закона распределения в статистических расчетах, целесообразно исходные данные приводить к «нормальному» виду в тех случаях, когда их распределение носит явно выраженный асимметричный характер. Основанием для этого может послужить анализ эмпирической гистограммы.

Действительно, если на графике члены ряда располагаются несимметрично относительно среднего значения, то это означает скошенность распределения, причем в зависимости от характера скошенности нормализация осуществляется различным образом.

Для положительной асимметрии (As > 0), как уже указывалось выше, левая ветвь гистограммы является более крутой, а правая – более пологой. В этом случае обычно используется логарифмическое преобразование вида:

x = lgx .10a .

Множитель 10а вводится сюда для того, чтобы исключить появление отрицательных значений параметров. Кроме того, для приведения распределения к симметричному виду иногда применяются и другие преобразования:

x = 1/х, x = 1/ (х)1/2 .

Отметим, что обратная величина 1/х является наиболее «сильным» преобразованием, нормализующим выборки с весьма существенной положительной асимметрией.

Для отрицательной асимметрии (As < 0) левая ветвь гистограммы, наоборот, является более пологой, а правая – более крутой. Нормализация исходной выборки в этом случае осуществляется преобразованием вида:

x = х,

где показатель степени может принимать различные положительные значения, большие единицы (>1). При умеренно отрицательной асимметрии обычно принимается =1,5, при более сильной асимметрии =2.

Поскольку существуют различные варианты приведения исходных данных к нормальному виду, то естественно сразу же возникает вопрос их оценки. Другими словами, необходимо определить, какое преобразование наилучшим образом нормализует исходную выборку. На наш взгляд, для этой цели целесообразно воспользоваться критерием Пирсона 2 (см. разд. 4.3), который характеризует соответствие эмпирической и теоретической функций распределения. Тот вариант нормализации исходной выборки, при котором критерий 2 достигает минимума, следует считать наилучшим.

61

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]