- •Глава 2
- •Определение статистики
- •Сбор статистических данных
- •Выборочный метод
- •Неправильные и неполные представления
- •Графическое изображение распределения частот
- •Числовые характеристики центральной тенденции
- •Числовые характеристики рассеяния
- •Кривая нормального распределения
- •Выравнивание анормальных распределении
Числовые характеристики рассеяния
Рассмотренные выше числовые характеристики служат для описания распределения с точки зрения его центральной тенденции, т. е. с точки зрения тенденции наблюденных значений признака группироваться вокруг некоторого их среднего значения. Наряду с этим всякое распределение характеризуется также рассеянием или отклонением значений наблюденного признака от его среднего значения. Существует несколько видов числовых характеристик рассеяния, среди которых наиболее распространенными являются следующие: а) размах, б) половина интерквартильного размаха (полуразмах квартилей), в) среднее отклонение и г) среднее квадратическое отклонение. Мы разъясним смысл первых трех характеристик рассеяния, но для оценки варьирования (колеблемости) наблюденных значений в рассматриваемом нами примере мы будем пользоваться только средним квадратическим отклонением. Самой доступной для понимания и простейшей в вычислительном отношении является характеристика, называемая размахом. Размах — это разность между наибольшим и наименьшим значениями наблюденного признака. Очевидно, что размах зависит от колеблемости экстремальных значений признака. Как будет показано дальше, размах представляет собой очень важную характеристику колеблемости наблюденных значений признака при статистическом контроле качества и часто применяется для вычисления среднего квадратического отклонения.
Полуразмах квартилей составляет половину разности между первым и третьим квартилями. Первый квартиль представляет собой значение признака, выше которого расположено 75% всех наблюденных значений признака. Второй квартиль представляет собой значение признака, выше (и ниже) которого расположено соответственно 50% всех наблюденных значений (иначе говоря, он совпадает с медианой). Третий квартиль представляет собой значение признака, выше которого расположено 25% наблюденных значений. Полуразмах квартилей определяется по формуле
где (?з и — соответственно третий и первый квартили.
Среднее отклонение представляет собой среднее арифметическое абсолютных отклонений всех наблюденных значений признака от средней арифметической этих значений. Эта характеристика, как и полуразмах квартилей, применяется редко из-за трудностей, связанных с ее вычислением. Она определяется по формуле
где— абсолютное отклонение наблюденного значения признака;
— число наблюдений. Среднее квадратическое отклонение представляет собой корень квадратный из среднего квадрата отклонений от средней арифметической всех наблюденных значений признака. Эта характеристика при определенных условиях называется также стандартной ошибкой.
Формулой, из которой выводятся все прочие вычислительные формулы, здесь служит следующая *:
Эта характеристика является одной из наиболее употребительных и стабильных характеристик рассеяния. Раскрытие большинства индуктивных аспектов статистического метода находится в прямой зависимости от вычисленной или предположительной оценки среднего квадратического отклонения. «Пользуясь языком механики, можно сказать, что если п значений х определяют положение п одинаковых по весу частиц, то среднее квадратическое отклонение соответствует радиусу инерции, измеряющему положение этих частиц по отношению к центру тяжести... Оно выражается в тех же единицах измерения, что и наблюденные признаки; если последние измеряются, скажем, в фунтах, то и среднее квадратическое отклонение измеряется также в фунтах» 2.
Формула определения среднего квадратического отклонения на основе неупорядоченных данных
Формула определения среднего квадратического отклонения на основе распределения частот
Применяя последнюю формулу, получим для нашего примера
1 В справочнике по контролю качества промышленных материалов (ASTM Manual on Quality Control of Materials) по поводу формулы среднего квадратического отклонения сказано следующее: «В некоторых работах по статистике термин среднее квадратическое отклонение выборки применяется для обозначения квадратного корня из отношения суммы квадратов отклонений от среднего значения выборки к п — 1, где п обозначает объем выборки. По сути, это выражение представляет собой корень квадратный из несмещенной оценки универсальной дисперсии (а2), основанной на выборке, а не из несмещенной оценки универсального среднего квадратического отклонения. Кроме того, если несмещенную оценку требуется определить в каждой точке, i/c2o то ее, можно найти... графически, но это делается очень редко, так как связано со сложными вычислениями». Поэтому, если требуется получить несмещенную оценку среднего квадратического отклонения, то для определения последней проще всего воспользоваться таблицей коэффициентов с2 (см. табл. А. Приложение I).2 ASTM Committee Е-11, ASTM Manual on Quality Control of Materials, Philadelphia: American Society for Testing Materials, 1951, p. 15.
ДРУГИЕ СТАТИСТИЧЕСКИЕ ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ
Отношение среднего квадратического отклонения к средней арифметической дает новую числовую характеристику вариации признака, иногда весьма полезную и применяемую в производстве наряду с другими статистическими характеристиками. Это отношение носит название коэффициента вариации и определяется по формуле
Чтобы проиллюстрировать применение этого коэффициента, предположим, что имеются две статистические совокупности, характеризуемые 1ио.
Выбо рки
Среднее
квадратическое отклонение выборки 1
меньше, чем среднее квадра-тическое
отклонение выборки 2, но коэффициент
вариации признака в выборке 2 намного
меньше, чем в выборке 1.
Существуют и другие числовые характеристики распределения, представляющие известный интерес — как практический, так и теоретический. Коэффициент скошенности, или асимметрии, характеризует тенденцию к рассеянию в одном направлении больше, чем в другом. Коэффициент относительной скошенности определяется по формуле
Разумеется, для симметричного распределения зк = 0. Если значение коэффициента жА; отрицательное, то большая часть ряда распределения располагается слева от оси ординат (У); если положительное, то справа от нее.
Эксцесс характеризует островершинность распределения. Относительный эксцесс определяется по формуле
Для теоретического нормального распределения, которое рассматривается в следующем параграфе, коэффициенты вк и К равны нулю.