Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
тиун. рук-во.DOC
Скачиваний:
56
Добавлен:
11.04.2015
Размер:
2.02 Mб
Скачать

Тема 9. Основные понятия математической статистики. Числовые характеристики

Генеральная и выборочная совокупности. Повторная и бесповторная выборки. Репрезентативная выборка. Способы отбора. Статистическое распределение выборки. Эмпирическая функция распределения выборки и ее свойства. Полигоны и гистограммы. Генеральная и выборочная средние. Генеральная дисперсия и генеральное среднее квадратическое отклонение. Выборочная дисперсия и выборочное среднее квадратическое отклонение. Формула для вычисления дисперсии. Начальные и центральные эмпирические моменты порядка k, их связь с выборочной средней и выборочной дисперсией. Условные варианты. Условные эмпирические моменты. Метод произведений вычисления выборочных средней и дисперсии. Другие характеристики вариационного ряда: мода, медиана, размах варьирования, среднее абсолютное отклонение, коэффициент вариации. Асимметрия и эксцесс эмпирического распределения.

Л и т е р а т у р а

[1], раздел 2, гл.5, 5.4 -5.6; [4], §1; [5], гл.15, § 1-8, гл.16, § 3, 4, 8-10, 20, гл.17, § 1-4, 8; [8], гл.6, § 1-5, гл.7, § 1; [9], гл.10, § 1; [11], гл.31, § 214, 215, гл.32, § 216, 217; [12], ч.2, гл.5, § 15; [16], гл.4.

О с н о в н ы е п о л о ж е н и я и ф о р м у л ы

Изучаемый признак Х генеральной совокупности представляет собой дискретную или непрерывную случайную величину. Извлечем из генеральной совокупности выборку объема n. Наблюдаемые значения хi (i=1,…, r) этого признака в выборке называют вариантами. Последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом. Число ni объектов выборки, которые имеют значение хi, называют частотой варианты хi. Сумма всех частот вариант равна объему выборки: Относительная частотаWi варианты хi определяется равенством Wi =

Полученные статистические данные (результаты выборки) заносят в таблицу

хi

x1



xr

ni

n1



nr

Wi

W1



Wr

Эту таблицу называют дискретным статистическим распределением выборки. Иногда заполняют только первую и вторую строки этой таблицы.

Ломаная линия, соединяющая отрезками точки с координатами (хi, ni) в системе координат Охini называется полигоном частот. Соединив ломаной линией точки (хi, wi) в системе координат Охiwi , получим полигон относительных частот. По виду полигонов можно предположить, какому теоретическому закону подчинен рассматриваемый признак Х генеральной совокупности.

В случае непрерывных случайных величин (иногда в случае дискретных, если r велико) рассматривают интервальное статистическое распределение выборки. Оно оформляется в виде следующей таблицы:

хi-хi+1

x1-x2

x2-x3



xr-xr+1

ni

n1

n2



nr

Wi

W1

W2



Wr

Иногда третью строку этой таблицы не заполняют.

Обычно значения вариант, принадлежащие границам, относят к тому промежутку, у которого эта граница является левой. В случае четной частоты можно такое значение распределить поровну на два соседних промежутка.

От интервального распределения можно перейти к дискретному, взяв на каждом интервале (хi, хi+1) за отдельное значение хi* величину

хi* = ,

являющуюся серединой этого интервала.

Эмпирическим (опытным) аналогом графика плотности распределения вероятностей служат гистограммы. Различают гистограмму частот и гистограмму относительных частот.

Гистограмма – это ступенчатая фигура, состоящая из r прямоугольников. Основанием каждого прямоугольника с номером i является отрезок [xi, хi+1]. Высота hi этого прямоугольника в случае гистограммы частот определяется равенством

hi = ,

а в случае гистограммы относительных частот – равенством

hi = .

Удобными на практике являются интервальные выборки, все промежутки которых имеют одну и ту же длину h:

h = xi+1xi (i=1,…, r).

Тогда высоты прямоугольников соответствующих гистограмм определяются следующими равенствами:

hi = , hi = .

Обычно число r частичных интервалов выбирается из условия r. Тогда длиныh всех интервалов определяются приближенным равенством h  , гдехmax и хmin соответственно максимальное и минимальное выборочные значения. За начало х1 первого интервала принимают значение х1= хmin - .

По виду гистограмм можно предположить, какому теоретическому закону подчинен изучаемый признак Х генеральной совокупности. Форма гистограммы относительных частот дает представление о форме графика дифференциальной функции f(х) случайной величины Х.

Эмпирическая функция распределения выборки определяется равенством

F*(x) = , (9.1)

где nх – сумма частот вариант, меньших х, n – объем выборки. Функция F*(х) определяет для каждого значения х относительную частоту события Х<х (Х – количественный признак выборки).

Эмпирическая функция F*(х) является хорошей оценкой для теоретической функции распределения F(х), так как для любого х из (-, +) и любого  >0 справедливо равенство

. (9.2)

Пусть все значения х1,…, хn признака выборки объема n различны. Тогда выборочная средняя определяется равенством

= . (9.3)

Если же значения х1,…, хr признака выборки имеют соответственно частоты n1,…, nr, причем сумма частот равна объему выборки , то=. (9.4)

Выборочная дисперсия ДВ определяется одним из следующих равенств:

ДВ = (9.5)

(в случае различных значений признака),

ДВ = . (9.6)