- •Содержание
- •Тема 2. Классические теоремы теории вероятностей
- •Если события а, в, с совместны, то
- •Формула полной вероятности имеет вид
- •Тема 3. Повторные независимые испытания
- •Тема 4. Случайные величины и законы их распределения
- •Тема 5. Числовые характеристики случайных величин
- •Пусть с – постоянная величина. Тогда
- •Для вычисления дисперсии используется формула
- •Дисперсия обладает свойствами
- •Тема 6. Основные дискретные случайные величины и их числовые характеристики
- •Если случайная величина распределена по закону Пуассона, то
- •Тема 7. Основные непрерывные случайные величины и их числовые характеристики
- •Плотность нормального распределения имеет вид
- •Дисперсия нормального распределения
- •Правило трех сигм записывается в виде равенства
- •2. Для нахождения математического ожидания и дисперсии применим формулы (7.3). Получим следующие значения:
- •Ошибка указания времени часами со скачущей минутной стрелкой имеет равномерное распределение. Определить вероятность того, что при определении времени ошибка не будет превышать 20 секунд.
- •Тема 8. Закон больших чисел и центральная предельная теорема
- •В предельной форме утверждения теоремы Бернулли имеют вид
- •Тема 9. Основные понятия математической статистики. Числовые характеристики
- •На практике для вычисления дисперсии применяется формула
- •Легко установить, что
- •Вычислим размах товарооборота по формуле (9.14). Получим, что
- •Тема 10. Статистические оценки
- •Если дисперсия несмещенной оценки при n→стремится к нулю, то такая оценка будет и состоятельной. Это следует из неравенства Чебышева (см.(8.2))Рдля случайной величины*.
- •Тема 11. Корреляция и регрессия
- •Непосредственно из этого определения следует, что
- •Тема 12. Проверка статистических гипотез
Тема 9. Основные понятия математической статистики. Числовые характеристики
Генеральная и выборочная совокупности. Повторная и бесповторная выборки. Репрезентативная выборка. Способы отбора. Статистическое распределение выборки. Эмпирическая функция распределения выборки и ее свойства. Полигоны и гистограммы. Генеральная и выборочная средние. Генеральная дисперсия и генеральное среднее квадратическое отклонение. Выборочная дисперсия и выборочное среднее квадратическое отклонение. Формула для вычисления дисперсии. Начальные и центральные эмпирические моменты порядка k, их связь с выборочной средней и выборочной дисперсией. Условные варианты. Условные эмпирические моменты. Метод произведений вычисления выборочных средней и дисперсии. Другие характеристики вариационного ряда: мода, медиана, размах варьирования, среднее абсолютное отклонение, коэффициент вариации. Асимметрия и эксцесс эмпирического распределения.
Л и т е р а т у р а
[1], раздел 2, гл.5, 5.4 -5.6; [4], §1; [5], гл.15, § 1-8, гл.16, § 3, 4, 8-10, 20, гл.17, § 1-4, 8; [8], гл.6, § 1-5, гл.7, § 1; [9], гл.10, § 1; [11], гл.31, § 214, 215, гл.32, § 216, 217; [12], ч.2, гл.5, § 15; [16], гл.4.
О с н о в н ы е п о л о ж е н и я и ф о р м у л ы
Изучаемый признак Х генеральной совокупности представляет собой дискретную или непрерывную случайную величину. Извлечем из генеральной совокупности выборку объема n. Наблюдаемые значения хi (i=1,…, r) этого признака в выборке называют вариантами. Последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом. Число ni объектов выборки, которые имеют значение хi, называют частотой варианты хi. Сумма всех частот вариант равна объему выборки: Относительная частотаWi варианты хi определяется равенством Wi =
Полученные статистические данные (результаты выборки) заносят в таблицу
хi |
x1 |
|
xr |
ni |
n1 |
|
nr |
Wi |
W1 |
|
Wr |
Эту таблицу называют дискретным статистическим распределением выборки. Иногда заполняют только первую и вторую строки этой таблицы.
Ломаная линия, соединяющая отрезками точки с координатами (хi, ni) в системе координат Охini называется полигоном частот. Соединив ломаной линией точки (хi, wi) в системе координат Охiwi , получим полигон относительных частот. По виду полигонов можно предположить, какому теоретическому закону подчинен рассматриваемый признак Х генеральной совокупности.
В случае непрерывных случайных величин (иногда в случае дискретных, если r велико) рассматривают интервальное статистическое распределение выборки. Оно оформляется в виде следующей таблицы:
хi-хi+1 |
x1-x2 |
x2-x3 |
|
xr-xr+1 |
ni |
n1 |
n2 |
|
nr |
Wi |
W1 |
W2 |
|
Wr |
Иногда третью строку этой таблицы не заполняют.
Обычно значения вариант, принадлежащие границам, относят к тому промежутку, у которого эта граница является левой. В случае четной частоты можно такое значение распределить поровну на два соседних промежутка.
От интервального распределения можно перейти к дискретному, взяв на каждом интервале (хi, хi+1) за отдельное значение хi* величину
хi* = ,
являющуюся серединой этого интервала.
Эмпирическим (опытным) аналогом графика плотности распределения вероятностей служат гистограммы. Различают гистограмму частот и гистограмму относительных частот.
Гистограмма – это ступенчатая фигура, состоящая из r прямоугольников. Основанием каждого прямоугольника с номером i является отрезок [xi, хi+1]. Высота hi этого прямоугольника в случае гистограммы частот определяется равенством
hi = ,
а в случае гистограммы относительных частот – равенством
hi = .
Удобными на практике являются интервальные выборки, все промежутки которых имеют одну и ту же длину h:
h = xi+1 – xi (i=1,…, r).
Тогда высоты прямоугольников соответствующих гистограмм определяются следующими равенствами:
hi = , hi = .
Обычно число r частичных интервалов выбирается из условия r. Тогда длиныh всех интервалов определяются приближенным равенством h , гдехmax и хmin соответственно максимальное и минимальное выборочные значения. За начало х1 первого интервала принимают значение х1= хmin - .
По виду гистограмм можно предположить, какому теоретическому закону подчинен изучаемый признак Х генеральной совокупности. Форма гистограммы относительных частот дает представление о форме графика дифференциальной функции f(х) случайной величины Х.
Эмпирическая функция распределения выборки определяется равенством
F*(x) = , (9.1)
где nх – сумма частот вариант, меньших х, n – объем выборки. Функция F*(х) определяет для каждого значения х относительную частоту события Х<х (Х – количественный признак выборки).
Эмпирическая функция F*(х) является хорошей оценкой для теоретической функции распределения F(х), так как для любого х из (-, +) и любого >0 справедливо равенство
. (9.2)
Пусть все значения х1,…, хn признака выборки объема n различны. Тогда выборочная средняя определяется равенством
= . (9.3)
Если же значения х1,…, хr признака выборки имеют соответственно частоты n1,…, nr, причем сумма частот равна объему выборки , то=. (9.4)
Выборочная дисперсия ДВ определяется одним из следующих равенств:
ДВ = (9.5)
(в случае различных значений признака),
ДВ = . (9.6)