9-матем-статистика
.pdfОсновы
математической
статистики
Лекция
Предмет математической статистики
МС – раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений для выявления существующих закономерностей.
Полученные данные нужно:
1)упорядочить,
2)оценить характеристики СВ,
3)проверка гипотез согласования результатов оценивания с опытными данными.
Результаты исследования используют для принятия решений в задачах планирования, управления, контроля качества и т.д.
Совокупности
Генеральная совокупность – множество всех подлежащих изучению объектов или возможных результатов наблюдений.
Выборочная совокупность (выборка) – совокупность объектов, отобранных случайным образом из ГС.
Число объектов n в совокупности – объем выборки.
Конкретные значения x1, x2 ,..., xn выборки, полученные в опыте, - реализация выборки.
Для получения хороших оценок характеристик ГС нужно, чтобы выборка была репрезентативной, т.е. широко представлять изучаемые признаки ГС.
Условие обеспечения – соблюдение случайности отбора, т.е. все объекты ГС должны иметь равные вероятности попасть в выборку.
Способы отбора:
1)простой или случайный,
2)типический (по определенному признаку),
3)механический (через определенный интервал),
4)серийный.
На практике – сочетают разные способы.
Статическое распределение выборки
Пусть изучается СВ X . В результате наблюдений она
приняла n1 раз значение |
x1 |
,…, nk раз |
xk . При этом |
n1 n2 ... nk n , где |
n |
– объем |
выборки. Это |
первичный статистический материал.
Ранжирование – операция расположения значений
СВ X по неубыванию. |
Тогда полученная последова- |
||||
тельность x 1 ,…, x n – вариационный ряд. |
|||||
Числа ni - частоты, а |
|
p |
ni |
|
– частости (относи- |
|
|
||||
|
i |
n |
|
||
|
|
|
|||
тельные частоты), здесь n ni . |
|
|
Статистический ряд – таблица из значений СВ xi и их
частот ni .
В случае, когда число значений СВ X велико или признак является непрерывным, составляют интервальный статистический ряд.
В 1-й строке таблицы |
– |
частичные промежутки |
||||||||||
xi , xi 1 , в остальных – частоты и частости. Обычно |
||||||||||||
интервалы равной длины h . |
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
h |
|
|
|
R |
|
|
|
|
|
Формула Стерджеса |
|
|
, |
|
|
|||||||
1 log2 n |
||||||||||||
где |
R xmax xmin |
размах выборки, |
||||||||||
m 1 log2 n число интервалов. |
|
|
|
|
||||||||
|
|
|
x |
|
x |
|
h |
|
||||
|
|
|
|
|
||||||||
Начало 1-го интервала |
нач |
|
min |
2 |
|
Эмпирическая функция распределения
Это функция, определяющая для каждого значения
x частость события X x , т.е.
Fn x p X x
Для нахождения значений эмпирической функции распределения используют формулу:
|
F x |
nx |
|
|
|
|
|
||
|
n |
n |
|
, |
|
|
|
||
где n – объем выборки, |
|
|
|
nx – число наблюдений, меньших x , x R .
Функция Fn x обладает всеми свойствами истинной функции распределения F x .
Перечислить свойства
При увеличении n относительная частота p при-
ближается к вероятности этого события p , при этом
Fn x F x .
Графическое изображение статистического распределения
Для изображения дискретного статистического ряда:
Полигон частот – ломанная, отрезки которой соединяют точки xi , ni .
Полигон частостей – ломанная через точки xi , pi .
Для непрерывно распределенной СВ можно построить полигон частот, взяв середины интервалов.
Гистограмма частот (или частостей) – ступенчатая
фигура, |
состоящая из прямоугольников ширины h , |
||||
|
|
n |
p |
||
|
|
i |
i |
||
высоты |
|
h |
(или |
h |
). Ее площадь равна объему |
выборки (или единице).