- •Тема 7. Основные понятия математической статистики
- •§1.Признаки и переменные. Измерительные шкалы
- •§2.Основные типы эксперимента
- •§3. Выборочный метод, основные понятия и принципы
- •§4. Статистическое распределение выборки
- •§5. Числовые характеристики выборочной совокупности
- •§6. Точечные оценки числовых характеристик генеральной совокупности
- •§7. Интервальные оценки числовых характеристик генеральной совокупности. Доверительный интервал
§4. Статистическое распределение выборки
Пусть для изучения количественного признака Х из генеральной совокупности извлечена выборка объема n.
Возможные значения признака Х называют вариантами, обозначают , где индекс обозначает номер данной варианты.
Частота варианты – это количество повторений данной варианты в выборке, обозначается . Сумма всех частот должна быть равна объему выборки: .
Относительной частотой варианты называют отношение частоты варианты к объему выборки, обозначают ( ). Сумма всех относительных частот должна быть равна единице: .
Любая выборка может быть представлена в негруппированном виде (просто в виде набора значений), в виде вариационного ряда или в группированном виде.
Вариационным рядом называют последовательность вариант, записанных в порядке возрастания.
Статистическим распределением выборки называется соответствие между вариантами и их частотами или относительными частотами .
Статистическое распределение выборки может быть представлено в виде безинтервального ряда или в виде интервального ряда.
Безинтервальный (дискретный) ряд строится в том случае, когда число различных вариант мало (малый объем выборки или при большом объеме выборки мало различных вариант).
Интервальный ряд строится в том случае, когда объем выборки большой, изучаемый признак непрерывен, много различных вариант.
Безинтервальный ряд может быть представлен двумя способами:
в виде таблицы, в первой строке которой перечисляются варианты в порядке возрастания, во второй строке – частоты или относительные частоты. Такая таблица называется статистическим дискретным рядом распределения выборки и является группированным видом представления выборки.
|
|
|
… |
|
или |
|
|
|
… |
|
|
|
|
… |
|
|
|
|
… |
|
в виде графика, в котором по оси абсцисс откладываются варианты, а по оси ординат – частоты или относительные частоты. По данным выборки наносятся точки и соединяются отрезками. Полученная ломаная называется полигоном частот (или относительных частот).
Суть построения интервального ряда состоит в следующем: весь диапазон изменений признака разбивается на частичные интервалы и учитывается не каждая варианта, а число объектов выборки, попавших в данный интервал.
Порядок построения интервального ряда:
Находят в выборке максимальное и минимальное значение и вычисляют размах выборки – разность между максимальным и минимальным значением: .
Определяют длину частичного интервала по формуле: , где - это объем выборки, а знаменатель дроби - количество частичных интервалов. Найденное значение округляют до ближайшего четного числа с тем же количеством знаков после запятой, что и сами измерения в выборке.
Замечание:
Определяют начало первого интервала таким образом, чтобы минимальная варианта попала в его середину: .
Строят таблицу, в первую строку которой записывают частичные интервалы:
Интервалы записывают до тех пор, пока не перейдут за .
Во второй строке таблицы подсчитывают количество объектов выборки, попавших в тот или иной интервал (для этого удобен метод «конвертов»). Варианта, попавшая на границу между интервалами, относится в следующий интервал. Чтобы отличить от дискретного ряда, где подсчитывается частота каждой варианты, количество значений, попавших в тот или иной интервал, обозначаем .
Полученная таблица называется статистическим интервальным рядом распределения выборки. Графическим представлением интервального ряда является гистограмма частот или гистограмма относительных частот. Для построения гистограммы по оси абсцисс откладывают частичные интервалы, а по оси ординат частоты или относительные частоты.