- •Математическая статистика в примерах и задачах
- •Рецензент
- •Оглавление
- •Предисловие
- •Модуль 1. Анализ вариационных рядов
- •1.1. Генеральная совокупность. Выборочный метод. Графическое и табличное представление данных Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.2. Выборочные числовые характеристики Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.3. Точечные оценки. Методы нахождения точечных оценок Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.4. Доверительные интервалы Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.5 Проверка статистических гипотез Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •Модуль 2. Линейная регрессия. Элементы корреляционного анализа
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •Индивидуальные домашние задания.
- •Приложение
- •Литература
Модуль 1. Анализ вариационных рядов
1.1. Генеральная совокупность. Выборочный метод. Графическое и табличное представление данных Опорный конспект
Генеральной совокупностью называется совокупность объектов произвольной природы, обладающих признаками, доступными для наблюдения и количественного измерения.
Например, в случае социально-экономических иссле-дований это может быть население какого-то города, региона или страны, а измеряемыми признаками – доходы, расходы или объем сбережений отдельно взятого человека. Если какой-то признак имеет качественный характер (например, пол, национальность, социальное положение, род деятельности и т.п.), но принадлежит к конечному множеству вариантов, он может быть также закодирован числом (как это часто делают в анкетах).
Объекты, входящие в генеральную совокупность, называются ее элементами, а их общее число N – ее объемом.
Однако, получение экспериментальных данных достаточно трудоемкий, дорогой процесс, а в некоторых случаях и просто невозможный. Поэтому из всей генеральной совокупности приходится выбирать только определенную часть объектов, которую называют выборочной совокупностью или выборкой объема n.
Предположим, что над случайной величиной производится ряд независимых опытов (наблюдений). В каждом из этих опытов случайная величина принимает определенное значение: Совокупность этих значении рассматри-вается как простая выборка.
Наблюдаемое значение называют вариантой, а их последовательность, записанную в возрастающем порядке, – вариационным рядом. Для каждой варианты можно указать частоту ее появления, которую обозначают . Также может быть найдена относительная частота появления определенной варианты, как отношение частоты к объему выборки:
Сумма всех относительных частот должна быть равна единице. Не трудно заметить, что относительная частота имеет смысл статистической вероятности.
Статистическим распределением или статистическим рядом называют соответствие вариант и их частот (табл. 1.1) или относительных частот (табл. 1.2).
Таблица 1.1
|
|
|
|
|
|
|
|
|
|
Таблица 1.2
|
|
|
|
|
|
|
|
|
|
При большом числе наблюдении статистический ряд перестает быть удобной формой записи статистического материала – он становится громоздким и мало наглядным. Для придания ему большей компактности и наглядности строится так называемый интервальный статистический ряд. В этом случае весь диапазон наблюдаемых значений разделяется на интервалы и подсчитывается количество значений приходящееся на каждый интервал (табл. 1.3).
Таблица 1.3
Границы интервалов |
|
|
|
|
|
|
|
|
|
Длину интервала – h – проще выбирать одинаковой. Практика показывает, что число интервалов рационально выбирать порядка 7-20. Для нахождения длины интервала можно воспользоваться формулой Стерджеса:
(1.1)
Если в результате вычисления по формуле (1.1) длина интервала получится дробным числом, то выбирают, либо близкое целое число, либо близкую простую дробью.
Статистический ряд представляет собой первичную форму записи статистического материала и может быть обработан различными способами. Одним из способов такой обработки является построение эмпирической функции распределения случайной величины. Обозначим через число наблюдений, при которых значения вариант оказываются меньше, чем х.
Эмпирической (статистической) функцией распределения называется функция , определяющая для каждого значения х относительную частоту события {X < x}:
(1.2)
Для того, чтобы найти значение эмпирической функции распределения при данном достаточно подсчитать число опытов, в которых величина приняла значение меньше, чем и разделить на общее число произведенных опытов n.
Графически статистический ряд можно представить в виде полигона частот или относительных частот. Полигоном частот или относительных частот называют ломаную линию, отрезки которой соединяют точки соответственно Полигоны обычно служат для изображения выборки в случае дискретных случайных величин (рис. 1.1):
Рис. 1.1
Интервальный статистический ряд часто оформляется графически в виде гистограммы. Гистограммой называется ступенчатая фигура (рис.1.2), состоящая из прямоугольников, основаниями которых служат отрезки, равные длине интервала, а высотами являются относительные частоты, поделенные на длину интервала. Гистограмма обычно служат для изображения выборки в случае непрерывных случайных величин. Площадь гистограммы равна единице. Если на гистограмме соединить середины верхних сторон прямоугольников, то полученная ломаная образует полигон относительных частот.
Рис. 1.2