- •С.Н.Дементьев, а.М.Слиденко, с.О.Стрыгина
- •Воронеж
- •Дементьев с.Н.
- •Часть I. Теория вероятностей Введение
- •Основные понятия
- •Классическое определение вероятности
- •Основные понятия комбинаторики
- •Геометрическое определение вероятности
- •Статистическое определение вероятности
- •Примеры решения индивидуальных заданий
- •Основные понятия
- •Примеры решения индивидуальных заданий
- •Основные понятия
- •Основные понятия
- •Формула Бернулли
- •Формула Пуассона
- •Локальная формула Лапласа
- •Интегральная формула Лапласа
- •Основные понятия
- •Основные понятия Равномерное распределение
- •Показательное (экспоненциальное) распределение
- •Примеры решения индивидуальных заданий
- •Основные понятия
- •Пример решения индивидуального задания
- •Основные понятия
- •Распределение Стьюдента ( распределение)
- •Распределение Фишера ( -распределение)
- •Примеры решения индивидуальных заданий
- •Основные понятия
- •Часть II. Математическая статистика Введение
- •Основные понятия Методика рациональной организации выборки большого объема
- •Нахождение точечных и интервальных статистических оценок неизвестных числовых характеристик теоретических распределений
- •Основные понятия
- •Проверка гипотезы о равенстве дисперсий двух нормально распределенных генеральных совокупностей
- •Проверка гипотезы о равенстве средних
- •Дисперсии которых неизвестны и одинаковы
- •Проверка гипотезы о нормальном распределении случайной величины с помощью критерия Пирсона
- •«Проверка статистических гипотез»
- •«Проверка статистических гипотез»
- •Основные понятия
- •«Однофакторный дисперсионный анализ»
- •«Однофакторный дисперсионный анализ»
- •Основные понятия
- •Проверка качества модели регрессии с помощью коэффициента детерминации
- •Проверка значимости регрессии по критерию Фишера
- •Построение доверительных интервалов для генеральных параметров регрессии
- •Построение доверительного интервала для прогноза индивидуального значения отклика
- •«Корреляционный и регрессионный анализ»
- •«Корреляционный и регрессионный анализ»
- •Часть III. Примеры лабораторных работ по математической статистике в системе mathcad Темы лабораторных работ и их основные цели
- •Лабораторная работа №1 (листинги 1-5) Распределения, связанные с нормальным законом распределения
- •Лабораторная работа №2 (листинги 6-8) Метод статистических испытаний (метод Монте-Карло)
- •Лабораторная работа №3 (листинги 9-15) Описательные статистики
- •Лабораторная работа №4 (листинги 16-18) Проверка гипотезы о нормальном распределении
- •Лабораторная работа №5 (листинги 19-24) Примеры проверки статистических гипотез
- •Лабораторная работа №6 (листинги 25-27) Однофакторный дисперсионный анализ
- •Лабораторная работа №7 (листинги 28-31) Корреляция и регрессия
- •Продолжение приложения 2
- •Приложение 4
- •Критические точки распределения Фишера
- •Критические точки распределения Фишера
- •Примеры тестовых вопросов по теории вероятностей и математической статистике
- •394087, Воронеж, ул. Мичурина, 1
Часть II. Математическая статистика Введение
Математическая статистика – раздел математики, занимающийся обработкой статистических данных с целью установления закономерностей, присущих массовым случайным явлениям. Статистические данные представляют собой сведения о том, какие значения принял в результате наблюдений интересующий нас признак (случайная величина). Методы математической статистики разработаны на основе методов теории вероятностей. Основной метод математической статистики – выборочный метод. Суть его в том, что по сравнительно небольшому количеству статистических данных делаются выводы о рассматриваемом явлении, процессе и т. п. Разумеется, эти выводы – лишь приблизительные оценки вероятностного характера для изучаемого явления или процесса. Математическая статистика разработала методы сбора выборочных данных и их описание, позволяющее получать, по возможности, более точные и надежные оценки, указывая при этом степень их надежности.
Математическая статистика возникла в XVI веке и развивалась параллельно с теорией вероятностей. В XIX-XX веках большой вклад в развитие математической статистики внесли П. Л. Чебышев, А.А. Марков, А.Н. Ляпунов, К. Гаусс, К. Пирсон, А.Н. Колмогоров, Р. Фишер, Ю. Нейман и другие известные ученые-математики.
Тема 10. |
ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ |
Основные понятия Методика рациональной организации выборки большого объема
Пример 10.1. Пусть дана случайная выборка в виде таблицы 10.1, состоящая из 100 значений признака .
Таблица 10.1
50,2 |
54,0 |
41,0 |
42,0 |
58,2 |
59,3 |
84,8 |
45,0 |
76,5 |
58,3 |
21,0 |
55,0 |
45,0 |
21,5 |
46,0 |
44,0 |
42,5 |
49,0 |
48,7 |
75,0 |
15,3 49,7 23,0 51,7 18,4 43,8 85,0 30,0 |
55,0 63,0 47,8 50,0 35,6 44,0 63,0 10,0 |
23,8 30,0 47,4 48,8 28,4 69,1 30,0 63,0 |
46,5 32,0 50,8 49,4 37,6 46,3 43,8 48,8 |
53,0 42,4 78,3 57,5 49,5 76,7 64,8 71,2 |
62,8 22,4 27,0 47,4 26,7 37,1 22,0 54,4 |
78,5 52,0 56,6 33,5 54,0 69,2 38,8 47,8 |
67,0 70,4 51,3 27,0 68,6 39,3 42,3 31,2 |
34,5 57,2 58,6 39,7 29,3 30,0 64,8 46,1 |
49,9 50,0 28,4 57,5 62,7 43,0 41,0 17,8 |
Для лучшей обозримости элементы выборки можно было бы переписать в порядке возрастания с указанием соответствующих им частот. Получился бы так называемый вариационный ряд. Но не следует торопиться: для выборки большого объема это все равно не даст желаемой наглядности. Кроме того, данные таблицы 10.1 почти не повторяются. Это, по-видимому, связано с тем, что случайная величина непрерывна. А для непрерывных признаков имеет смысл лишь вероятность или частота попадания их значений в интервал.
Учитывая сказанное, построим интервальное распределение значений признака (интервальный вариационный ряд). Для этого, прежде всего, отметим, что у нас , , а размах выборочных значений .
Теперь определим длину каждого частичного интервала (иногда их называют классовыми интервалами), воспользовавшись формулой Стерджеса
,
где – объем выборки. В рассматриваемом примере
Далее устанавливаем границы частичных интервалов: нижнюю границу первого интервала принимаем равной
,
а остальные границы ищем по формулам
.
Так, , второй интервал будет (15; 25), третий (25; 35) и т. д. до выполнения условия , где — верхняя граница последнего интервала. Отметим, что если некоторое выборочное значение совпадает с границей двух соседних интервалов, то его договоримся относить к предыдущему из них (так, в нашем случае, например, число 55 дважды будет отнесено к интервалу (45;55) и ни разу – к интервалу (55;65)).
В итоге реализации данных рекомендаций получим таблицу 10.2, в первых двух столбцах которой разместим искомое интервальное распределение выборки, в третьем относительные частоты , а в последнем, четвертом плотности распределения относительных частот на частичных интервалах: (величины и нам потребуются в дальнейшем).
Распределение непрерывной случайной величины принято графически представлять кривой распределения, которая является графиком ее плотности вероятностей (дифференциальной функции распределения). В статистике одной из оценок кривой распределения является гистограмма относительных частот. Это ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы, а высотами являются плотности относительных частот на частичных интервалах.
Таблица 10.2
|
|
|
|
(5; 15) |
1 |
|
|
(15; 25) |
9 |
|
|
(25; 35) |
14 |
|
|
(35; 45) |
19 |
|
|
(45; 55) |
29 |
|
|
(55; 65) |
15 |
|
|
(65; 75) |
7 |
|
|
|
100 |
1 |
|
При построении гистограммы относительных частот в нашем примере используем первый и последний столбцы таблицы 10.2:
Гистограмма относительных частот
Нередко от интервального распределения выборки бывает удобно перейти к точечному (дискретному) распределению, взяв за новые выборочные значения признака середины частичных интервалов. В рассматриваемом примере такое распределение, очевидно, имеет вид таблицы 10.3:
Таблица 10.3
|
10 |
20 |
30 |
40 |
50 |
60 |
70 |
80 |
|
1 |
9 |
14 |
19 |
29 |
15 |
7 |
6 |
По данным таблицы 10.3 может быть построен полигон относительных частот, который является, как и гистограмма относительных частот, статистической оценкой кривой распределения признака. Это ломаная линия, вершины которой находятся в точках . В рассматриваемом случае в соответствии с первой строкой таблицы 10.3 и третьим столбцом таблицы 10.2 полигон относительных частот имеет следующий вид:
Полигон относительных частот
Для точечного распределения выборки может быть получена эмпирическая функция распределения , которая является статистической оценкой функции распределения вероятностей признака (интегрального закона распределения) и строится по формуле
,
где объем выборки, а сумма частот выборочных значений признака, которые меньше .
В нашем примере
Ясно, что эмпирическая функция распределения характеризует процесс накопления относительных частот в рассматриваемой выборке.
В нашем примере эмпирическая функция распределения имеет вид, показанный на рис. 10.1.