- •Оглавление
- •Введение
- •1.Генеральная совокупность и выборка из генеральной совокупности
- •2. Выборка, ее представление и числовые характеристики
- •2.1. Представление выборки
- •2.1.1. Таблица частот и интервальная
- •2.1.2. Графическое представление выборки.
- •2.2. Числовые характеристики выборки
- •2.2.1. Выборочное среднее, мода, медиана
- •2.2.2. Квартили, декатили, персентили
- •2.2.4. О симметричных и несимметричных распределениях
- •2.2.5. Вычисление выборочного среднего и выборочной дисперсии для объединения двух выборок
- •1. , Тогда .
- •2.2.6. Общая, межгрупповая и внутригрупповая дисперсии
- •2.2.7. Кривая Лоренца и показатели концентрации
- •2.3. Задачи
- •3. Обработка результатов наблюдений по методу наименьших квадратов
- •3.1. Двумерные выборки
- •3.2. Графическое представление двумерных выборок — диаграммы рассеяния
- •3.3. Выборочный коэффициент корреляции — числовая характеристика двумерной выборки
- •3.4. Метод наименьших квадратов
- •3.5.6. Пример построения нелинейного уравнения регрессии
- •3.6. Расчет коэффициентов линейного уравнения регрессии по сгруппированным данным
- •3.7. Индекс корреляции
- •3.8. Индекс фехнера и корреляционнное отношение
- •3.9.Задачи
- •6. Проверка гипотезы о законе распределения генеральной совокупности по критерию пирсона (критерию 2)
- •6.1. Пример
- •6.2. Немного теории
- •1.3. Другие примеры
- •6.3.1. Проверка гипотезы о нормальном законе распределения
- •200 Отклонений диаметра вала от номинального размера (мкм)
- •6.3.2. Проверка гипотезы о равномерном законе распределения
- •6.3.3. Проверка гипотезы о биномиальном законе распределения
- •6.3.4. Проверка гипотезы о законе распределения Пуассона
- •6.3.5. Последний пример
- •6.4. Задачи
- •10. Результаты испытаний прочности партии стальной проволоки диаметром 1,4 мм:
6.2. Немного теории
Только что мы находили число 2.
,
где k – число интервалов; ni – частота i-го интервала;
рi – теоретическая вероятность попадания случайной величины Х (генеральной совокупности) в i-й интервал;
n – число независимых испытаний (объем выборки);
nрi – математическое ожидание числа попаданий случайной величины Х в i-й интервал
Но на приведенную формулу можно посмотреть и по-другому. Вместо числа ni рассмотрим случайную величину ni (в математической статистике случайные величины и их значения часто обозначаются одними и теми же маленькими буквами). Случайная величина ni - это число появлений «успеха» в n независимых испытаниях, где под «успехом» понимается попадание случайной величины Х в i-й интервал. Таким образом, вероятность «успеха» равна рi, а случайная величина ni имеет биномиальное распределение с параметрами n и рi. В частности, M(ni) = npi. Рассмотрим теперь случайную величину 2, функцию от случайных величин n1, n2, …, nk, определяемую формулой
.
Еще раз подчеркнем, что в этой формуле n и рi – это числа, а ni – это случайные величины. Имея выборку, мы можем найти значения случайных величин ni, которые они приняли в результате n независимых испытаний, и вычислить затем значение эксп – экспериментальное значение случайной величины 2. Можно доказать, что если закон распределения генеральной совокупности Х подобран правильно, то с ростом n случайную величину 2 можно считать распределенной по так называемому закону распределения 2. Это непрерывное распределение, формулу функции плотности вероятности которого мы не будем здесь приводить. Распределение зависит от одного параметра r, который называется числом степеней свободы. В нашем случае
r = k-1-S,
где k – число интервалов;
S – число параметров закона распределения, вычисленных по выборке.
Возникает естественный вопрос: каким должно быть число n, чтобы его можно было считать «достаточно большим» и пользоваться распределением 2? Желательно, чтобы n было таким большим, чтобы все произведения npi были не меньше 5 (рекомендация всех учебников по статистике). На самом деле, как показывает практика, вполне достаточно выполнения неравенств nрi 1, n 50.
Примерный график функции плотности вероятности случайной величины 2 показан на рис. 6.2.
Рис.6.2
Если закон распределения генеральной совокупности Х подобран правильно, экспериментальное значение эксп, вычисленное на основании выборки, не может быть слишком большим. Зададимся достаточно большой вероятностью ( = 0,9; 0,95; 0,99), так что события с вероятностью = 1 - будем считать практически невозможными. Вероятность называют уровнем значимости.
С точки зрения подтверждения выдвинутой нами гипотезы о законе распределения генеральной совокупности Х мы должны считать практически невозможными большие значения случайной величины 2. Мы считаем практически невозможными значения случайной величины 2 из интервала (2кр, ), где число 2кр определяется из условия (см. рис.6.2)
p(2 > 2кр) = .
Для распределения 2 составлены специальные таблицы (приложение 3). По ним можно найти число 2кр, зная и число степеней свободы r. Число 2кр сравнивают с числом 2эксп. Если оказывается, что 2эксп <2кр, то говорят, что с точки зрения принятия выдвинутой гипотезы о законе распределения генеральной совокупности Х произошло достоверное событие. Гипотеза считается не противоречащей опытным данным и принимается. Если же оказывается, что 2эксп > 2кр, то выдвинутая гипотеза отвергается, считается, что она противоречит опытным данным.
В нашем случае k = 11, r = 11 - 1- 1 = 9 (по выборке был определен один параметр - ). Если положить = 0,95 ( = 0,05 - наиболее употребительное значение уровня значимости), то по таблице распределения 2 находим, что 2кр = 16,92. Между тем 2эксп = 2,45 < 2кр. Так что мы можем считать, что случайная величина Х имеет показательное распределение с параметром = 0,00115. Если бы мы объединили три последних интервала в один, то имели бы: r = 9 - 1 - 1 = 7; 2кр = 14,07; 2эксп = 2,33 < 2кр.
Случайная величина 2 называется критерием 2. Критерий 2 был предложен Карлом Пирсоном в 1900 г. До этого времени совпадение экспериментальных результатов с теоретическими оценивалось по тому, как они выглядят на графике.
Нам осталось ответить на вопросы, поставленные в пункте 6.1. Мы считаем справедливым показательный закон с параметром = 0,00115. Следовательно, М(Х) =1/ 870 (ч).
р(Х > 1000) = е-*1000 - е- = е-1,15 0,32;
р(Х < 200) = е0 - е-*200 = 1 - е-0,23 0,21.