Шелехова Л.В. Математические методы (в схемах)
.pdfэто
Эмпирическая функция распределения
функция Fn( x) nx , где n – объем выборки, а nх – число значений Х в вы- n
борке, меньших х
Основное значение эмпирической функции распределения состоит в том, что она используется в качестве оценки функции распределения F(x) = P(X < x).
СВОЙСТВА ЭМПИРИЧЕСКОЙ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ
значения эмпирической функции Fn (x) принадлежат отрезку [0, 1]
если xi – наименьшее наблюдаемое значение, то Fn( x) 0 |
при х ≤x1; |
если xn- наибольшее наблюдаемое значение, то Fn(x) 1 при x > x1 |
|
Fn( x) – неубывающая функция |
|
|
|
Пример. От каждого факультета на конференцию было делегировано |
|
следующее |
количество студентов: 5, 1, 2, 1, 1, 2, 5, 1, 8, 1, 1, 1, 4, 4, 5, 2, 1, 5. Построить эмпирическую функцию распределения.
Найдем сначала статистический ряд распределения числа студентов, принявших участие в конференции.
|
хi |
|
|
|
|
|
|
1 |
|
|
2 |
|
|
|
|
4 |
|
5 |
|
8 |
|
|||||
|
fi |
|
|
|
|
|
|
|
8 |
|
|
|
3 |
|
|
|
|
|
2 |
|
|
4 |
|
|
1 |
|
|
|
|
|
|
|
|
18 |
|
|
18 |
|
|
|
|
18 |
|
18 |
|
18 |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Запишем эмпирическую функцию распределения: |
|
|
|
|
|
|
||||||||||||||||||||
|
|
0, |
|
|
если |
х |
1; |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
, |
|
|
если |
|
1 |
х |
|
2; |
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
18 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
11 |
, |
|
|
если |
|
2 |
|
х |
|
4; |
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
18 |
|
|
|
|
|
|
|
|
|
|||||||||||||||
F18 ( x ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
13 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
, |
|
|
если |
|
4 |
|
х |
5; |
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
18 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
17 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
, |
|
|
если |
|
5 |
|
x |
8; |
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
18 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
1, |
|
|
|
если |
х |
8 . |
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20
1
|
1 |
|
2 |
|
3 |
|
4 |
5 |
6 |
|
7 |
|
8 |
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
это |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
Гистограмма выборки |
|
|
|
фигура, построенная по данному алгоритму |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
|
Разбить область значений Х (непрерывная случайная величина с неизвестной |
|
|
|
|
||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||
|
плотностью вероятности |
f ( x)) на интервалы длины hi |
(i |
|
): [x0; x1 ), [x1; x2 ), |
|
|
|
|
|
|
||||||||||||||||||||||||||
|
1;s |
|
|
|
|
|
|
||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
[x2; x3 ), ...... [xs-1;xs] (количество интервалов выбирается произвольно, обычно не |
|
|
|
|
|
|
||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||
|
меньше 5 и не больше 15) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
Обозначить через xi |
середины интервалов, а через mi |
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
|
число элементов выбор- |
|
|
||||||||||||||||||||||||||||||||||
|
ки, попавших в указанный интервал |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
Вычислить оценку плотности вероятности |
f( x |
)~ |
mi |
в точке xi , если дли- |
|
|
||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
nh |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
ны интервалов hi i |
(i |
|
|
|
) различны, |
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
1;s |
или |
|
|
относительные |
частоты |
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
mi |
в точке x |
, если длины интервалов h |
(i |
|
|
) одинаковы |
|
|
|||||||||||||||||||||||||
|
|
|
|
1;s |
|
|
|
|
|
||||||||||||||||||||||||||||
|
f( xi )~ |
i |
|
|
|
|
|
|
|
|
|
|
|
i |
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
ni |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
Составить интервальный статистический ряд вида: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
Элементы |
|
|
|
|
|
|
|
[x0; x1 ) |
[x1; x2 ) |
|
.... |
|
|
|
|
[xk-1;xk] |
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
хi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Относительная частота |
|
f1 |
|
f2 |
|
|
.... |
|
|
|
|
|
fm |
n |
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
fi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
fi 1 |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i 1 |
|
|
|
|
||||
|
В прямоугольной системе координат построить прямоугольники с основаниями |
|
|
|
|
||||||||||||||||||||||||||||||||
|
|
|
|||||||||||||||||||||||||||||||||||
|
h (i |
|
)и высотами |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
1;s |
f (xi ). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Пример. В процессе исследования было зафиксировано время ( в минутч) решения задачи студентами группы «1 А» педагогического факультета: 10, 10, 10, 12, 13, 13, 13, 14, 14, 15, 15, 15, 15, 15, 15, 16, 16, 16, 16, 16, 20, 24, 30, 30, 35. Постройте таблицу сгруппиро-
ванных частот и гистограмму.
21
Размах варьирования R xmax xmin 35 10 25. В нашем случае область значений
Х удобно разбить на интервалы hi i (i 1;s ) |
равной длины – 5 минут. |
|
|
|
|
||
Номер |
Границы интервала |
Число элементов вы- |
|
Плотность относи- |
|||
интервала |
|
борки, попавших в |
|
тельной частоты |
|||
|
|
указанный интервал |
|
f ( xi ) ~ |
m |
i |
|
|
|
mi |
|
|
|
||
|
|
|
ni |
||||
|
|
|
|
||||
1 |
[10; 15) |
9 |
|
0,36 |
|
|
|
|
|
|
|
|
|
|
|
2 |
[15; 20) |
11 |
|
0,44 |
|
|
|
|
|
|
|
|
|
|
|
3 |
[20; 25) |
2 |
|
0,08 |
|
|
|
4 |
[25; 30) |
0 |
|
0 |
|
|
|
|
|
|
|
|
|
|
|
5 |
[30; 35] |
3 |
|
0,12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
10 |
15 |
20 |
25 |
30 |
35 |
это
Кумулята распределения (график накопленных частот)
ломанная, отрезки которой соединяют точки (xi, ki) ((xi, fi(cum))), i = 1; m,
m
где fi(cum) fi , i 1;m - накопительная частота элемента xi.
i 1
Кумулята распределения является графиком, отражающим функцию распределения случайной величины.
Пример. На факультете иностранных языков преподавательский состав характеризуется по стажу работы следующим образом: до 2-х лет - 6 человек, от 2 до 5 - 7, от 5 до 10 - 21 человек, от 10 до 20 - 59 человек, свыше 20 - 16. Постройте таблицу сгруппированных частот и кумулянту распределения стажа работы сотрудников данного факультета.
Номер |
Границы |
Число элементов |
Плотность относи- |
Накопительная |
||
интервала |
интервала |
выборки, попавших в |
тельной частоты |
частота |
||
|
|
указанный интервал |
|
mi |
|
fi(cum) |
|
|
mi |
f ( xi ) ~ |
|
||
|
|
ni |
|
|||
1 |
(0; 2] |
6 |
0,055 |
|
|
0,055 |
2 |
(2; 5] |
7 |
0,064 |
|
|
0,119 |
3 |
(5; 10] |
21 |
0,193 |
|
|
0,312 |
4 |
(10; 20] |
59 |
0,541 |
|
|
0,853 |
5 |
более 20 |
16 |
0,147 |
|
|
1,000 |
|
|
|
|
|
|
|
22
2 |
5 |
10 |
20 |
характеризуют
Меры формы распределения
основные черты "внешнего вида" распределения
степень асимметрии относительно центрального значения (скос)
степень крутизны (уплощенности) в сравнении с нормальным распределением (эксцесс)
расположение ключевых точек (квантили).
Асимметричность (коэффициент асимметрии или скоса – А)
характеризует
смещение распределения относительно математического ожидания по величине и направлению
вычисляется по формуле
A xi x 3
n 3
Если полигон асимметричен, то одна из его ветвей, начиная с вершины, имеет более пологий «спуск», чем другая. При положительном значении коэффициента распределения более пологий «спуск» полигона наблюдается справа. В противном случае – слева. Для нормального распределения коэффициент асимметрии равен 0. Асимметрия менее 0,5 считается малой (малыми значениями можно пренебречь).
Эксцесс
характеризует
остроконечность (положительное значение) или пологость (отрицательное значение) распределения по сравнению с нормальной кривой
вычисляется по формуле
E xi x4 3 n 4
23
Эксцесс нормального распределения равен 0. Если выборочному распределению соответствует отрицательный эксцесс, то полигон имеет более пологую вершину по сравнению с нормальной кривой. В случае положительного эксцесса – более крутой. Отрицательным пределом величины эксцесса является число –2, положительный предел – не существует. На практике для генеральных совокупностей больших объемов малыми значениями эксцесса можно пренебречь.
Пример. Была обследована группа из 20 человек с целью определения у них уровня развития лидерских способностей. Измерения проводились по 10-балльной шкале и представлены в таблице:
№ респондента |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
уровень развития |
6 |
3 |
4 |
4 |
5 |
6 |
4 |
6 |
5 |
5 |
лидерских способностей |
||||||||||
№ респондента |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
уровень развития |
5 |
1 |
4 |
4 |
4 |
4 |
3 |
5 |
3 |
5 |
лидерских способностей |
Провести полный анализ данных можно с помощью программы «Анализ данных в EXCEL», инструмента «Описательная статистика». В результате данной операции можно получить следующие данные:
Среднее |
4,3 |
Интервал |
5 |
Стандартная ошибка |
0,272416 |
Минимум |
1 |
Медиана |
4 |
Максимум |
6 |
Мода |
4 |
Сумма |
86 |
Стандартное отклонение |
1,218282 |
Счет |
20 |
Дисперсия выборки |
1,484211 |
Наибольший(1) |
6 |
Эксцесс |
1,501552 |
Наименьший(1) |
1 |
Асимметричность |
-0,83829 |
Уровень надежности(95,0%) |
0,570173 |
1.3. ВЫЧИСЛЕНИЕ ОШИБКИ РЕПРЕЗЕНТАТИВНОСТИ
ДЛЯ СОБСТВЕННО СЛУЧАЙНОЙ ВЫБОРКИ
это
Распределение признака
закономерность встречаемости различных его значений
|
|
это |
|
|
которые |
Параметры |
|
числовые характеристики |
|
||
|
|
|
|
||
распределения |
|
|
признака |
|
|
|
|
|
|
|
|
указывают расположение «средних» значений признака
степень изменчивости «средних» значений
вероятность появления определенных значений признака
24
В качестве данных параметров выступают математическое ожидание, |
||||||||
дисперсия, |
показатели |
асимметрии |
и |
эксцесса. |
Однако |
в |
психолого- |
|
педагогических исследованиях оперируют не параметрами, а их приближенны- |
||||||||
ми значениями, которые называются оценками параметров. Это обусловлено |
||||||||
тем, что при помощи выборочного метода нельзя получить абсолютно точную |
||||||||
оценку наблюдаемого признака, то есть существует вероятность ошибки. |
||||||||
Ошибка репрезентативности |
это |
|
|
|
||||
|
|
|
|
|
||||
отклонение выборочного среднего значения признака от генерального |
||||||||
|
ВИДЫ ОШИБОК РЕПРЕЗЕНТАТИВНОСТИ |
|
|
|||||
Случайная |
это |
|
возникающая |
из-за случайной вариа- |
||||
ошибка, |
||||||||
(статистическая) |
ции значений, так как наблюдается только часть |
|||||||
ошибка |
||||||||
объектов, а не вся генеральная совокупность |
||||||||
|
|
|||||||
С увеличением объема выборки уменьшаются случайные ошибки |
||||||||
Систематическая |
это |
|
|
|
|
|
||
неконтролируемые перекосы в распределении |
||||||||
|
ошибка |
выборочных наблюдений |
|
|
||||
Число респондентов не влияет на величину систематической ошибки |
Вычисление ошибки репрезентативности предполагает определение доверительного интервала для оценки математического ожидания нормального распределения при известном (неизвестном) значении среднеквадратического отклонения σ этого распределения.
это
Доверительный интервал
интервал, покрывающий неизвестный параметр с заданной надежностью
Поясним на примере смысл, который имеет заданная надежность : если произведено достаточно большое число выборок, то надежность γ=0,95 указывает, что в 95% из них параметр действительно заключен в доверительный интервал; лишь в 5% случаев он может выйти за границы данного интервала.
25
ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ДЛЯ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ ПРИ ИЗВЕСТНОМ σ
дано
найти
количественный признак Х генеральной совокупности распределён нормально
известно среднеквадратическое отклонение σ этого распределения
выборочная средняя x является случайной величиной X , то есть x изменяется от выборки к выборке
выборочные значения признака х1, х2, …, хn отражают одинаково распределённые независимые случайные величины Х1, Х2, …, Хn, то есть математиче-
ское ожидание каждой из этих величин равно М ( X ) = а и среднеквадратиче-
ское отклонение (Х) . n
неизвестное математическое ожидание а по выборочной средней x
доверительный интервал, покрывающий параметр а с надёжностью γ
решение |
|
Для нахождения доверительного интервала, |
покрывающего параметр а с |
||||||||||||||||||||||||||||||||||||||||||||||||||||
|
надёжностью γ, рассмотрим соотношение Р (| |
X |
|
– а| < δ) = γ. Используя фор- |
|||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
мулу |
Р(|Х– а| < δ) = 2Ф |
|
, в которой заменив Х на |
|
|
|
и σ на ( |
Х |
), запи- |
|||||||||||||||||||||||||||||||||||||||||||||
|
|
Х |
|||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= 2Ф(t), где t = |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
шем Р (| |
|
– а| < δ) =2Ф |
|
|
|
|
|
|
|
|
|
n |
|
(число t определяется по |
||||||||||||||||||||||||||||||||||||||||
|
X |
|
|
|
n |
|
|||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
таблице функции Лапласа: находим аргумент t, которому соответствует зна- |
||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
чение функции Лапласа, равное Ф(t)= |
|
). |
|
Из данного равенства выразим |
||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
t |
|
|
|
|
|
|
|
|
|
|
|
t |
2 |
|
|
|
|
|
|
|
|
|
t |
|
|
|
|
|
|
|
|
|
|
|
|
t |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
. Тогда Р |
|
Х а |
|
|
|
|
|
|
|
|
|
=2Ф(t) или |
Р x |
|
|
|
|
|
|
|
a x |
|
|
|
= 2Ф(t) = γ. |
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||
|
Таким образом, доверительный интервал |
|
|
|
|
t |
|
|
|
|
|
|
|
t |
|
||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||
|
x |
|
|
|
|
|
|
|
; |
|
x |
|
|
|
|
|
покрывает не- |
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
n |
известный параметр а с надёжностью γ.
Из полученного доверительного интервала запишем формулу ошибки
репрезентативности для собственно случайного отбора t .
n
Для оценки математического ожидания с наперед заданной точностью δ и надежностью γ необходим минимальный объем выборки, который находим
по формуле: n t 2 .
26
ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ДЛЯ ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ ПРИ НЕИЗВЕСТНОМ σ
Количественный признак Х генеральной совокупности распределён нормально.
дано
Неизвестно среднеквадратическое отклонение σ этого распределения.
Выборочная средняя x является случайной величиной X , то есть x изменяется от выборки к выборке.
Плотность распределения Стьюдента S(t, n). Распределение Стьюдента определяется параметром n – объемом выборки и не зависит от неизвестных параметров a и σ.
|
найти |
|
|
Доверительный интервал, покрывающий параметр а с надёжностью γ. |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
По данным выборки строится случайная величина |
|
|
|
|
|
a (ее воз- |
||
|
|
|
|
|
T |
|
|
X |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
S / |
|
n |
|||||
|
|
|
|
|
|
|
|
|
|||||
решение |
|
|
|
|
|
|
|||||||
|
|
можные значения обозначают через t), имеющая распределение Стьюдента с |
k=n–1 степенями свободы. В данном соотношении X - выборочная средняя, S
– «исправленное» среднеквадратическое отклонение, n – объем выборки. Для нахождения доверительного интервала, покрывающего параметр а
с надёжностью γ, воспользуемся тем фактом, что S(t, n) – четная функция от t
и вероятность осуществления неравенства |
|
X |
|
|
a |
|
|
|
определяется по фор- |
|||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||
S / |
n |
|||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
t |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
муле P( |
|
X a |
|
|
|
|
|
|
S(t,n)dt . Неравенство в круглых скобках можно пре- |
|||||||||||||||||||||||||||||||||||||||||
|
t ) 2 |
|
||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
S / |
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
образовать |
|
|
|
в |
|
|
|
равносильное |
ему |
|
|
|
|
двойное |
|
|
|
|
|
неравенство: |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||
|
|
|
|
t |
|
|
S |
|
|
|
|
|
|
|
|
t |
|
S |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X и S на неслу- |
||||||||||||||||||||||
P |
X |
|
|
|
|
|
a X |
|
|
|
|
. Заменив случайные величины |
|
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
||||||
чайные величины |
|
|
|
|
и s, |
которые можно найти по выборке |
|
|
|
|
xi m i |
, |
||||||||||||||||||||||||||||||||||||||
|
x |
|
|
|||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
i 1 |
||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
x |
||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
ni xi |
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
x |
|
|
|
|
|
|
|
доверительный интервал |
|
|
|
t s |
|
|
|
t s |
, по- |
||||||||||||||||||||||||||||||
|
|
|
i 1 |
|
|
|
|
|
|
|
, |
найдем |
|
|
|
|
|
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
s |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
; x |
|
|
|
|
|
||||||
|
|
|
|
|
n 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
n |
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
крывающий неизвестный параметр a c надежностью γ. Используя «Таблицу значений t t( ,n)» по заданным n и γ можно найти tγ.
Из полученного доверительного интервала запишем формулу ошибки
репрезентативности для собственно случайного отбора t s . n
27
Пример. Была проведена выборка студентов в количестве 49 человек. Студентам данной выборки был предложен тест. Фиксировалось время выполнения теста. Среднее значение времени по выборке составило 3,9 минут, а среднее квадратическое отклонение - 3 минуты. Найти доверительные интервалы для оценки неизвестного математического ожидания а, если задана надёжность оценки γ=0,95.
Найдем t. Из соотношения 2Ф(t)=0,95 получим Ф(t)=0,475. По таблице функции Лап-
ласа находим t=1,96. Найдем точность оценки: |
t |
|
1,96 3 |
0,84. |
|||
|
|
|
|
|
|||
|
|
n |
49 |
|
|
Доверительный интервал: (3,9–0,84; 3,9+0,84) или (3,06; 4,74).
Пример. Пусть была произведена выборка студентов в количестве 784 человек. Средний возраст по выборке - 20 лет, среднеквадратическое отклонение - 2 года. Найти доверительные интервалы для оценки неизвестного математического ожидания а, если задана надёжность оценки γ=0,95.
Найдем t. Из соотношения 2Ф(t)=0,95 получим Ф(t)=0,475. По таблице функции Лап-
ласа находим t=1,96. Найдем точность оценки: |
t |
|
1,96 2 |
0,14. |
|||
|
|
|
|
|
|||
|
|
n |
784 |
|
|
Доверительный интервал: (20–0,14; 20+0,14) или (19,86; 20,14).
Пример. Была проведена выборка студентов в количестве 50 человек. Данные студенты должны были решить задачу несколькими способами. Полученные результаты представлены в таблице.
xi |
0 |
1 |
2 |
3 |
4 |
mi |
5 |
15 |
15 |
5 |
10 |
|
|
|
|
|
|
Оценить неизвестное математическое среднее ожидание при помощи доверительного интервала с надежностью 0,95.
Найдем выборочную среднюю и исправленное среднеквадратическое отклонение:
|
|
|
0 5 1 15 |
|
2 15 |
3 5 |
4 10 |
|
130 |
2,6 . |
|
|
|
|
|
|
|
|
|||||
|
x |
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
50 |
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
50 |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
5 2,6 2 |
15 1,6 2 |
15 0,6 2 |
5 0,4 2 |
10 1,4 2 |
|
|
|
|
|
|
|
|
||||||||
s |
|
|
|
|
89 |
|
|
|
. |
||||||||||||||
|
|
|
|
2 |
|||||||||||||||||||
|
|
|
|
|
|
|
49 |
|
|
|
|
|
49 |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Используя «Таблицу значений t t( ,n)» по заданным n и γ найдем tγ=2,009.
|
t s |
|
|
|
|
|
||
Точность оценки вычислим по формуле: |
2,009 2 |
0,4018. |
||||||
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|||
|
|
n |
50 |
|
|
|
Доверительный интервал: (2,6–0,4018; 2,6+0,4018) или (2,1982; 3,0018).
Пример. Была проведена выборка студентов в количестве 50 человек. Данные студенты должны были решить тест. Результаты исследования длительности выполнения тестового задания (в минутах) представлены в группированном виде:
ti ;ti 1 |
[24; 32) |
[32; 40) |
[40; 48) |
[48; 56) |
[56; 64) |
[64; 72) |
[72; 80] |
mi |
2 |
4 |
10 |
15 |
11 |
5 |
3 |
|
|
|
|
|
|
|
|
Построить доверительный интервал с надежностью 0,99 для средней длительности выполнения тестового задания.
28
Найдем выборочную среднюю и исправленное среднеквадратическое отклонение:
|
|
|
28 2 36 4 44 10 52 15 |
60 11 68 5 |
76 3 |
52 ,96 . |
||||||||||||
t |
||||||||||||||||||
|
50 |
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
s |
|
|
2 31 2 4 17 2 10 9 2 |
15 1 2 11 72 |
5 152 |
3 232 |
11,502. |
|||||||||||
|
|
|
49 |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Используя «Таблицу значений |
t |
t( ,n)» по заданным n и γ найдем |
||||||||||||||||
tγ=2,679. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Точность оценки вычислим по формуле: |
t s |
|
|
|
2,679 11,502 |
|
4,357 . |
|||||||||||
|
|
|
7,072 |
|
|
|||||||||||||
|
n |
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Доверительный интервал: (48,603; 57,317).
29