- •Томский государственный университет систем управления и радиоэлектроники (тусур)
- •2012 Реферат
- •Томский государственный университет систем управления ирадиоэлектроники
- •На курсовую работу по дисциплине
- •Часть I.
- •Часть II.
- •2012 Содержание
- •1 Постановка задачи
- •Часть I.
- •Часть II
- •2.1 Теоретический обзор
- •Распределение Стьюдента
- •2.2 Расчеты
- •2.3. Выводы
- •3. Часть II
- •3.1 Теоретические сведения
- •4. Заключение
- •5. Список использованных источников
1 Постановка задачи
В первой части данной работы нужно объяснить, что такое точечное и интервальное оценивание, а так же закрепить полученные знания на примере оценивания таких параметров, как дисперсия, математическое ожидание и вероятность.
Во второй части необходимо рассмотреть такое понятие, как регрессионный анализ, а именно метод наименьших квадратов (МНК). Также, во второй части нужно закрепить полученные знания на практике. Задача состоит в извлечении истинного тренда.
Часть I.
Дана выборка из N =100 значений.
Требуется:
а) найти статистический ряд;
б) построить гистограмму и полигон частот;
в) найти оценки для математического ожидания и дисперсии;
г) считая распределение генеральной совокупности нормальным,
найти границы доверительного интервала для математического ожидания и дисперсии при надёжности а= 0,95;
д) проверить с помощью критерия гипотезу о том, что выборка извлечена из нормальной генеральной совокупности с математическим ожиданием и средним квадратическим отклонением, равными соответственно статистическому среднему и статистическому среднему квадратичному отклонению. Уровень значимости принять равным а = 0,05.
Часть II
Из смеси сигнал + шум методом МНК выделить тренд в рамках модели сигнала как кубического полинома. И построить график разности тренда от найденной функции.
Истинный тренд имеет вид:
Функция сигнал + шум имеет вид:
2. Часть I
2.1 Теоретический обзор
Теория оценок.
Параметры законов распределения обычно оцениваются по выборке, т.е. строится функция выборочных данных, которая мало отличается от истинного значения параметра. Существуют разные способы оценивания. Основными являются точечные и интервальные оценки параметров закона распределения.
1. Точечное оценивание - это вид статистического оценивания, при котором значение неизвестного параметра приближается отдельным числом.
Способы точечного оценивания:
Метод моментов.
Метод максимального правдоподобия
Точечные оценки характеризуются следующими свойствами:
Смещение. Оценка параметра называется несмещенной, если ее математическое ожидание равно истинному значению оцениваемого параметра.
Состоятельность. При достаточно больших объемах выборки оценка параметра стремится к истинному значению по вероятности.
Эффективность. Та оценка, у которой дисперсия минимальна, называется эффективной оценкой.
Для точечных оценок математического ожидания и дисперсии были найдены следующие формулы:
Где n – объем выборки
2. Интервальная оценка - оценка, представляемая интервалом значений, внутри которого, с задаваемой исследователем вероятностью, находится истинное значение оцениваемого параметра.
Главную роль в таком оценивании играет доверительный интервал.
Доверительный интервал – интервал, в котором находится истинное значение параметра с заданной вероятностью.
Вероятность того, что истинное значение лежит в интервале называетсядоверительной вероятностью (коэффициентом доверия) или надежностью, соответствующей данному доверительному интервалу.
Для построения доверительного интервала требуется знать:
1. Закон распределения статистики.
2. Точечная оценка параметров.
3. Уровень значимости
4. Квантиль P – значение случайной величины, при котором функция распределения равна P.
Формулы для расчета доверительного интервала для математического ожидания и дисперсии:
Где N объем выборки, msr – точечная оценка математического ожидания, St1-a/2(N-1) - квантиль распределения Стьюдента уровня 1-a/2 и степенью свободы N-1, S2 – точечная оценка дисперсии,
(N-1)- квантиль распределения Пирсона уровня 1-а.2, и степенью свободы N-1.
Квантили этих распределений табулированы.
Критерий согласия Пирсона
Он основан на сравнении эмпирических частот интервалов группировки с теоретическими (ожидаемыми) частотами, рассчитываемыми по формулам теоретического распределения.
Условия применения: объем выборки , выборочные данные сгруппированы в интервальный вариационный ряд с числом интервалов не менее 7, ожидаемые (теоретические) частоты интервалов не должны быть меньше 5.
Гипотеза Н0: — плотность распределениягенеральной совокупности, из которой взята выборка, соответствует теоретической модели нормального распределения.
Альтернатива Н1:
Уровень значимости: .
Порядок, применения:
1. Формулируется гипотеза, выбирается уровень значимости .
2. Получается выборка объема независимых наблюдений и представляется эмпирическое распределение в виде интервального вариационного ряда.
3. Рассчитываются выборочные характеристики и S. Их используют в качестве генеральных параметров и нормального распределения, с которым предстоит сравнить эмпирическое распределение.
4. Вычисляются значения теоретических частот попадания в i-й интервал группировки. Для этого необходимо вычислить:
где Ф0(u) — функции Лапласа, xвi и хнi — верхняя и нижняя границы i-го интервала группировки.
Если окажется, что вычисленные ожидаемые частоты некоторых интервалов группировки меньше 5, то соседние интервалы объединяются так, чтобы сумма их ожидаемых частот была больше или равна 5. Соответственно складываются и эмпирические частоты объединяемых интервалов.
5. Значение -критерия рассчитывается по формуле:
где ni — эмпирические частоты; – ожидаемые (теоретические) частоты; k — число интервалов группировки после объединения.
6. Из таблиц распределения находится критическое значениекритерия для уровня значимостии числа степеней свободы r = k-3
7. Вывод: если то эмпирическое распределение не соответствует нормальному распределению на уровне значимости, в противном случае нет оснований отрицать это соответствие.