Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Архив2 / курсовая docx100 / kursovaya_Ivanov_27_dek_Provereno.docx
Скачиваний:
74
Добавлен:
07.08.2013
Размер:
430.06 Кб
Скачать

1 Постановка задачи

В первой части данной работы нужно объяснить, что такое точечное и интервальное оценивание, а так же закрепить полученные знания на примере оценивания таких параметров, как дисперсия, математическое ожидание и вероятность.

Во второй части необходимо рассмотреть такое понятие, как регрессионный анализ, а именно метод наименьших квадратов (МНК). Также, во второй части нужно закрепить полученные знания на практике. Задача состоит в извлечении истинного тренда.

Часть I.

Дана выборка из N =100 значений.

Требуется:

а) найти статистический ряд;

б) построить гистограмму и полигон частот;

в) найти оценки для математического ожидания и дисперсии;

г) считая распределение генеральной совокупности нормальным,

найти границы доверительного интервала для математического ожидания и дисперсии при надёжности а= 0,95;

д) проверить с помощью критерия гипотезу о том, что выборка извлечена из нормальной генеральной совокупности с математическим ожиданием и средним квадратическим отклонением, равными соответственно статистическому среднему и статистическому среднему квадратичному отклонению. Уровень значимости принять равным а = 0,05.

Часть II

Из смеси сигнал + шум методом МНК выделить тренд в рамках модели сигнала как кубического полинома. И построить график разности тренда от найденной функции.

Истинный тренд имеет вид:

Функция сигнал + шум имеет вид:

2. Часть I

2.1 Теоретический обзор

Теория оценок.

Параметры законов распределения обычно оцениваются по выборке, т.е. строится функция выборочных данных, которая мало отличается от истинного значения параметра. Существуют разные способы оценивания. Основными являются точечные и интервальные оценки параметров закона распределения.

1. Точечное оценивание - это вид статистического оценивания, при котором значение неизвестного параметра приближается отдельным числом.

Способы точечного оценивания:

  1. Метод моментов.

  2. Метод максимального правдоподобия

Точечные оценки характеризуются следующими свойствами:

  1. Смещение. Оценка параметра называется несмещенной, если ее математическое ожидание равно истинному значению оцениваемого параметра.

  2. Состоятельность. При достаточно больших объемах выборки оценка параметра стремится к истинному значению по вероятности.

  3. Эффективность. Та оценка, у которой дисперсия минимальна, называется эффективной оценкой.

Для точечных оценок математического ожидания и дисперсии были найдены следующие формулы:

Где n – объем выборки

2. Интервальная оценка - оценка, представляемая интервалом значений, внутри которого, с задаваемой исследователем вероятностью, находится истинное значение оцениваемого параметра.

Главную роль в таком оценивании играет доверительный интервал.

Доверительный интервал – интервал, в котором находится истинное значение параметра с заданной вероятностью.

Вероятность того, что истинное значение лежит в интервале называетсядоверительной вероятностью (коэффициентом доверия) или надежностью, соответствующей данному доверительному интервалу.

Для построения доверительного интервала требуется знать:

1. Закон распределения статистики.

2. Точечная оценка параметров.

3. Уровень значимости

4. Квантиль P – значение случайной величины, при котором функция распределения равна P.

Формулы для расчета доверительного интервала для математического ожидания и дисперсии:

Где N объем выборки, msr – точечная оценка математического ожидания, St1-a/2(N-1) - квантиль распределения Стьюдента уровня 1-a/2 и степенью свободы N-1, S2 – точечная оценка дисперсии,

(N-1)- квантиль распределения Пирсона уровня 1-а.2, и степенью свободы N-1.

Квантили этих распределений табулированы.

Критерий согласия Пирсона

Он основан на сравнении эмпирических частот интервалов группировки с теоретическими (ожидаемыми) частотами, рассчитываемыми по формулам теоретического распределения.

Условия применения: объем выборки , выборочные данные сгруппированы в интервальный вариационный ряд с числом интервалов не менее 7, ожидаемые (теоретические) частоты интервалов не должны быть меньше 5.

Гипотеза Н0: — плотность распределениягенеральной совокупности, из которой взята выборка, соответствует теоретической модели нормального распределения.

Альтернатива Н1:

Уровень значимости: .

Порядок, применения:

1. Формулируется гипотеза, выбирается уровень значимости .

2. Получается выборка объема независимых наблюдений и представляется эмпирическое распределение в виде интервального вариационного ряда.

3. Рассчитываются выборочные характеристики и S. Их используют в качестве генеральных параметров и нормального распределения, с которым предстоит сравнить эмпирическое распределение.

4. Вычисляются значения теоретических частот попадания в i-й интервал группировки. Для этого необходимо вычислить:

где Ф0(u) — функции Лапласа, xвi и хнi — верхняя и нижняя границы i-го интервала группировки.

Если окажется, что вычисленные ожидаемые частоты некоторых интервалов группировки меньше 5, то соседние интервалы объединяются так, чтобы сумма их ожидаемых частот была больше или равна 5. Соответственно складываются и эмпирические частоты объединяемых интервалов.

5. Значение -критерия рассчитывается по формуле:

где ni — эмпирические частоты; – ожидаемые (теоретические) частоты; k — число интервалов группировки после объединения.

6. Из таблиц распределения находится критическое значениекритерия для уровня значимостии числа степеней свободы r = k-3

7. Вывод: если то эмпирическое распределение не соответствует нормальному распределению на уровне значимости, в противном случае нет оснований отрицать это соответствие.

Соседние файлы в папке курсовая docx100