- •Министерство образования и науки Республики Казахстан
- •1. Учебная программа дисциплины – Syllabus
- •1. 1. Данные о преподавателях:
- •1.1 Данные о дисциплине:
- •Выписка из учебного плана
- •1.5. Краткое описание дисциплины
- •1.6. Перечень и виды заданий и график их выполнения:
- •Виды заданий и сроки их выполнения
- •1.7. Список литературы
- •1.8. Контроль и оценка знаний
- •Распределение рейтинговых баллов по видам контроля
- •Календарный график сдачи всех видов контроля
- •Оценка знаний студентов
- •2. Содержание Активного раздаточного материала
- •2.1 Тематический план курса составляется в виде таблицы, где указываются наименование темы и количество академических часов, предусмотренных для каждой темы. Тематический план курса
- •2.2 Конспект лекционных занятий
- •Глава 1. Основные понятия и определения статистики
- •Тема 2. Показатели описательной статистики. Среднее, дисперсия, стандартное отклонение, эксцесс, асимметрия, интервалы. Компьютерные технологии получения дескриптивной статистики.
- •Глава 2. Выборки.
- •Тема 5. Анализ одной выборки. Анализ однородности выборки. Доверительные интервалы для среднего. Доверительные интервалы для средних выборок. Компьютерные технологии анализа.
- •Тема 6. Анализ двух выборок. Выявление достоверности различий. Параметрические и непараметрические методы анализа выборок. Компьютерные технологии анализа одной выборки.
- •Глава 3. Анализ статданных.
- •Тема 7. Дисперсионный анализ статданных. Однофакторный дисперсионный анализ статистических данных. F- тест для для дисперсий. Компьютерные технологии анализа.
- •Тема 8. Корреляционный анализ статданных. Коэффицент корреляции Пирсона. Коэффициент ранговой корреляции. Ложная и истинная корреляция Компьютерные технологии анализа.
- •Глава 4. Регрессионный анализ.
- •Тема 9. Регрессионный анализ статданных. Простая линейная регрессии. Оценивание параметров линейной регрессиии методом наименьших квадратов, коэффициент детерминации.
- •Тема 10. Оценка существенности параметров линейной регрессии. Оценка качества регрессии f-критерий Фишера, t-статистика. Проверка значимости параметров регрессии. Понятие нелинейной регрессии.
- •Тема 11. Множественная регрессия. Многомерная регрессионая модель. Фиктивные переменные. Кодирование значений качественных переменных. Мультиколлинеарность.
- •Глава 5. Анализ временных рядов.
- •Тема 12. Анализ статданных в виде временных рядов. Временные ряды и их характеристики. Аддитивная и мультипликативная модель. Декомпозиция временного ряда.
- •Тема 13. Анализ и получение тренда. Методы аналитического выравнивания. Метод скользящего среднего. Метод экспоненциального сглаживания. Оценка точности трендовой модели.
- •Тема 14. Модели временных рядов. Понятие об авторегрессионных моделях временных рядов. Коэффицент автокорреляции и автокорреляционная функция.Тест Дарбина-Уотсона.
- •Тема 15. Анализ моделей временных рядов. Решение проблемы автокорреляции. Учет сезонности. Коинтеграция временных рядов.Тест Энгла - Гренжера. Современные тенденции статанализа.
- •2.3 Планы лабораторных занятий
- •Технология построения трендов в Microsoft Excel Порядок выполнения лабораторной работы
- •Форматирование метки линии тренда.
- •Задание на выполнение лабораторной работы:
- •Задание на выполнение лабораторной работы
- •2.4 Планы занятий в рамках самостоятельной работы студентов под руководством преподаватля (срсп)
- •Тема 1. Функции распределения дискретной случайной величины. Биномиальное распределение. Применение компьютерных технологий при статистическом исследовании биномиального распределения. (2 ч.)
- •Тема 3. Функции распределения дискретной случайной величины. Распределение Пуассона. Применение компьютерных технологий при статистическом исследовании распределения Пуассона. (2 ч.)
- •Тема 4. Функции распределения непрерывной случайной величины. Гауссово распределение. Применение компьютерных технологий при статистическом исследовании Гауссово распределения. (2 ч.)
- •Тема 5. Функции распределения непрерывной случайной величины. Распределение хи-квадрат. Применение компьютерных технологий при статистическом исследовании распределения хи-квадрат. (2 ч.)
- •Тема 6. Функции распределения непрерывной случайной величины. Распределение Стьюдента. Применение компьютерных технологий при статистическом исследовании распределения Стьюдента. (2 ч.)
- •Тема 7. Функции распределения непрерывной случайной величины. Распределение Фишера. Применение компьютерных технологий при статистическом исследовании распределения Фишера. (2 ч.)
- •Тема 9. Генерация случайных чисел. Применение компьютерных технологий при генерации случайных чисел. (2 ч.)
- •Тема 10. Статистические гипотезы. Одновыборочный z-тест для средних величин. Применение компьютерных технологий при проведении одновыборочного z-теста для средних величин. (2 ч.)
- •Тема 11. Статистические гипотезы. Двухвыборочный z-тест для средних величин. Применение компьютерных технологий при проведении двухвыборочного z-теста для средних величин. (2 ч.)
- •Тема 12. Статистические гипотезы. Одновыборочный t-тест для средних величин. Применение компьютерных технологий при проведении одновыборочного t-теста для средних величин. (2 ч.)
- •Тема 15. Статистические гипотезы. Парный двухвыборочный t-тест для средних величин. Применение компьютерных технологий при проведении парного двухвыборочного t-теста для средних величин. (2 ч.)
- •2.5 Планы занятий в рамках самостоятельной работы студентов (срс)
- •Тема 1. Регрессионный анализ с применением компьютерных технологий. Интерпретация результатов.
- •Тема 2. Регрессионный анализ. Метод наименьших квадратов (мнк).Интерпретация результатов.
- •Тема 3. Регрессионный анализ. Анализ вариации зависимой переменной.
- •Тема 4. Регрессионный анализ. Условия Гаусса-Маркова по классической нормальной линейной регрессионной модели.
- •Тема 5. Регрессионный анализ. Стандартная ошибка регрессии.
- •Тема 6. Регрессионный анализ. Стандартные ошибки коэффициентов регрессии.
- •Тема 7. Регрессионный анализ. Проверка гипотез по коэффициентам регрессии.
- •Тема 8. Регрессионный анализ. Нелинейные регрессии.
- •Тема 9. Регрессионный анализ. Прогнозирование в регрессионных моделях.
- •Тема 10. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Получение тренда. Интерпретация результатов.
- •Тема 11. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Исследование автокорреляции данных временного ряда.
- •Тема 12. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Тест Дарбина-Уотсона.
- •Тема 13. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Тест на коинтеграцию на основе критерия Энгла-Грэнжера.
- •Тема 14. Статистический программный инструментарий. Обзор статистических функций ms Excel.
- •Тема 15. Статистический программный инструментарий. Обзор возможностей пакета "Анализа данных" ms Excel.
- •2.6. Тестовые задания для самоконтроля с указанием ключей правильных ответов
- •24. Имеют ли в общем случае смысловую нагрузку свободный член уравнения линейной регрессии?
- •25. Что такое корреляционные поля?
- •26. Что такое авторегрессионая модель временного ряда?
- •27. Что означает регрессионная модель с лагированными переменными?
- •28. Какой показатель определяется отношением дисперсии результативного признака регрессии к общей дисперсии результативного признака?
- •29. Какой критерий применяется для проверки гипотезы - средние двух выборок относятся к одной и той же совокупности?
- •30. Какой метод применяется для проверки гипотезы - относится та или иной вариант к данной статистической совокупности?
- •Перечень экзаменационных вопросов по пройденному курсу
- •Глоссарий
- •Выходные сведения
Тема 6. Анализ двух выборок. Выявление достоверности различий. Параметрические и непараметрические методы анализа выборок. Компьютерные технологии анализа одной выборки.
Анализ двух выборок
Выявление достоверности различий. Следующей задачей статистического анализа, решаемой после определения основных выборочных характеристик и анализа одной выборки, является совместный анализ нескольких выборок. Важнейшим вопросом, возникающим при анализе двух выборок, является вопрос о наличии различий между этими выборками. Обычно для этого проводят проверку статистических гипотез о принадлежности обеих выборок одной генеральной совокупности или о равенстве генеральных средних. Такие различия выявляются путем сравнения данных, например при реализации турфирмой путевок за периоды до и после начала активной рекламной компании. Если сопоставить средние значения числа реализованных за месяц путевок до и после начала рекламной компании, вероятнее всего они будут различаться. Можно ли по этим данным сделать вывод об эффективности рекламной компании? Для решения задач такого типа используются так называемые критерии различия. Для проверки одной и той же гипотезы могут быть использованы разные статистические критерии. Правильный выбор критерия определяется как спецификой данных и проверяемых гипотез, так и уровнем статистической подготовки исследователя.
Статистические критерии различия подразделяются на параметрические и непараметрические критерии. Параметрические критерии служат для проверки гипотез о параметрах определенных распределений генеральной совокупности (чаще всего нормального распределения). Непараметрические критерии для проверки гипотез не используют предположений о законе распределения генеральной совокупности и не требуют знания параметров распределения.
Параметрические критерии. Параметрические критерии служат для проверки гипотез о положении и рассеивании. Из параметрических критериев наибольшей популярностью при проверке гипотез о равенстве генеральных средних (математических ожиданий) пользуется t-критерий Стьюдента (t-критерий различия). Критерий Стьюдента наиболее часто используется для проверки гипотезы: «Средние двух выборок относятся к одной и той же совокупности». Критерий позволяет найти вероятность того, что оба средних относятся к одной и той же совокупности. Если эта вероятность р ниже уровня значимости (р < 0,05), то принято считать, что выборки относятся к двум разным совокупностям. При использовании t-критерия можно выделить два случая. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t-критерий). Во втором случае, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних, используется так называемый парный t-критерий. Выборки при этом называют зависимыми, связанными. В обоих случаях в принципе должно выполняться требование нормальности распределения исследуемого признака в каждой из сравниваемых групп и равенства дисперсий в сравниваемых совокупностях. Однако на практике по большому счету корректное применение t-критерия Стьюдента для двух групп часто бывает затруднительно, поскольку достоверно проверить эти условия удается далеко не всегда. Для оценки достоверности отличий по критерию Стьюдента принимается нулевая гипотеза, что средние выборок равны между собой. Затем вычисляется значение вероятности того, что изучаемые события произошли случайным образом.
Критерий Фишера. Критерий Фишера используют для проверки гипотезы о принадлежности двух дисперсий одной генеральной совокупности и, следовательно, их равенстве. При этом предполагается, что данные независимы и распределены по нормальному закону. Гипотеза о равенстве дисперсий принимается, если отношение большей дисперсии к меньшей меньше критического значения распределения Фишера.
,
где Fкрит зависит от уровня значимости и числа степеней свободы для дисперсий в числителе и знаменателе (более подробно дисперсионный анализ будет рассмотрен в следующей лекции).
Непараметрические критерии. Непараметрические критерии используются в тех случаях, когда закон распределения данных отличается от нормального или неизвестен. Из большого числа непараметрических критериев рассмотрим критерий хи-квадрат.
Критерий согласия Х2. Бывают ситуации, когда необходимо сравнить две относительные или выраженные в процентах величины (доли). Примером может служить случай проверки успешности трудоустройства молодых специалистов, когда известен процент трудоустроившихся выпускников двух институтов. Для проверки достоверности различий здесь критерий Стьюдента применить не удастся. В таких задачах обычно используют критерий х2 (хи-квадрат). Критерий хи-квадрат относится к непараметрическим критериям.
Здесь, как и в случае с критерием Стьюдента, принимается нулевая гипотеза о том, что выборки принадлежат к одной генеральной совокупности. Кроме того, определяется ожидаемое значение результата. Обычно это среднее значение между выборками рассматриваемого показателя. Затем оценивается вероятность того, что ожидаемые значения и наблюдаемые принадлежат к одной генеральной совокупности.
В MS Excel и других статистических пакетах имеются специальные функции и процедуры для реализации рассмотренных процедур анализа двух выборок.
Литература:
1осн. [231-267], 3доп. [200-242], 6доп. [188-197].
Контрольные вопросы
1. Каковы основные статистические задачи анализа двух выборок?
2. Каков смысл различий между выборками в статистическом исследовании ?
3. Каковы особенности применеия параметрических и непараметрических критериев
при анализе двух выборок?
4. Для проверки каких гипотез используется критерий Стьюдента?
5. Для чего используется критерий Фишера при анализе двух выборок?