- •Вопросы к экзамену и зачету по курсу
- •“Статистические методы обработки данных в экологии”
- •Сущность и цели обработки данных
- •Основные понятия математической статистики и теории вероятности
- •Качество данных. Этапы обработки данных. Вычислительные аспекты обработки данных
- •Разновидности исследований. Шкалы измерений
- •Описательная статистика: Закон распределения случайной величины
- •Описательная статистика: Числовые характеристики случайной величины
- •Построение гистограммы распределения
- •Проверка соответствия выбранной модели закона распределения исходным данным. Критерий согласия Колмогорова. Критерий согласия ω2 (омега-квадрат)
- •Проверка статистических гипотез. Основные понятия
- •Проверка гипотезы о равенстве двух средних зависимых нормальных выборок
- •Ранги и ранжирование
- •Непараметрический критерий Вилкоксона для проверки однородности двух независимых выборок.
- •Дисперсионный анализ. Цель и задачи дисперсионного анализа.
- •Sслучайные величины, описывающие неопределенные эффекты.
- •Однофакторный дисперсионный анализ
- •Доверительный интервал для среднего
- •Доверительный интервал для разности средних. Оценка эффекта
- •Оценка эффекта
- •Доверительный интервал для разности средних. Проверка статистических гипотез с помощью доверительных интервалов
- •Проверка статистических гипотез с помощью доверительных интервалов
- •Оценка эффектов уровней фактора
- •Примерами контрастов являются
- •Двухфакторный дисперсионный анализ с пересечением уровней
- •Проверка однородности дисперсий
- •Непараметрические методы факторного анализа. Ранговый однофакторный анализ.
- •Критерий Краскела-Уолллиса.
- •Непараметрические методы факторного анализа. Ранговый двухфакторный анализ без повторений
- •Критерий Фридмана
- •Корреляционный анализ. Постановка задач статистического исследования зависимостей
- •Измерители парной статистической связи. Корреляционное отношение
- •Коэффициент корреляции как измеритель степени тесноты связи
- •Оценка показателей тесноты связи по выборочным данным
- •Оценка показателя тесноты связи по выборочным данным. Анализ коэффициента корреляции
- •Оценка показателей тесноты связи по выборочным данным
- •Анализ коэффициента корреляции
- •Оценка степени тесноты связи при нелинейной зависимости
- •Анализ частных связей. Анализ множественных связей
- •Анализ частных связей
- •Анализ множественных связей
- •Ранговые коэффициенты корреляции
- •Коэффициент ранговой корреляции Спирмена
- •Коэффициент ранговой корреляции Кендалла
- •Зависимость между признаками, измеренными в номинальной или порядковой шкалах
- •Регрессионный анализ. Основные понятия регрессионного анализа
- •Метод наименьших квадратов
- •Простая линейная регрессия
- •Решение этих двух уравнений дает:
- •Проверка значимости линии регрессии
- •Проверка адекватности модели регрессии. Метод остатков
- •Доверительные интервалы для параметров простой линейной регрессии
- •Доверительные интервалы для линии регрессии. Доверительный интервал для значений зависимой переменной
- •Доверительный интервал для значений зависимой переменной
- •Проверка гипотез относительно параметров линейной регрессии
- •Сравнение двух линий регрессии путем сравнения параметров регрессионной модели
- •Обратная простая регрессия
- •Множественная линейная регрессия
- •Нелинейная регрессия
- •Оценка результата измерения: Виды измерений
- •Оценка результата измерения: Погрешности измерений
- •Обработка результатов наблюдений, распределенных по закону Пуассона
Доверительные интервалы для параметров простой линейной регрессии
Подобно тому как выборочное среднее - это оценка истинного среднего (среднего по совокупности), так и выборочные параметры уравнения регрессии a и b - не более чем оценки истинных коэффициентов регрессии. Разные выборки дают разные оценки среднего — точно так же разные выборки будут давать разные оценки коэффициентов регрессии.
В предположении, что закон распределения ошибок εi описываются нормальным законом, оценка параметра b будет иметь нормальное распределение с параметрами:
П оскольку оценка параметра a представляет собой линейную комбинацию независимых нормально распределенных величин, она также будет иметь нормальное распределение с математическим ожиданием и дисперсией:
При этом (1 − α) доверительный интервал для оценки дисперсии σ2 с учетом того, что отношение (n−2)s02/σ2 распределено по закону χ2 с числом степеней свободы n−2 будет определяться выражением
Доверительные интервалы для линии регрессии. Доверительный интервал для значений зависимой переменной
Обычно мы не знаем истинных величин коэффициентов регрессии а и b. Нам известны только их оценки. Иначе говоря, истинная прямая регрессии может пройти выше или ниже, быть более крутой или пологой, чем построенная по выборочным данным. Мы вычислили доверительные интервалы для коэффициентов регрессии. Можно вычислить доверительную область и для самой линии регрессии.
П усть для простой линейной регрессии нужно построить (1−α) доверительный интервал для математического ожидания отклика Y при значении х = х0. Это математическое ожидание равно a+bх0, а его оценка
Поскольку , то .
П олученная оценка математического ожидания представляет собой линейную комбинацию некоррелированных нормально распределенных величин и поэтому тоже имеет нормальное распределение с центром в точке истинного значения условного математического ожидания и дисперсией
Поэтому доверительный интервал для линии регрессии при каждом значении x0 можно представить в виде
Как видно минимальный доверительный интервал получается при x0 равному среднему значению и возрастает по мере того, как x0 “удаляется” от среднего в любом направлении.
Д ля получения множества совместных доверительных интервалов, пригодных для всей функции регрессии, на всем ее протяжении, в приведенное выше выражении вместо tn−2,α/2 необходимо подставить
Доверительный интервал для значений зависимой переменной
Р азброс значений складывается из разброса значений вокруг линии регрессии и неопределенности положения самой этой линии. Характеристикой разброса значений вокруг линии регрессии является оценка дисперсии s02, а неопределенности положения линии регрессии дисперсия D[Y|x0]. Дисперсия суммы двух величин равна сумме дисперсий D[Y] =D[Y|x0]+s02, поэтому доверительный интервал для индивидуального значения Y0 будет иметь вид
Проверка гипотез относительно параметров линейной регрессии
Рассмотрим критерии проверки гипотез относительно параметров a, b и 2.
Заметим, что проверку некоторых гипотез можно связать с построением доверительных интервалов. Пусть, например, проверяется гипотеза H0 : 0 с уровнем значимости, скажем 0.01, при альтернативной гипотезе H1: ≠ 0. Тогда можно построить 0.99 доверительный интервал для параметра . Если он накрывает параметр 0, то гипотеза H0 принимается, в противном случае – отклоняется.
Для проверки гипотезы H0 : b=b0 против H1 : b ≠ b0 используется статистика
которая при справедливости нулевой гипотезы имеет распределение Стьюдента с n − 2 степенями свободы. Если расчетное значение статистики Т то гипотеза отвергается.