- •Оглавление
- •Условные обозначения
- •Предисловие
- •Задачи биостатистики
- •Основные понятия и определения биостатистики
- •Классификация признаков
- •Анализ медико-биологических данных на основе их графического представления
- •Анализ медико-биологических данных на основе числовых статистических характеристик
- •Свойства нормального распределения
- •Теория проверки статистических гипотез
- •I алгоритм
- •II алгоритм
- •Проверка гипотезы о нормальности распределения случайной величины
- •Параметрические критерии проверки статистических гипотез
- •Анализ относительных величин
- •Доверительный интервал
- •Доверительный интервал для разности генеральных средних двух независимых групп
- •Доверительный интервал для разности генеральных средних двух зависимых групп
- •Доверительный интервал относительных показателей
- •Непараметрические критерии проверки статистических гипотез
- •Анализ качественных признаков. Таблицы сопряженности
- •Оценка факторов риска
- •Оценка чувствительности и специфичности диагностических тестов
- •Оценка прогностического значения диагностических тестов
- •Однофакторный дисперсионный анализ
- •Линейная корреляция
- •Коэффициент корреляции рангов к. Спирмена
- •Линейная регрессия
- •Анализ выживаемости
- •Методы прогнозирования
- •Методы простой экстраполяции
- •Метод среднего абсолютного прироста
- •Метод среднего темпа роста
- •Прогнозирование на основе математических моделей
- •Оценка факторов риска и прогнозирование на основе логистической регрессии
- •Анализ качественных признаков на основе логлинейной модели
- •Байесовский подход к диагностике и прогнозированию. Последовательный анализ вальда
- •Определение размера выборки
- •Расчет объема выборки при эпидемиологических исследованиях
- •Представление статистических данных в научных публикациях
- •Заключение
- •Список литературы
- •Приложение 1. Критические значения коэффициента асимметрии As
- •Приложение 2. Критические точки двустороннего tкритерия Стьюдента
- •Приложение 3. Критические значения Uкритерия МаннаУитни
- •Приложение 4. Критические значения парного Ткритерия Уилкоксона
- •Приложение 5. Критические значения χ2
- •Приложение 6. Критические значения коэффициента корреляции рангов Спирмена
- •Приложение 7. Критические значения Fкритерия Фишера
- •Ответы к контрольным заданиям
Методы прогнозирования
Обычно под прогнозированием понимается процесс предсказания будущего основанное на некоторых данных из прошлого, т.е. изучается развитие интересующего явления во времени. Тогда прогнозируемая величина рассматривается как функция времени . Однако, в медицине рассматриваются и другие виды прогноза: прогнозируется диагноз, диагностическая ценность нового теста, изменение одного фактора под действием другого и т.д.
В этом разделе мы познакомимся с прогнозированием во времени. Как уже было отмечено, прогноз осуществляется на основании некоторой информации из прошлого (базы прогноза). Прежде чем подобрать метод прогнозирования полезно хотя бы качественно оценить динамику изучаемой величины в предыдущие моменты времени. На представленных графиках (рисунок 33) видно, что она может быть различной. В первом случае наблюдается относительная стабильность с небольшими колебаниями вокруг среднего значения. Во втором случае динамика носит линейно возрастающий характер, в третьем – зависимость от времени нелинейная, экспоненциальная. Четвертый случай – пример сложных колебаний, имеющих несколько составляющих.
Рисунок 33. Виды динамики
Экстраполяция – наиболее распространенный метод краткосрочного прогнозирования (13 временных периода) заключающийся в продлении предыдущих закономерностей на будущее. Применение экстраполяции в прогнозировании базируется на следующих предпосылках:
• развитие исследуемого явления в целом описывается плавной кривой;
• общая тенденция развития явления в прошлом и настоящем не претерпит серьезных изменений в будущем.
Методы простой экстраполяции
Метод среднего уровня ряда – прогнозируемый уровень изучаемой величины принимается равным среднему значению уровней ряда этой величины в прошлом. Этот метод используется, если средний уровень не имеет тенденции к изменению, или это изменение незначительно (нет явно выраженного тренда, рисунок 32А)
(59)
Где yi – значение iого уровня
n – база прогноза
В некотором смысле отрезок динамического ряда, охваченный наблюдением, можно уподобить выборке, а значит полученный прогноз будет выборочным, для которого можно указать доверительный интервал
(60)
где (61)
– среднеквадратичное отклонение временного ряда
tα –критерий Стъюдента для заданного уровня значимости и числа степеней свободы (n1).
Пример. В таблице 63 приведены данные временного ряда y(t). Рассчитать прогнозное значение y на момент времени t =13 методом среднего уровня ряда
Таблица 63. Результаты расчетов
Рисунок 34. Методы простой экстраполяции
Доверительный интервал для прогноза в момент t =13 приведен в таблице 64
Таблица 64. Результаты статобработки
|
Метод скользящих средних – метод прогнозирования на краткосрочный период, основан на процедуре сглаживания уровней изучаемой величины (фильтрации). Преимущественно используются линейные фильтры сглаживания с интервалом m т.е.
(62)
Доверительный интервал
(63)
Где
–среднеквадратичное отклонение временного ряда (64)
tα –критерий Стъюдента для заданного уровня значимости и числа степеней свободы (n1).
Пример. В таблице 65 приведены данные временного ряда y(t). Рассчитать прогнозное значение y на момент времени t =13 методом скользящих средних с интервалом сглаживания m=3. Таблица 65. Результаты расчетов
Исходный и сглаженный ряд представлены на рисунке 35
Рисунок 35. Метод скользящих средних
Таблица 66. Результаты статобработки
|
Метод экспоненциального сглаживания – в процессе выравнивания каждого уровня используются значения предыдущих уровней, взятых с определенным весом. По мере удаления от какогото уровня вес этого наблюдения уменьшается. Сглаженное значение уровня на момент времени t определяется по формуле
(65)
где St – текущее сглаженное значение;
yt – текущее значение исходного ряда;
St – 1 – предыдущее сглаженное значение;
α сглаживающая параметр
S0 берется равным среднему арифметическому нескольких первых значений ряда
Для расчета α предложена следующая формула
(66)
По поводу выбора α нет единого мнения, эта задача оптимизации модели пока еще не решена. В некоторых литературных источниках рекомендуется выбирать 0,1 ≤ α ≤ 0,3.
Прогноз рассчитывается следующим образом
(67)
Доверительный интервал
(68)
Пример. Рассчитать прогнозное значение y на момент времени t =11 методом экспоненциального сглаживания. Зададим α=0,3, S0 – среднее значение по трем первым членам ряда. Таблица 67. Результаты расчетов
Рисунок 36. Метод экспоненциального сглаживания
Таблица 68. Результаты статобработки
|
Рассмотренные методы прогнозирования являются простейшими, и в тоже время самыми приближенными – это видно из широких доверительных интервалов в приведенных примерах. Большая погрешность прогноза наблюдается в случае сильных колебаний уровней. Также неправомерно использовать эти методы при наличии явной тенденции к росту (или падению) исходного временного ряда. Но все же для краткосрочных прогнозов их применение бывает оправданным.