Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
РГЗ по Брылеву.doc
Скачиваний:
1
Добавлен:
25.11.2019
Размер:
147.97 Кб
Скачать

Содержание.

Задание. 2

Теоретическая часть 2

Регрессионный анализ 2

Метод временных рядов. 5

Задачи анализа временных рядов. Первоначальная обработка временных рядов 5

Экстраполяция тенденции как метод прогнозирования 9

Практическая часть. 11

Задание.

Разработать на основе данных за год, снятых со счетчика расхода электроэнергии помесячно, модель потребителя.

Произвести корреляционный анализ расходов электроэнергии в зависимости от времени года и от среднемесячной температуры воздуха. В теоретической части описать стохастические методы моделирования, а именно: регрессионный анализ и метод временных рядов.

Теоретическая часть

Регрессионный анализ

Это группа методов, направ­ленных на выявление и математическое выражение тех измене­ний и зависимостей, которые имеют место в системе случайных величин. Если такая система моделирует педагогическую, то, следовательно, путем регрессионного анализа выявляются и ма­тематически выражаются психолого-педагогические явления и зависимости между ними. Характеристики этих явлений изме­ряются в разных шкалах, что накладывает ограничения на спо­собы математического выражения изменений и зависимостей, которые изучаются педагогом-исследователем.

Методы регрессионного анализа рассчитаны, главным обра­зом, на случай устойчивого нормального распределе­ния, в котором изменения от опыта к опыту проявляются лишь в виде независимых испытаний.

Выделяются различные формальные задачи регрессионного анализа. Они могут быть простыми или сложными по формулировкам, по математиче­ским средствам и трудоемкости. Перечислим и рассмотрим на примерах те из них, которые представляются основными.

Первая задача — выявить факт изменчивости изучаемого яв­ления при определенных, но не всегда четко фиксированных условиях. В предыдущей лекции мы уже решали эту задачу с помощью параметрических и непараметрических критериев.

Вторая задача — выявить тенденцию как периодическое изменение признака. Сам по себе этот признак мо­жет быть зависим или не зависим от переменной-условия (он может зависеть от неизвестных или неконтролируемых иссле­дователем условий). Но это не важно для рассматриваемой за­дачи, которая ограничивается лишь выявлением тенденции и ее особенностей.

Проверка гипотез об отсутствии или наличии тенденции мо­жет выполняться с использованием кри­терия Аббе. Критерий Аббе предназначен для проверки гипотез о равенстве средних значений, установленных для 4<n<60 взаимно независимых нормально распределенных выборок.

Эмпирическое значение критерия Аббе вычисля­ется по формуле:

                                                                                     (8)

где    —   среднее арифметическое из выборки;

п – число значений в выборке.

Согласно критерию, гипотеза о равенстве средних отклоняется (принимается альтернативная гипотеза), если значение статистики . Табличное (критическое) значение статистики определяется из таблицы для q-критерия Аббе, которая с сокращениями заимствована из книги Л.Н. Болышева и Н.В. Смирнова (см. Приложение 3).

В качестве таких величин, для которых применим критерий Аббе, могут высту­пать выборочные доли или проценты, средние арифметические и другие статистики выборочных распределений, если они близ­ки к нормальному (или предварительно нормализованы). По­этому критерий Аббе может найти широкое применение в пси­холого-педагогических исследованиях. Рассмотрим пример вы­явления тенденции с помощью критерия Аббе.

Пример 1. В табл. 5 представлена динамика процента студентов IV курса, на «отлично» сдававших экзамены в зимние сессии на протяжении 10 лет работы  одного из  факультетов  университета.  Требуется  установить, есть ли тенденция к повышению успеваемости.

Таблица 5. Динамика процента отличников четвертого курса за 10 лет работы факультета

Учебный год

%

1995-96

10,8

1996-97

16,4

1997-98

17,4

1998-99

22,0

1999-00

23,0

2000-01

21,5

2001-02

26,1

2002-03

17,2

2003-04

27,5

2004-05

33,0

 

В качестве нулевой проверяем гипотезу об отсутствии тенденции, т. е. о равенстве процентов.

Усредняем проценты, приведенные в табл. 5, находим, что =21,5. Вычисляем разности между последующими и предыдущими зна­чениями в выборке, возводим их в квадрат и суммируем:

Аналогично вычисляет знаменатель в формуле (8), суммируя квадраты разностей между каждым измерением и средним арифметическим:

Теперь по формуле (8) получаем:

В таблице критерия Аббе из Приложения 3 находим, что при n=10 и уровне значимости 0,05 критическое значение , что больше полученного нами 0,41, следовательно гипотезу о равенстве процента «отличников» приходится отклонить, и можно принять альтернативную гипотезу о наличии тенденции.

Третья задача – это выявление закономерности, выра­женной в виде корреляционного уравнения (регрессии).

Пример 2. Эстонский исследователь Я. Микк [1], изучая трудности по­нимания текста, установил «формулу читаемости», которая представляет собой множественную линейную регрессию:

 — оценка трудности понимания текста,

где х1 - длина самостоятельных предложений в количестве печат­ных знаков,

х2 - процент различных незнакомых слов,

х3  - абстрактность повторяющихся понятий, выраженных существительными.

Сравнивая между собой коэффициенты регрессии, выражающие степень влияния факторов, можно видеть, что трудность понимания текста опреде­ляется прежде всего его абстрактностью. Вдвое мень­ше (0,27) трудность понимания текста зависит от числа незнакомых слов и практически она совсем не зависит от длины предложении.

Метод временных рядов. Задачи анализа временных рядов. Первоначальная обработка временных рядов

Основные задачи анализа временных рядов. Базисная цель статистического анализа временного ряда заключается в том, чтобы по имеющейся траектории этого ряда:

  1. определить, какие из неслучайных функций присутствуют в разложении (1), т.е. определить значения индикаторов i;

  2. построить «хорошие» оценки для тех неслучайных функций, которые присутствуют в разложении (1);

  3. подобрать модель, адекватно описывающую поведение случайных остатков t, и статистически оценить параметры этой модели.

Успешное решение перечисленных задач, обусловленных базовой целью статистического анализа временного ряда, является основой для достижения конечных прикладных целей исследования и, в первую очередь, для решения задачи кратко- и среднесрочного прогноза значений временного ряда. Приведем кратко основные элементы эконометрического анализа временных рядов.

Временные ряды отражают тенденцию изменения параметров системы во времени, поэтому входным параметром х является момент времени.

Выходной параметр y называется уровнем ряда. В случае отсутствия ярко выраженных изменений в течение времени, общая тенденция сохраняется. Ряд можно описать уравнением вида

YT = F (t) + ET ,

где

F (t) – детерминированная функция времени.

ET – случайная величина

Во временных рядах проводится операция анализа и сглаживания тренда, который отражает влияние некоторых факторов. Для построения тренда применяется МНК-критерий.

Существуют моментальные и интервальные ряды. В моментальных рядах отражаются абсолютные величины, по состоянию на определенный момент времени, а в интервальных – относительные величины (показатель за год, месяц, и т.д.). Исследование данных при помощи рядов позволяет во многих случаях более четко представить детерминированную функцию. При этом рассчитываются базисные и цепные показатели (прирост, коэффициент роста, коэффициент роста, темп роста, темп прироста, и др.). Под базисными показателями понимают, показатели, которые соотносятся к начальному уровню ряда. Цепные показатели относятся к предыдущему уровню.

Прогноз явлений по временным рядам состоит из двух этапов:

  • Прогноз детерминированной компоненты.

  • Прогноз случайной компоненты.

Обе проблемы связаны с анализом результатов парных экспериментов. В отличие от аппроксимации и интерполяции анализ временных рядов включает в себя методы оценки случайных компонент. Поэтому прогнозирование при помощи временных рядов является более точным.

Исследование рядов имеет большое значение и для технических, и для экономических систем.

Методы нахождения параметров уравнения тренда. Метод наименьших квадратов

Одна из важнейших задач статистики - определение в рядах динамики общей тенденции развития.

Основной тенденцией развития называется плавное и устойчивое изменение уровня во времени, свободное от случайных колебаний. Задача состоит в выявлении общей тенденции в изменении уровней ряда, освобожденной от действия различных факторов.

Изучение тренда включает два основных этапа:

  • ряд динамики проверяется на наличие тренда;

  • производится выравнивание временного ряда и непосредственно выделение тренда с экстраполяцией полученных результатов.

С этой целью ряды динамики подвергаются обработке методами укрупнение интервалов, скользящей средней и аналитического выравнивания:

  1. Метод укрупнения интервалов.

Одним из наиболее элементарных способов изучения общей тенденции в ряду динамики является укрупнение интервалов. Этот способ основан на укрупнении периодов, к которым относятся уровни ряда динамики. Например, преобразование месячных периодов в квартальные, квартальных в годовые и т.д.

  1. Метод скользящей средней.

Выявление общей тенденции ряда динамики можно произвести путем сглаживания ряда динамики с помощью скользящей средней.

Скользящая средняя - подвижная динамическая средняя, которая рассчитывается по ряду при последовательном передвижении на один интервал, то есть сначала вычисляют средний уровень из определенного числа первых по порядку уровней ряда, затем - средний уровень из такого же числа членов, начиная со второго. Таким образом, средняя как бы скользит по ряду динамики от его начала к концу, каждый раз отбрасывая один уровень в начале и добавляя один следующий.

При этом посредством осреднения эмпирических данных индивидуальные колебания погашаются, и общая тенденция развития явления выражается в виде некоторой плавной линии (теоретические уровни). И так, суть метода заключается в замене абсолютных данных средними арифметическими за определенные периоды.

Скользящая средняя обладает достаточной гибкостью, но недостатком метода является укорачивание сглаженного ряда по сравнению с фактическим, что ведет к потери информации. Кроме того, скользящая средняя не дает аналитического выражения тренда.

Период скользящей может быть четным и нечетным. Практически удобнее использовать нечетный период, так как в этом случае скользящая средняя будет отнесена к середине периода скольжения. Скользящие средние с продолжительностью периода, равной 3, следующие:

; ; и т.д.

Полученные средние записываются к соответствующему срединному интервалу.

Особенность сглаживания по четному числу уровней состоит в том, что каждая из численных (например, четырехчленных) средних относится к соответствующим промежуткам между смежными периодами. Для получения значений сглаженных уровней соответствующих периодов необходимо произвести центрирование расчетных средних.

Недостатком способа сглаживания рядов динамики является то, что полученные средние не дает теоретических рядов, в основе которых лежала бы математически выраженная закономерность.