- •Министерство образования и науки Республики Казахстан
- •1. Учебная программа дисциплины – Syllabus
- •1. 1. Данные о преподавателях:
- •1.1 Данные о дисциплине:
- •Выписка из учебного плана
- •1.5. Краткое описание дисциплины
- •1.6. Перечень и виды заданий и график их выполнения:
- •Виды заданий и сроки их выполнения
- •1.7. Список литературы
- •1.8. Контроль и оценка знаний
- •Распределение рейтинговых баллов по видам контроля
- •Календарный график сдачи всех видов контроля
- •Оценка знаний студентов
- •2. Содержание Активного раздаточного материала
- •2.1 Тематический план курса составляется в виде таблицы, где указываются наименование темы и количество академических часов, предусмотренных для каждой темы. Тематический план курса
- •2.2 Конспект лекционных занятий
- •Глава 1. Основные понятия и определения статистики
- •Тема 2. Показатели описательной статистики. Среднее, дисперсия, стандартное отклонение, эксцесс, асимметрия, интервалы. Компьютерные технологии получения дескриптивной статистики.
- •Глава 2. Выборки.
- •Тема 5. Анализ одной выборки. Анализ однородности выборки. Доверительные интервалы для среднего. Доверительные интервалы для средних выборок. Компьютерные технологии анализа.
- •Тема 6. Анализ двух выборок. Выявление достоверности различий. Параметрические и непараметрические методы анализа выборок. Компьютерные технологии анализа одной выборки.
- •Глава 3. Анализ статданных.
- •Тема 7. Дисперсионный анализ статданных. Однофакторный дисперсионный анализ статистических данных. F- тест для для дисперсий. Компьютерные технологии анализа.
- •Тема 8. Корреляционный анализ статданных. Коэффицент корреляции Пирсона. Коэффициент ранговой корреляции. Ложная и истинная корреляция Компьютерные технологии анализа.
- •Глава 4. Регрессионный анализ.
- •Тема 9. Регрессионный анализ статданных. Простая линейная регрессии. Оценивание параметров линейной регрессиии методом наименьших квадратов, коэффициент детерминации.
- •Тема 10. Оценка существенности параметров линейной регрессии. Оценка качества регрессии f-критерий Фишера, t-статистика. Проверка значимости параметров регрессии. Понятие нелинейной регрессии.
- •Тема 11. Множественная регрессия. Многомерная регрессионая модель. Фиктивные переменные. Кодирование значений качественных переменных. Мультиколлинеарность.
- •Глава 5. Анализ временных рядов.
- •Тема 12. Анализ статданных в виде временных рядов. Временные ряды и их характеристики. Аддитивная и мультипликативная модель. Декомпозиция временного ряда.
- •Тема 13. Анализ и получение тренда. Методы аналитического выравнивания. Метод скользящего среднего. Метод экспоненциального сглаживания. Оценка точности трендовой модели.
- •Тема 14. Модели временных рядов. Понятие об авторегрессионных моделях временных рядов. Коэффицент автокорреляции и автокорреляционная функция.Тест Дарбина-Уотсона.
- •Тема 15. Анализ моделей временных рядов. Решение проблемы автокорреляции. Учет сезонности. Коинтеграция временных рядов.Тест Энгла - Гренжера. Современные тенденции статанализа.
- •2.3 Планы лабораторных занятий
- •Технология построения трендов в Microsoft Excel Порядок выполнения лабораторной работы
- •Форматирование метки линии тренда.
- •Задание на выполнение лабораторной работы:
- •Задание на выполнение лабораторной работы
- •2.4 Планы занятий в рамках самостоятельной работы студентов под руководством преподаватля (срсп)
- •Тема 1. Функции распределения дискретной случайной величины. Биномиальное распределение. Применение компьютерных технологий при статистическом исследовании биномиального распределения. (2 ч.)
- •Тема 3. Функции распределения дискретной случайной величины. Распределение Пуассона. Применение компьютерных технологий при статистическом исследовании распределения Пуассона. (2 ч.)
- •Тема 4. Функции распределения непрерывной случайной величины. Гауссово распределение. Применение компьютерных технологий при статистическом исследовании Гауссово распределения. (2 ч.)
- •Тема 5. Функции распределения непрерывной случайной величины. Распределение хи-квадрат. Применение компьютерных технологий при статистическом исследовании распределения хи-квадрат. (2 ч.)
- •Тема 6. Функции распределения непрерывной случайной величины. Распределение Стьюдента. Применение компьютерных технологий при статистическом исследовании распределения Стьюдента. (2 ч.)
- •Тема 7. Функции распределения непрерывной случайной величины. Распределение Фишера. Применение компьютерных технологий при статистическом исследовании распределения Фишера. (2 ч.)
- •Тема 9. Генерация случайных чисел. Применение компьютерных технологий при генерации случайных чисел. (2 ч.)
- •Тема 10. Статистические гипотезы. Одновыборочный z-тест для средних величин. Применение компьютерных технологий при проведении одновыборочного z-теста для средних величин. (2 ч.)
- •Тема 11. Статистические гипотезы. Двухвыборочный z-тест для средних величин. Применение компьютерных технологий при проведении двухвыборочного z-теста для средних величин. (2 ч.)
- •Тема 12. Статистические гипотезы. Одновыборочный t-тест для средних величин. Применение компьютерных технологий при проведении одновыборочного t-теста для средних величин. (2 ч.)
- •Тема 15. Статистические гипотезы. Парный двухвыборочный t-тест для средних величин. Применение компьютерных технологий при проведении парного двухвыборочного t-теста для средних величин. (2 ч.)
- •2.5 Планы занятий в рамках самостоятельной работы студентов (срс)
- •Тема 1. Регрессионный анализ с применением компьютерных технологий. Интерпретация результатов.
- •Тема 2. Регрессионный анализ. Метод наименьших квадратов (мнк).Интерпретация результатов.
- •Тема 3. Регрессионный анализ. Анализ вариации зависимой переменной.
- •Тема 4. Регрессионный анализ. Условия Гаусса-Маркова по классической нормальной линейной регрессионной модели.
- •Тема 5. Регрессионный анализ. Стандартная ошибка регрессии.
- •Тема 6. Регрессионный анализ. Стандартные ошибки коэффициентов регрессии.
- •Тема 7. Регрессионный анализ. Проверка гипотез по коэффициентам регрессии.
- •Тема 8. Регрессионный анализ. Нелинейные регрессии.
- •Тема 9. Регрессионный анализ. Прогнозирование в регрессионных моделях.
- •Тема 10. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Получение тренда. Интерпретация результатов.
- •Тема 11. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Исследование автокорреляции данных временного ряда.
- •Тема 12. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Тест Дарбина-Уотсона.
- •Тема 13. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Тест на коинтеграцию на основе критерия Энгла-Грэнжера.
- •Тема 14. Статистический программный инструментарий. Обзор статистических функций ms Excel.
- •Тема 15. Статистический программный инструментарий. Обзор возможностей пакета "Анализа данных" ms Excel.
- •2.6. Тестовые задания для самоконтроля с указанием ключей правильных ответов
- •24. Имеют ли в общем случае смысловую нагрузку свободный член уравнения линейной регрессии?
- •25. Что такое корреляционные поля?
- •26. Что такое авторегрессионая модель временного ряда?
- •27. Что означает регрессионная модель с лагированными переменными?
- •28. Какой показатель определяется отношением дисперсии результативного признака регрессии к общей дисперсии результативного признака?
- •29. Какой критерий применяется для проверки гипотезы - средние двух выборок относятся к одной и той же совокупности?
- •30. Какой метод применяется для проверки гипотезы - относится та или иной вариант к данной статистической совокупности?
- •Перечень экзаменационных вопросов по пройденному курсу
- •Глоссарий
- •Выходные сведения
2. Содержание Активного раздаточного материала
2.1 Тематический план курса составляется в виде таблицы, где указываются наименование темы и количество академических часов, предусмотренных для каждой темы. Тематический план курса
Наименование темы |
Количество академических часов | |||
Лекция |
Лабораторные |
СРСП |
СРС | |
1 |
2 |
3 |
4 |
5 |
Глава 1. Основные понятия и определения статистики |
|
|
|
|
1. Основные вопросы анализа статистических данных |
2 |
1 |
3 |
3 |
2. Показатели описательной статистики. |
2 |
1 |
3 |
3 |
3. Закономерности распределения статданных |
2 |
1 |
3 |
3 |
Глава 2. Выборки. |
|
|
|
|
4. Статистические гипотезы. |
2 |
1 |
3 |
3 |
5. Анализ одной выборки. |
2 |
1 |
3 |
3 |
6. Анализ двух выборок. |
2 |
1 |
3 |
3 |
Глава 3. Анализ статданных. |
|
|
|
|
7. Дисперсионный анализ статданных. |
2 |
1 |
3 |
3 |
8. Корреляционный анализ статданных. |
2 |
1 |
3 |
3 |
Глава 4. Регрессионный анализ. |
|
|
|
|
9. Регрессионный анализ статданных. |
2 |
1 |
3 |
3 |
10.Оценка существенности параметров линейной регрессии. |
2 |
1 |
3 |
3 |
11. Множественная регрессия. |
2 |
1 |
3 |
3 |
Глава 5. Анализ временных рядов. |
|
|
|
|
12. Анализ статданных в виде временных рядов. |
2 |
1 |
3 |
3 |
13. Анализ и получение тренда. |
2 |
1 |
3 |
3 |
14. Модели временных рядов. |
2 |
1 |
3 |
3 |
15. Анализ моделей временных рядов. |
2 |
1 |
3 |
3 |
ИТОГО: |
30 |
15 |
45 |
45 |
2.2 Конспект лекционных занятий
Глава 1. Основные понятия и определения статистики
Тема 1. Основные вопросы анализа статистических данных. Предметная область статистического анализа. Историческая справка. Понятие эконометрических моделей. Современная практика применения статанализа и прогнозирования в технике и экономике.
Предметная область статистического анализа.
Статистика - одна из наук, имеющая целью сбор, упорядочивание, анализ и сопоставление числового представления фактов, относящихся к самым разнообразным массовым явлениям. Это вместе с тем учение о системе показателей, количественных характеристиках, дающих всестороннее представление о различных явлениях в технике, экономике, обществе. Статистика - это эффективное орудие, инструмент познания, используемый в естественных и общественных науках для установления тех специфических закономерностей, которые действуют в конкретных массовых явлениях, изучаемых данной наукой. Статистика - это также одна из форм практической деятельности людей, цель которой - сбор, обработка и анализ массовых данных о тех или иных явлениях. Статистикой называют также различного рода числовые или, как часто говорят, цифровые данные, характеризующие различные стороны жизни государства: политические отношения, культуру, население, производство и т. д.
Часто слово «статистика» употребляется в качестве более короткого эквивалента для слов «статистический анализ». Статистический анализ можно охарактеризовать как методы, применяемые при сборе, представлении, анализе и интерпретации данных. Применение статистического анализа особенно важно там, где из больших массивов данных требуется выделить полезную для нас информацию.
Историческая справка.
Развитие статистики сходно с развитием языка и счета. Эта наука имеет древние корни. Она зародилась как результат обобщения уже достаточно развитой статистической практики, вызванной потребностями развития общества. В Китае более чем за две тысячи лет до нашей эры производились исчисления населения по полу и возрасту, а также собирались сведения о состоянии промышленности и сельского хозяйства. Упоминания о статистических обследованиях встречаются и в библейские времена. В Древнем Риме велась статистика численности населения и имущественного положения граждан.
Развитие торговых и международных товарно-денежных отношений явилось стимулом для дальнейшего формирования учета и статистики. В тот период статистические операции, как правило, проводились в исключительных случаях, в основном в военных и финансовых делах. Позднее потребность в статистических операциях возникла уже с необходимостью стимулирования роста народонаселения, производительных сил страны, регулирования потребления.
Однако если собирание статистических данных началось в самой глубокой древности, то их обработка и анализ, т. е. зарождение статистики - науки, относятся к более позднему периоду - второй половине XVII в. В это время и было введено в научный обиход само слово «статистика». Это сделал немецкий ученый, профессор философии и права Г. Ахенваль (1719 - 1772), который с 1746 г. впервые в Марбургском, а затем в Геттингенском университете начал читать новую учебную дисциплину, которую он назвал статистикой.
В первой половине XIX в. возникло третье направление статистической науки - статистико-математическое. Особый вклад в развитие этого направления внес бельгийский статистик А. Кегле (1796 - 1874). Он назвал статистику «социальной физикой», т. е. наукой, изучающей законы общественной системы с помощью количественных методов. Важнейшей его заслугой является обоснование идеи использования закономерностей, выявленных из массы случаев, в качестве важнейшего инструмента познания объективного мира. Учение А. Кегле о статистической закономерности оказало значительное влияние на современников. Двумя другими учеными, внесшими значительный вклад в развитие статистики, являются два англичанина - Ф. Гальтон (1822 - 1911) и К. Пирсон (1857 - 1936). Гальтон, родственник Чарлза Дарвина, серьезно заинтересовался проблемой наследственности, к анализу которой он вскоре применил статистические методы. Пирсон также провел много плодотворных исследований в статистике. И Гальтон, и Пирсон внесли значительный вклад в развитие теории корреляции. Наиболее известным ученым XX в. в области статистики Запада является Р. Фишер (1890 - 1962). Фишер продуктивно работал с 1912 по 1962 г., и многие его исследования оказали существенное воздействие на современную статистику. Большим шагом вперед к развитию статистической науки послужило комплексное применение компьютерных технологий в анализе социально-экономических явлений.
Понятие эконометрических моделей.
Рассмотрим понятие эконометрической модели на примере экономических показателей. Первая же принципиальная идея, с которой встречается каждый исследователь экономических процессов, это идея о взаимосвязях между экономическими переменными. Формирующийся на рынке спрос на некоторый товар рассматривается как функция его цены; затраты, связанные с изготовлением какого-либо продукта, предполагаются зависящими от объема производства; потребительские расходы могут быть функцией дохода и т.д. Все это примеры связей между двумя переменными, одна из которых (спрос на товар, производственные затраты, потребительские расходы) играет роль объясняемой переменной (или результирующего показателя), а другие интерпретируются как объясняющие переменные (или факторы-аргументы). Однако для большей реалистичности в каждое такое соотношение приходится вводить несколько объясняющих переменных и остаточную случайную составляющую, отражающую влияние на результирующий показатель всех неучтенных факторов. В прикладном статистическом анализе анализируются различные варианты формализации понятия стохастической зависимости между результирующим показателем и объясняющими переменными. Наиболее распространенной в эконометрических приложениях формой представления стохастической зависимости является аддитивная линейная форма, которая и будет главным предметом исследования в нашем лекционном курсе.
Понятие об исходных данных и их назначении
Исходные данные - это первичная и (или) вторичная информация, которая составляет основу дальнейшего анализа. Первичная информация представляет собой только что полученную информацию для решения конкретного вопроса или задачи, вторичная - это уже имеющаяся в наличии информация, которая была собрана для других целей, но может быть использована для исследования поставленного вопроса. Обобщая сказанное, можно выделить, как минимум, шесть основных причин для сбора первичной и вторичной информации (или исходных данных). Итак, данные необходимы для
• выполнения опроса;
• проведения исследований;
• оценки предоставляемой услуги или производственного процесса;
• сравнения, при котором определяется соответствие стандартам качества;
• разработки альтернативных стратегий в процессе принятия решений;
• удовлетворения собственного любопытства.
Прежде чем приступить к статистическому анализу, очень важно определить наиболее подходящие источники, которые предоставят приемлемые данные. В том случае, если данные будут необъективны, неоднозначны или будут характеризоваться другими неточностями или погрешностями, то никакие самые изощренные статистические методы не смогут компенсировать эти недостатки, и результаты анализа будут совершенно неадекватны существующей ситуации.
Источники данных
Существует, по меньшей мере, четыре способа, которыми можно воспользоваться для получения необходимых исходных данных.
1. Использование данных из внешних и внутренних источников.
2. Получение данных экспериментальным путем.
3. Получение данных посредством проведения опроса.
4. Проведение исследования по данным наблюдений.
Однако для того, чтобы смоделировать эксперимент, выполнить исследование по результатам наблюдений, необходимо знать, какого типа бывают данные, и понимать разницу между различными типами данных.
Типы данных
Статистики, аналитики, исследователи, а также все, кто собирает и анализирует, данные, имеют дело с разнообразными случайными величинами. Под случайной величиной понимается переменная величина, принимающая в зависимости от случая, те или иные значения с определенными вероятностями, причем полученные значения можно также рассматривать в качестве источника данных. Значения случайной величины могут отличаться друг от друга, поскольку нет двух совершенно одинаковых явлений, людей или суждений.
Значения случайной величины, или полученные в результате данные, могут быть двух типов: категорийные и числовые.
Тип данных Подтип данных Тип вопроса Ответ
Категорийные Являетесь ли вы учредителем предприятия? ДА или НЕТ
Числовые Дискретные Сколько газет вы выписали в этом году? ЧИСЛО (3)
Непрерывные Какой у вас рост? См (167)
Числовые случайные величины могут быть двух типов: дискретные и непрерывные.
Случайная величина является дискретной, когда можно перечислить все значения случайной величины, которые могут быть получены в результате, т.е. множество возможных значений такой величины счетно. Случайная величина является непрерывной, если она может принимать любое значение из некоторого конечного или бесконечного интервала (например, из интервала целых положительных чисел).
Методы построения случайной выборки
Как правило, для получения необходимой первичной информации проводится исследование некоторой совокупности объектов, например потребителей, сотрудников компании, посредников, пенсионеров, частных предпринимателей и т.д. Если эта совокупность настолько малочисленна, что при имеющихся ресурсах можно установить контакт с каждым из ее элементов, то вполне реально проведение исследования всей совокупности, которая в данном случае будет называться генеральной. Иными словами, генеральная совокупность - это полный набор объектов (людей, предметов и т.д.), о которых необходимо получить информацию. В том случае, если нет возможности и ресурсов для изучения всей генеральной совокупности, можно построить выборку из генеральной совокупности, т.е. ограничиться в своих исследованиях только выборочным набором объектов из всей генеральной совокупности. Выборка - это набор объектов, извлеченных из генеральной совокупности. В качестве причин для построения и исследования выборки, вместо работы с генеральной совокупностью, чаще всего называются следующие.
1. Работа с выборкой существенно экономит время.
2. Работа с выборкой существенно экономит средства.
3. Работа с выборкой легче в плане администрирования.
Существует много различных способов построения выборки. При этом выборка должна быть обязательно репрезентативной, чтобы по ней можно было судить обо всей генеральной совокупности. Это означает, что и в выборке, и в генеральной совокупности каждое свойство должно иметь одинаковые частоты. В том случае если выборка не является репрезентативной, говорят что она имеет смещение.
Литература:1осн. [11-59],2осн.[17-41], 3осн. [3-33], 4осн. [166-189], 4доп.[42-51], 6доп.[165-167]
Контрольные вопросы
1. Какова предметная область статистики и ее связь с другими науками?
2. С какой областью математики тесно связана статистика и какой математический аппарат
использует?
3. Что составляет понятие - эконометрической модели?
4. Как формируются эндогенные и экзогенные переменные?
5. Что обуславливает стохастический характер эконометрической модели?