- •Конспект лекций По предмету «Статистика»
- •Содержание
- •Глава 1 Введение. Понятие статистики, предмет и методология. Основные определения………………………………………………………………………......4
- •Глава 2 Статистический анализ рядов распределения…………………….….14
- •Глава 3 Выборочное наблюдение………………………………………………..26
- •Глава 4 Статистическое изучение связей. Корреляционно-регрессионный анализ………………………………………………………………………………..33
- •Глава 5 Статистический анализ временных рядов……………………………45
- •Глава 1 Введение. Понятие статистики, предмет и методология. Основные определения.
- •1.1 Понятие статистики. Предмет и объект изучения статистики
- •1.2 Методология статистики
- •1.3 Этапы статистического исследования
- •1.3.1 Статистическое наблюдение
- •1.3.2 Сводка и группировка данных
- •1.4 Статистические показатели
- •1.4.1 Средняя арифметическая простая
- •1.4.2 Средняя арифметическая взвешенная
- •1.4.3 Средняя гармоническая
- •1.4.4 Средняя геометрическая
- •1.4.5 Средняя квадратическая
- •Глава 2 Статистический анализ рядов распределения
- •2.1 Построение ряда распределения
- •2.2 Графическое изображение вариационных рядов
- •2.3 Показатели центра и структуры распределения
- •2.4 Показатели вариации
- •Среднее линейное отклонение
- •3. Дисперсия
- •4. Среднее квадратическое (стандартное) отклонение
- •Относительное линейное отклонение
- •2.5 Характеристика формы распределения
- •2.6 Выравнивание эмпирических распределений и оценка соответствия эмпирического распределения теоретическому
- •Глава 3 Выборочное наблюдение
- •3.1 Способы отбора единиц в выборочную совокупность
- •3.2 Виды выборки
- •3.3 Ошибка репрезентативности (ошибка выборки)
- •3.4 Правило сложения дисперсий
- •3.5 Ошибка выборки для доли
- •3.6 Определение объема выборки
- •3.7 Особенности малой выборки
- •Глава 4 Статистическое изучение связей. Корреляционно-регрессионный анализ
- •Функционально (жестко-детерминированная) связь
- •2) Статистические связи и зависимости (стохастически детерминированная).
- •4.1 Причины возникновения корреляционной зависимости
- •4.2 Условия применения методов корреляционно-регрессионного анализа
- •4.3 Графическое изображение корреляционной зависимости
- •Показатели корреляции
- •Коэффициент корреляции
- •Коэффициент детерминации
- •Корреляционное отношение
- •Индекс корреляции
- •4.5 Регрессионный анализ. Парное и множественное уравнение регрессии
- •4.5.1 Уравнение парной регрессии
- •4.5.2 Уравнение множественной регрессии
- •4.5.3 Построение матрицы парных коэффициентов корреляции. Отбор факторов
- •4.5.4 Коэффициенты эластичности и β-коэффициенты
- •4.6 Оценка статистической значимости уравнения регрессии и его параметров
- •4.6.1 Оценка статистической значимости уравнения регрессии
- •4.6.2 Оценка статистической значимости параметров уравнения
- •Глава 5 Статистический анализ временных рядов (рядов динамики)
- •5.1 Показатели изменения уровней временного ряда
- •1) Абсолютный прирост;
- •4) Абсолютное значение 1% прироста.
- •Абсолютный прирост
- •1. Абсолютный цепной прирост
- •2. Абсолютный прирост базисный
- •Темп роста (коэффициент роста)
- •5.3.2 Изучение основной тенденции временного ряда. Выравнивание рядов динамики
- •5.3.3 Экстраполяционное прогнозирование на основе трендовых моделей
- •5.4 Автокорреляция в рядах динамики (автокорреляция уровней временных рядов)
- •5.5 Корреляция рядов динамики
- •5.6 Изучение сезонности в динамических рядах
- •5.7 Статистические индексы. Индексный анализ
- •1) Индивидуальные (I)
- •2) Общие индексы (сводные, I)
- •5.7.1 Агрегатные индексы
- •5.7.2 Индексы Ласпейреса и Пааше
- •5.7.3 Идеальный индекс Фишера
- •5.7.4 Индексы средние из индивидуальных
- •5.7.3 Индексы-дефляторы
1.3.2 Сводка и группировка данных
Статистические данные, собранные в результате наблюдения, в своем первоначальном виде труднообозримы и без предварительной их подготовки не пригодны для проведения углубленного анализа.
Большую роль в разработке статистических данных играют современные классификаторы технико-экономической и социальной информации. Начиная с 2003 года по постановлению правительства России Госкомстат (с 2004г – Росстат) ведет большую работу по разработке классификаторов и их гармонизации с международными аналогами.
Классификаторы – это важнейший инструмент систематизации, упорядочения и сопоставимости данных. Их использование позволяет получить стандартные группировки в статистических отчетах, статистических формах, в средствах электронной обработки, а также в выходных статистических материалах и публикациях.
В России в настоящее время разработаны классификаторы, которые позволяют по единой методике сгруппировать информацию и охарактеризовать структуру национальной экономики, природных и трудовых ресурсов, административно-территориальное деление страны, виды производимых товаров и услуг и ряда других экономических и социальных объектов и их свойств.
Сводка как процедура сжатия, уплотнения и упорядочения информации является обязательным этапом исследования любого уровня. Основной прием сводки – группировка.
Группировка – разбиение или разделение статистической совокупности на отдельные группы по одному или нескольким признакам.
Признак, положенный в основу группировки – группировочный признак.
Если группировка единиц совокупности проводится по одному признаку, она называется простой или монотетической, если по двум или нескольким признакам – комбинационной.
Исходя из сложности социально-экономических явлений, предпочтения следовало бы отдать комбинационным группировкам. Однако чем больше используется группировочных признаков, тем менее обозрима и информативна получаемая группировка. Чрезмерная детализация информации может также привести к пустым или малонаполненным группам.
Использование группировок решает следующие основные задачи:
- выделение и описание объективно существующих типов и групп;
- изучение структуры совокупности и оценка структурных сдвигов;
- изучение связей и зависимостей между признаками.
Этим задачам соответствует три вида группировок.
Первая задача решается с помощью типологической группировки.
Таблица1
Группировка занятого населения Санкт-Петербурга по формам собственности
Формы собственности |
1991 год |
2001 год |
||
тыс. чел |
занято в эк-ке, в % |
тыс. чел |
занято в эк-ке, в % |
|
А |
1 |
2 |
3 |
4 |
Всего занято в экономике |
2457 |
100 |
2344 |
100 |
На государственных и муниципальных предприятиях и организациях |
1921 |
78,4 |
908 |
38,7 |
В частном секторе |
62 |
2,5 |
1006 |
42,9 |
В общественных организациях |
44 |
1,8 |
23 |
1,0 |
На совместных предприятиях |
15 |
0,8 |
54 |
2,3 |
На предприятиях и организациях смешанной формы собственности |
410 |
16,7 |
353 |
15,1 |
Группировочный признак – форма собственности. Результаты группировки – число занятых (в графах 1, 3). Результат группировки представлен абсолютным показателем.
Типологическая группировка регионов РФ по объему оборота в розничной торговле в расчете на одного предпринимателя (по данным выборочного исследования, август 2004г):
Оборот розничной торговли на одного предпринимателя, тыс. руб. |
Число регионов |
До 100 |
5 |
101 – 150 |
13 |
151 – 200 |
19 |
201 – 250 |
14 |
251 – 300 |
14 |
Свыше 300 |
24 |
Вторая задача решается с использование структурной группировки. Структурная группировка, как привило, строится на базе типологической, но с использованием относительных показателей. То есть рассчитывается доля каждой группы в общем объеме совокупности (структурная группировка приведена в Таблице1 в графах А, 2, 4).
При наличии структурной группировки за ряд лет может быть изучена динамика структуры, то есть структурные сдвиги.
Третья задача решается с использованием аналитической группировки. Аналитическая группировка строится на основе факторного признака, то есть признака, под влиянием которого изменяется другой признак, называемый результативным или результатом. По группам, сформированным на основе признака-фактора, рассчитывается средняя величина признака-результата. Изучение параллельных изменений этих признаков позволяет выдвигать гипотезу о наличии или отсутствии связи между признаками.
Оценка здоровья на протяжении жизненного пути индивида.
Возраст, лет |
Средний % имеющихся хронических заболеваний |
До 10 |
4,5 |
11 – 20 |
11,4 |
21 – 30 |
18,9 |
31 – 40 |
29,2 |
41 – 50 |
43,8 |
51 – 60 |
56,5 |
60 и выше |
62,4 |
Факторный признак – возраст. Признак-результат – хроническое заболевание.
Построение группировок предполагает решения следующих задач:
выбор группировочного признака. Выбор зависит от конкретных целей и задач исследования.
определение числа групп. На число групп оказывает влияние объем совокупности и тип группировочного признака. Если признак атрибутивный, то число групп соответствует числу объективно существующих типов в изучаемой совокупности (см Таблицу1). Если в качестве группировочного признака используется количественный дискретный признак, то число групп соответствует числу градаций этого признака. Основная проблема с определением числа групп связана с количественными непрерывными признаками. В этом случае число групп определяют по формуле Стерджесса:
K = 1 + 3.322 lgN , где
K- число выделяемых групп,
N – объем статистической совокупности.
Эта формула дает хорошие результаты при условии больших совокупностей, при N>100.
Определение числа групп обеспечивается интуицией, профессиональным опытом или результатами предыдущих аналогичных исследований.
После определения числа групп рассчитывают группировочный интервал
, где
h – группировочный интервал,
K – число групп,
xmax, xmin – максимальное и минимальное значение признака совокупности.
Пример:
xmax = 1200 , xmin = 200 , K = 5
200 - 400
400 - 600
600 - 800 - 5 групп
800 – 1000
1000 – 1200
Интервал группировки, помимо равного, может быть:
- прогрессивно возрастающим;
- прогрессивно убывающим;
- специализированным.
Это зависит от характера группировочного признака, степени вариации, целей исследования.