- •Общая теория статистики
- •Глава 1. Понятие о статистике................. 13
- •Глава 2. Организация статистики. Статистическое наблюдение ...... 32
- •Глава 3. Статистические показатели ............. 82
- •Глава 4. Представление статистических данных: таблицы и графики. 100
- •Глава 5. Средние величины и изучение вариации. ... 120
- •Глава 6. Группировка........................ 172
- •Глава 7. Выборочное наблюдение. Испытание статистических гипотез .. 214
- •Глава 8. Статистическая проверка гипотез........ 270
- •Глава 9. Корреляционно-регрессионный анализ и моделирование статистических связей . . . 320
- •Глава 10. Системы регрессионных уравнений....... 392
- •Глава 11. Статистический анализ неколичественных переменных . 411
- •Глава 12. Статистическое изучение динамики....... 445
- •Глава 13. Индексы ........................... 526
- •Глава 14. Статистическое изучение структуры совокупности и ее изменений ... 597
- •Предисловие
- •Глава 1. Понятие о статистике
- •1.1. Что такое статистика
- •1.2. Статистическая закономерность. Статистические совокупности
- •1.3. Признаки и их классификация
- •1.4. Определение предмета статистики — основа статистической методологии
- •Рекомендуемая литература
- •2 Глава. Организация статистики. Статистическое наблюдение
- •2.1. Организация государственной статистики в Российской Федерации
- •2.2. Важнейшие международные организации и их статистические службы
- •2.3. Требования, предъявляемые к собираемым данным. Формы организации и виды статистического наблюдения
- •2.4. Подготовка статистического наблюдения
- •2.5. Статистическая отчетность
- •2.6. Ошибки статистического наблюдения. Методы контроля данных наблюдения
- •2.7. Реформирование российской государственной Статистики
- •Рекомендуемая литература
- •3. Глава. Статистические показатели
- •3.1. Сущность и значение статистических показателей.
- •3.2. Классификация статистических показателей
- •3.3. Общие принципы построения относительных статистических показателей
- •3.4. Понятие о системах статистических показателей
- •3.5. Функции статистических показателей
- •Рекомендуемая литература
- •4 Глава. Представление статистических данных: таблицы и графики
- •4.1. Статистические таблицы
- •4.2. Основные виды графиков
- •4.3. Картограммы и картодиаграммы
- •Рекомендуемая литература
- •5 Глава. Средние величины и изучение вариации
- •5.1. Однородность и вариация массовых явлений
- •5.2. Средняя арифметическая величина
- •5.3. Другие формы средних величин
- •5.4. Средняя величина как выражение закономерности
- •5.5. Вариация массовых явлений
- •5.6. Построение вариационного ряда. Виды рядов. Ранжирование данных
- •5.7. Структурные характеристики вариационного ряда
- •5.8. Показатели размера и интенсивности вариации
- •5.9. Моменты распределения и показатели его формы
- •5.10. Предельно возможные значения показателей вариации и их применение
- •Рекомендуемая литература
- •6 Глава. Группировка
- •6.1. Значение и сущность группировки
- •6.2. Виды группировок
- •6.3. Многомерные группировки
- •Рекомендуемая литература
- •7 Глава. Выборочное наблюдение. Испытание статистических гипотез
- •7.1. Причины применения выборочного наблюдения. Дескриптивная статистика и статистический вывод
- •7.2. Способы отбора, обеспечивающие репрезентативность выборки. Виды выборки
- •7.3. Ошибка выборки
- •7.4. Влияние вида выборки на величину ошибки выборки
- •7.5. Задачи, решаемые при применении выборочного метода
- •7.6. Распространение данных выборочного наблюдения на генеральную совокупность
- •7.7. Малая выборка
- •7.8. Примеры применения выборочного метода
- •Рекомендуемая литература
- •8 Глава. Статистическая проверка гипотез
- •8.1. Общие понятия
- •8.2. Проверка гипотезы о законе распределения
- •8.3. Проверка гипотезы о связи на основе критерия x2 (хи-квадрат)
- •8.4. Проверка гипотезы о средних величинах
- •8.5. Основы дисперсионного анализа
- •8.6. Некоторые непараметрические критерии
- •Рекомендуемая литература
- •9 Глава. Корреляционно-регрессионный анализ и моделирование статистических связей
- •9.1. Понятие о статистической и корреляционной связи
- •9.2. Условия применения и ограничения корреляционно-регрессионного метода
- •9.3. Задачи корреляционно-регрессионного анализа и моделирования
- •3. Задана прогнозирования возможных значений результативного признака при задаваемых значениях факторных признаков.
- •9.4. Вычисление и интерпретация параметров парной линейной регрессии
- •9.5. Статистическая оценка надежности параметров парной регрессии и корреляции
- •9.6. Применение линейного уравнения парной регрессии
- •9.7. Вычисление параметров парной линейной регрессии на основе аналитической группировки
- •9.8. Параболическая корреляция
- •9.9. Гиперболическая корреляция
- •9.10. Множественное уравнение регрессии
- •9.11. Меры тесноты связей в многофакторной системе
- •9.13. Корреляционно-регрессионные модели и их применение в анализе и прогнозе
- •Рекомендуемая литература
- •10 Глава. Системы регрессионных уравнений
- •10.1. Понятие о системах регрессионных уравнений
- •10.2. Проблемы решения систем взаимосвязанных уравнений
- •10.4. Косвенный метод наименьших квадратов
- •10.5. Двойной метод наименьших квадратов
- •Рекомендуемая литература
- •11 Глава. Статистический анализ неколичественных переменных
- •11.1. Зависимость методов измерений связей от уровня измерения переменных
- •11.2. Измерение связи между двумя дихотомическими переменными
- •11.5. Другие меры связей между номинальными переменными
- •11.6. Коэффициенты корреляции рангов
- •Рекомендуемая литература
- •12 Глава. Статистическое изучение динамики
- •12.1. Виды динамических рядов. Сопоставимость данных в изучении динамики
- •12.2. Элементы динамики: основная тенденция и колебания
- •12.3. Показатели, характеризующие тенденцию динамики
- •12.4. Особенности показателей динамики для рядов, состоящих из относительных уровней
- •12.5. Средние показатели тенденции динамики
- •12.6. Методы выявления типа тенденции динамики
- •12.7. Методика измерения параметров тренда
- •12.8. Методика изучения и показатели колеблемости
- •12.9. Измерение устойчивости в динамике
- •12.10. Сезонные колебания и полное разложение дисперсии уровней динамического ряда
- •12.11. Прогнозирование на основе тренда и колеблемости
- •12.12. Корреляция рядов динамики
- •Рекомендуемая литература
- •13 Глава. Индексы
- •13.1. Понятие индекса
- •13.2. Индекс как показатель центральной тенденции (индекс средний из индивидуальных)
- •13.3. Агрегатные индексы. Система индексов
- •13.4. Свойства индексов
- •13.5. Индексный анализ взвешенной средней. Индекс структуры
- •13.6. Построение индексов при обобщении данных по единицам совокупности и по элементам
- •13.7. Границы и условия применения индексного метода
- •13.8. Комплексное использование индексного и регрессионного методов анализа
- •13.9. Примеры использования индексов в экономико-статистических расчетах
- •Рекомендуемая литература
- •14 Глава. Статистическое изучение структуры совокупности и ее изменений
- •14.1. Показатели простой (одномерной) структуры
- •14.2. Показатели иерархической (древовидной) структуры
- •14.3. Показатели балансовой структуры
- •14.4. Показатели многомерной структуры с пересекающимися признаками
- •14.6. Показатели концентрации, специализации, монополизации. Многомерная структура
- •14.7. Абсолютные и относительные показатели изменения структуры
- •14,8. Ранговые показатели изменения структуры
- •Рекомендуемая литература
- •Приложения
- •1. Статистико-математические таблицы
- •2. Основные принципы официальной статистики в регионе Европейской экономической комиссии
5.8. Показатели размера и интенсивности вариации
Абсолютные средние размеры вариации
Следующим этапом изучения вариации признака в совокупности является измерение характеристик силы, величины вариации. Простейшим из них может служить размах, или амплитуда вариации, — абсолютная разность между максимальным и минимальным значениями признака из имеющихся в изучаемой совокупности значений. Таким образом, размах вариации вычисляется по формуле
R= Xmax — Xmin. (5.16)
Поскольку величина размаха характеризует лишь максимальное различие значений признака, она не может измерять закономерную силу его вариации во всей совокупности. Предназначенный для данной цели показатель должен учитывать и обобщать все различия значений признака в совокупности без исключения. Число таких различий равно числу
154
сочетаний по два из всех единиц совокупности, по данным табл. 5.6 оно составит: С143 = 10 153. Однако нет необходимости рассматривать, вычислять и осреднять все отклонения. Проще использовать среднюю из отклонений отдельных значений признака от среднего арифметического значения признака, а таковых всего 143. Но среднее отклонение значений признака от средней арифметической величины согласно известному свойству последней равно нулю. Поэтому показателем силы вариации выступает не алгебраическая средняя отклонений, а средний модуль отклонения, или среднее линейное отклонение.
Этот показатель рассчитывается по формуле
Это означает, что в среднем урожайность в изучаемой совокупности хозяйств отклонялась от средней урожайности по области на 6,85 ц/га. Простота расчета и интерпретации составляют положительные стороны данного показателя, однако математические свойства модулей «плохие»: их нельзя поставить в соответствие с каким-либо вероятностным законом, в том числе и с нормальным распределением, параметром которого является не средний модуль отклонений, а среднее квадратическое отклонение (в англоязычных программах для ПЭВМ называемое «The standard deviation», сокращенно s.d.
155
или просто s, в русскоязычных — СКО). В статистической литературе среднее квадратическое отклонение от средней величины принято обозначать малой (строчной) греческой
Следует указать, что некоторое округление средней величины и середин интервалов, например до целых, мало отражается на величине а, которая составила бы при этом 8,55 ц/га.
Среднее квадратическое отклонение по величине в реальных совокупностях всегда больше среднего модуля отклонений. Соотношение о: а зависит от наличия в совокупности резких, выделяющихся отклонений и может служить индикатором «засоренности» совокупности неоднородными элементами: чем это соотношение больше, тем сильнее подобная «засоренность». Для нормального закона распределения а: а ~ 1,2.
Понятие дисперсии
Квадрат среднего квадратического отклонения дает величину дисперсии а2. Формула дисперсии:
156
для несгруппированных данных
Расчет по формулам (5.21) и (5.23) приведет к погрешности дисперсии того же порядка, что и погрешность, допущенная при округлении средней величины. Математик В. С. Итенберг показал, что расчет по формулам (5.22) и (5.24) приводит к погрешности дисперсии, на порядки большей, нежели допущенная при расчете средней, что видно из приведенного ниже примера (табл. 5.7).
157
Для распределения сельскохозяйственных предприятий по урожайности в табл. 5.6 q = (36,25 - 25,09) = 5,58 ц/га. Сила вариации в центральной части совокупности, как правило, меньше, чем в целом по всей совокупности. Соотношение между средним модулем отклонений и средним квартильным отклонением также служит для изучения структуры вариации: большое значение такого соотношения говорит о наличии слабоварьирующего «ядра» и сильно рассеянного вокруг этого ядра окружения, или «гало» в изучаемой совокупности. Для данных табл. 5.6 соотношение a : q = 1,23, что говорит о небольшом различии силу вариации в центральной части совокупности и на ее периферии.
Для оценки интенсивности вариации и для сравнения ее в разных совокупностях и тем более для разных признаков необходимы относительные показатели вариации. Они вычисляются как отношения абсолютных показателей силы вариации, рассмотренных ранее, к средней арифметической величине признака. Получаем следующие показатели:
1) относительный размах вариации р (коэффициент осцилляции):
159
Оценка степени интенсивности вариации возможна только для каждого отдельного признака и совокупности определенного состава. Так, для совокупности сельскохозяйственных предприятий вариация урожайности в одном и том же природном регионе может быть оценена как слабая, если v < 10%, умеренная при 10% < v < 25% и сильная при v > 25%.
Напротив, вариация роста в совокупности взрослых мужчин или женщин уже при коэффициенте, равном 7%, должна быть оценена и воспринимается людьми как сильная. Таким образом, оценка интенсивности вариации состоит в сравнении наблюдаемой вариации с некоторой обычной ее интенсивностью, принимаемой за норматив. Мы привыкли к тому, что урожайность, заработок или доход на душу населения, число жилых комнат в здании могут различаться в несколько и даже десятки раз, но различие роста людей в полтора раза уже воспринимается как очень сильное.
Различная сила, интенсивность вариации обусловлены объективными причинами. Например, цена продажи доллара США в одном из коммерческих банков Санкт-Петербурга на 1 января 2003 г. варьировала от 31.87 руб./долл. до 32.13 руб./долл. при средней цене 32 руб. за доллар США. Относительный размах вариации р = [32.13 - 31.87] = 26 коп. : 32 руб. = 0,8%. Такая малая вариация вызвана тем, что при значительном различии курса доллара немедленно произошел бы отток покупателей из «дорогого» банка в более «дешевые». Напротив, цена килограмма картофеля или говядины в разных регионах России варьирует очень сильно — на десятки процентов и более. Это объясняется разными затратами на доставку товара из региона-производителя в регион-потребитель, т.е. пословицей «Телушка за морем — полушка, да рубль перевоз».