- •3. Основные виды выборки, способы отбора 65
- •4. Малая выборка 71
- •Введение
- •Лекция 1. Предмет, задачи и метод статистики
- •1. Особенности предмета статистики.
- •2. Статистическая методология
- •Лекция 2. Статистическое наблюдение
- •1.Понятия и требования статистического наблюдения
- •2. Программно-методологические и организационные вопросы статистического наблюдения
- •3. Ошибки статистического наблюдения.
- •Лекция 3. Сводка и группировка данных статистического наблюдения
- •1.Понятия сводки и группировки статистических данных
- •2. Виды группировок.
- •3. Статистические ряды распределения и таблицы
- •Виды таблиц в зависимости от разработки подлежащего:
- •Виды таблиц по характеру сказуемого:
- •Лекция 4. Абсолютные и относительные статистические величины
- •Понятие абсолютной и относительной величины в статистике
- •Виды и взаимосвязи относительных величин
- •Лекция 5. Средние величины
- •1.Понятие средней величины в статистике
- •2. Средняя арифметическая и ее свойства
- •3. Другие виды степенных средних величин
- •4. Мода и медиана
- •Квартили и децили
- •Вопросы для самоконтроля
- •Лекция 6. Показатели вариации
- •1. Понятие и виды вариации
- •2. Абсолютные и средние показатели вариации
- •3. Показатели относительного рассеивания
- •Правило сложения дисперсий
- •Вопросы для самоконтроля
- •Лекция 7. Выборочный метод
- •Основные виды выборки, способы отбора Малая выборка
- •1. Основы выборочного метода
- •2. Ошибки выборки
- •3. Основные виды выборки, способы отбора
- •4. Малая выборка
- •Вопросы для самоконтроля
- •Лекция 8. Изучение статистической связи
- •1. Понятие и виды статистической связи
- •Виды и формы связей, различаемые в статистике.
- •2. Корреляционная связь
- •3. Применение и задачи корреляционно-регрессионного анализа Условия применения и ограничения корреляционно-регрессионнго метода:
- •Парная корреляция и парная регрессия
- •Эмпирическое корреляционное отношение
- •Оценка значимости параметров взаимосвязи
- •Непараметрические методы оценки связи
- •Вопросы для самоконтроля
- •Лекция 9. Анализ рядов динамики
- •1. Понятие о статистических рядах динамики и их классификация
- •2. Статистические показатели динамики
- •3. Средние показатели в рядах динамики
- •4. Проверка ряда на наличие тренда. Методы выделения тренда
- •5. Анализ сезонных колебаний
- •6. Анализ взаимосвязанных рядов динамики
- •Вопросы для самоконтроля
- •Лекция 10. Индексный метод
- •1. Статистические индексы
- •2. Индивидуальные и общие индексы.
- •Агрегатные индексы
- •4. Средневзвешенные индексы
- •Средние арифметические и гармонические индексы
- •6. Расчеты недостающих индексов с помощью индексных систем
- •Вопросы для самоконтроля
- •Нормальный закон распределения
- •Распределение Стьюдента (t-распределение)
Эмпирическое корреляционное отношение
Для измерения тесноты связи применяется несколько показателей. При парной связи теснота связи определяется, прежде всего, корреляционным отношением, которое обозначается η. Квадрат корреляционного отношения – это отношение межгрупповой дисперсии результативного признака, которая выражает влияние различий группировочного факторного признака на среднюю величину результативного признака, к общей дисперсии результативного признака, выражающей влияние на него всех причин и условий. Квадрат корреляционного отношения называется коэффициентом детерминации.
ыми явлениями и их признаками: ________________ или жестко детермини
где k- число групп
N – число наблюдений
yi – исходные значения результативного признака
yj – средние значения результативного признака для данной группы
y – среднее значение признака
fj – численность группы
Указанная выше формула применяется при расчете показателя тесноты связи по аналитической группировке. При вычислении корреляционного отношения по уровню связи применяется формула:
Сумма квадратов в числителе – это объясненная связью с фактором х (факторами) дисперсия результативного признака у. Она вычисляется по индивидуальным данным, полученным для каждой единицы совокупности на основе уравнения регрессии.
Если уравнение выбрано неверно или сделана ошибка при расчете его параметров, то сумма квадратов в числителе может оказаться больше чем в знаменателе, и отношение утратит тот смысл, который должно иметь. Чтобы избежать ошибочного результата, лучше вычислять корреляционное отношение по следующей формуле:
В основе указанной формулы лежит известное правило разложения сумм квадратов отклонений при группировке совокупности:
Dобщ = Dмежгр+Dвнутригр
Согласно этому правилу можно вместо межгрупповой (факторной) дисперсии использовать разность:
Dобщ –Dвнутригр
что дает:
При расчете η не по группировке, а по уравнению корреляционной связи (уравнению регрессии) мы используем формулу. В этом случае правило разложения суммы квадратов отклонений результативного признака записывается как
Dобщ= Dкор +Dост
Важнейшее положение, которое следует теперь усвоить любому, желающему правильно применять метод корреляционно-регрессионого анализа, состоит в интерпретации формул (1.2) и (1.3). Это положение гласит:
Уравнение корреляционной связи измеряет зависимость между вариацией результативного признака и вариацией факторного признака (признаков). Меры тесноты связи измеряют долю вариации результативного признака, которая связанна с вариацией факторного признака (признаков).
Оценка значимости параметров взаимосвязи
Получив оценки корреляции и регрессии, необходимо проверить их на соответствие истинным параметрам взаимосвязи.
Существующие программы для ЭВМ включают, как правило, несколько наиболее распространенных критериев. Для оценки значимости коэффициента парной корреляции рассчитывают стандартную ошибку коэффициента корреляции:
В первом приближении нужно, чтобы . Значимость rxy проверяется его сопоставлением с , при этом получают
где tрасч – так называемое расчетное значение t-критерия.
Если tрасч больше теоретического (табличного) значения критерия Стьюдента (tтабл) для заданного уровня вероятности и (n-2) степеней свободы, то можно утверждать, что rxy значимо.
Подобным же образом на основе соответствующих формул рассчитывают стандартные ошибки параметров уравнения регрессии, а затем и t-критерии для каждого параметра. Важно опять-таки проверить, чтобы соблюдалось условие tрасч > tтабл. В противном случае доверять полученной оценке параметра нет оснований.
Вывод о правильности выбора вида взаимосвязи и характеристику значимости всего уравнения регрессии получают с помощью F-критерия, вычисляя его расчетное значение:
где n – число наблюдений; m – число параметров уравнения регрессии.
Fрасч также должно быть больше Fтеор при v1 = (m-1) и v2 = (n-m) степенях свободы. В противном случае следует пересмотреть форму уравнения, перечень переменных и т.д.