Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СТАТИСТИКА-ред.1 электронный.pdf
Скачиваний:
38
Добавлен:
07.02.2015
Размер:
560.17 Кб
Скачать

Для цепных и базисных индексов с переменными весами

приведенное выше соотношение неправомерно.

 

 

Цепные индексы:

å p2 × q2

 

 

å p3

 

 

1 )

=

2 )

=

× q3

.

I р

å p1 × q2

; Iр

å p2 × q3

 

 

 

 

 

Базисный индекс:

 

 

 

å p3 ×q3

 

 

 

 

 

I

Б

=

.

 

 

 

 

p

å p1 ×q3

 

 

 

 

 

 

 

 

 

Произведение цепных индексов с переменными весами не дает базисный индекс:

I p(ц1) ´ I (pц 2) ¹ I бp .

8.Выборочное наблюдение

1.Основные понятия выборочного наблюдения

Суть выборочного наблюдения состоит в том, что в случайном порядке отбирается определенная часть единицсовокупности, которая подвергается дальнейшему исследованию, а затем по этой части дается представление о всей совокупности.

Выборочное наблюдение дает неодинаковые со сплошным наблюдением результаты из-за самого факта выборки, поэтому основная задача корректного выборочного наблюдения состоит в высокой степени представительности всей совокупности.

Существует понятие ошибок репрезентативности – отли-

чие выборочной совокупности от всей совокупности. Различают основные понятия выборочного наблюдения:

-генеральную совокупность и ее численность (N);

-выборочную совокупность (часть отобранных единиц) и ее численность (n).

Обобщающие характеристики выражаются двумя понятиями: средняя величина и доля.

55

х- средняя величина для генеральной совокупности(ге-

неральная средняя);

~ - выборочная средняя величина;

х

p – генеральная доля; w – выборочная доля.

Для выборочного наблюдения важен уровень варьирования признака, который в статистике выражается дисперсией:

Между выборочной и генеральной дисперсиями существует следующая зависимость:

σ2 = σ 2 × æ n ö

0 ç ÷

èn -1ø

Вформулах выборочного наблюдения общая дисперсия заменяется на выборочную. Предполагается, что при достаточно большом числе выборочной совокупности общая дисперсия совпадет с выборочной.

Однако в малых выборках (n ≤ 20 единиц) такое соотношение нужно учитывать.

Дисперсия альтернативного признака

ì σ 2p = p × q - для генеральной совокупности;

íîσW2 = w × (1 - w) - для выборочной совокупности.

где p и w – доля единиц, обладающих данным признаком, соответственно в генеральной и выборочной совокупности.

2. Методы определения ошибок выборки для средней величины и для доли

Главная задача выборочного наблюдения состоит в определении отклонений выборочных характеристик от генеральных. Эта задача решается с помощью определенияошибок выборки, которые показывают, на сколько единиц отклоняются выборочная средняя и доля от средней и доли в генеральной совокупности.

Ошибки выборки зависят от двух факторов:

1)численности выборки (чем больше ошибка выборки, тем меньше численность выборки, и наоборот);

56

2)степени варьирования признака (чем сильнее варьирует признак, тем больше ошибка выборки, и наоборот).

Зная влияние этих факторов, определяют среднюю ошибку выборки для повторного и бесповторного отбора.

Повторный отбор означает, что в первый раз отобранные единицы совокупности возвращаются в генеральную совокупность и поэтому повторно могут попасть в следующий этап отбора.

Ошибки выборки для повторного

Ошибки выборки для бесповтор-

отбора

ного отбора

Средняя ошибка выборки для средней величины

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

μ

 

 

=

 

σ2

 

 

μ

 

 

=

 

σ2

´(1-

n

)

 

 

 

 

n

 

 

 

 

 

n

N

 

x

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средняя ошибка выборки для доли

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m p

=

 

w(1 - w)

 

 

m p

=

 

w(1 - w)

´ (1 -

n

)

 

n

 

 

 

 

 

 

 

 

 

 

n

N

Предельная ошибка выборки для средней и для доли

 

 

 

D

 

= t ×μ

 

 

Dp = t ×μp

x

 

 

x

 

 

 

 

Переход от выборочной средней и доля к генеральным характеристи-

 

 

 

 

кам

 

 

~

± Dx

p = w ± Dp

 

x = x

Средние ошибки выборки (μ) показывают среднюю величину отклонений выборочных обобщающих характеристик от -ге неральных. Однако такие границы отклонений можно устанавливать не абсолютно, а с определенной степенью вероятности.

Например, доказано, что:

-в 683 случаях из 1000 ошибка выборки не выйдет за пределы значений μ;

-в 317 случаях из 1000 ошибка выборки может быть больше μ;

57

-можно увеличивать вероятность, в результате чего увеличивается кратность ошибки выборки, ее значение определяют

специальным коэффициентом, который обозначается t.

-

Вероятность

t

0,683

1

0,954

2

0,997

3

На основе коэффициента кратности ошибки рассчитывается показатель предельной ошибки выборки.

t – коэффициент кратности ошибки выборки (коэффициент доверия), характеризующий пределы отклонений выборочных характеристик от генеральных в зависимости от определенной степени вероятности.

Предельная ошибка выборки позволяет с определенной степенью вероятности утверждать, что генеральные характеристики будут находиться в определенных интервалах, которые назы-

ваются доверительными.

3. Определение необходимой численности выборки

Для проведения репрезентативного отбора предварительно следует рассчитать численность отбираемых единиц совокупности n. Она определяется на основе преобразования формул, характеризующих ошибки выборки для повторного и бесповторного отбора. Например, определение численности выборки для средней величины в повторном отборе будет рассчитываться так:

μ

 

 

=

σ2

Þ

n =

σ2

.

x

n

μ

 

2

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

Если в формуле ошибки выборки присутствует коэффициент кратности t, то численность выборки для средней величины определится по формуле:

58

 

 

 

 

σ2

×t

2

 

Dx = t ×μx

Þ n =

.

 

 

2

 

 

 

 

 

 

Dx

 

 

Для расчета численности выборки в показателях доли используются следующие формулы в повторном отборе:

n = w(1 - w) ;

μ 2 p

n = t 2 × w × (1 - w) .

D2 p

Вприведенных формулах заранее неизвестны показатели σ²

иw, практически этот вопрос решается так: в качестве неизвестных величин используются предыдущие расчетыаналогичного характера или определяют дисперсию альтернативногопризнака, равную 0,25.

При бесповторном отборе численность выборки учитывает также численность генеральной совокупности (N).

9.Статистические приемы изучения взаимосвязи явле-

ний

1. Функциональные и корреляционные связи. Задачи корреляционного анализа

Следует отличать функциональные связи от корреляционных.

Функциональные связи характеризуют изменение одного явления под влиянием другого или других. Эта связь считается жестко детерминированной, и она характеризуется для всех единиц совокупности в равной мере.

Корреляционные связи между явлениями проявляются только в среднем для совокупности и характеризуют вариацию -ре зультативного признака вследствие вариации факторных признаков. Корреляционные связи – это неполные связи, т.е. такие, которые отражают влияние одного или нескольких факторов.

59

В связи с этим различают парную и множественную корреляцию. Парная корреляция изучает зависимость между парой признаков, один из которых – признак–следствие (у), а другой признак – фактор (х). Множественная корреляция изучает влияние нескольких факторов на признак–следствие Y.

Задачи корреляционного анализа:

1)установление наличия связи между признаками и выражение ее уравнением регрессии;

2)определение тесноты связи между признаками, т.е. степени приближения ее к функциональной. Эта задача решается с помощью расчета коэффициентов и индексов корреляции. Поэтому в целом такой метод анализа называетсякорреля-

ционно-регрессионным.

2. Выявление корреляционных зависимостей и установление форм связей

Наличие связи между изучаемыми признаками может быть обнаружено с помощью графического метода и метода предварительного теоретического анализа.

В любом случае обнаруженная корреляционная зависимость должна быть подтверждена расчетом эмпирического корреляционного отношения:

η =

δ2

,

σ2

 

 

где σ2 = å(yi - y)2 × fi - межгрупповая дисперсия признака у;

å fi

σ2 = y2 - ( y)2 - общая дисперсия признака у.

Если η≥ 0,7, то связь между признаками х и у считается тесной и дальнейшие вычисления целесообразны.

Предварительный теоретический анализ согласованной вариации признаков х и у осуществляется следующим образом:

1)если с увеличением признаках увеличивается признак у и наоборот, то такую связь следует характеризовать уравнени-

ем прямой:

60

y x = a0 + a1 × x ,

где а1 , а 0 - параметры уравнения;

х - признак - фактор;

y х - теоретический уровень признака - следствия.

Параметр а0 отражает влияние на показательу всех остальных факторов, кроме фактора х.

Параметр а1 коэффициент регрессии – показывает, на сколько абсолютных единиц изменится признак-следствиеу от изменения фактора х на одну единицу.

Коэффициент регрессии может быть выражен в относительных единицах:

Э = а1 × x - коэффициент эластичности. y

Коэффициент эластичности более универсален, чем коэффициент регрессии, т.к. показывает, на сколько процентов изменится у от изменения х на один процент.

Для нахождения параметров уравнения на основе метода наименьших квадратов решаются системы двух уравнений с двумя неизвестными:

для несгруппированных данных

ì n × a0 + a1 ×å x = å y; íîa0 ×å x + a1 ×å x2 = å x × y,

где n – число пар значений признака.

для сгруппированных данных

ì a0 ×å f + a1 × åx × f = åy × f ; íîa0 × å f × x + a1 ×åx2 × f = å y × x × f ;

2)если с увеличениемх уменьшается у и наоборот, то такую связь можно охарактеризовать уравнением гиперболы:

1 yx = a0 + a1 × x .

Для этого уравнения существует следующая система уравнений для нахождения параметров:

61

для несгруппированных данных

ì

n × a0 + a1 ×å

1

 

= å y;

ï

 

 

x

í

 

 

 

 

 

 

 

× å

1

+ a1 × å

 

1

= åy ×

1

 

ïa0

 

;

 

 

2

 

î

 

x

x

 

x

3)если с увеличениемх также увеличивается у, но до определенного значения, а затем с увеличением х уменьшается у, то между признаками существует параболическаязависимость, ко-

торую можно описатьуравнением параболы второго порядка:

y x = a0 + a1 × x + a2 × x 2

Для этого уравнения существует следующая система для нахождения параметров:

ì n × a0 + a1 × åx + a2 × åx2 = å y;

ï

í a0 × åx + a1 ×åx2 + a2 ×åx3 = åx × y; ïîa0 × åx2 + a1 ×åx3 + a2 ×åx4 = åx2 × y;

4)если с увеличением темпов роста признаках темпы роста признака у затухают, то такую связь лучше описать логарифмической кривой

y x = a0 + a1 × ln x ,

где ln х – логарифм коэффициентов роста показателя х.

Для этого уравнения существует следующая система уравнений для нахождения параметров:

ì n × a0 + a1 × åln x = å y

íîa1 × åln x + a1 × åln x 2 = å y × ln x

3. Индекс и линейный коэффициент корреляции

Теснота связи между признаками характеризует приближение ее к функциональной, т.е. к полной. Для оценки этого используются две дисперсии: общая и остаточная (простая и взвешенная).

62