СтатистикаЛевина 2012
.pdfНапример: Уровень производительности труда на заводах даже одинаковой специализации зависит не только от размера энерговооруженности труда на заводе, хотя этот фактор имеет важное значение для всех наблюдаемых единиц. На него оказывают влияние и такие факторы, как режим работы на заводе, организация его снабжения, личные качества производственного персонала и многие другие. Поэтому, сравнивая производительность труда и уровень энерговооруженности труда на двух отдельно взятых заводах, можно и не увидеть между ними прямой зависимости. Может случиться так, что на заводе, на котором выше энерговооруженность труда, оказался ниже уровень производительности. Это означает, что на уровень производительности труда на этом заводе оказали существенное влияние какие-то иные факторы, его понижающие. Но, если мы возьмем достаточно большое число заводов, обнаружится прямая зависимость в изменении энерговооруженности труда и производительности труда. Следовательно, важная особенность корреляционных связей состоит в том, что они обнаруживаются не в единичных случаях, а в массе и требуют для своего исследования массовых наблюдений, то есть статистических данных.
Проявление корреляционных зависимостей подвержено действию закона больших чисел:
лишь в достаточно большом числе фактов индивидуальные особенности и второстепенные факторы сгладятся и зависимость, если она имеет существенную силу, проявляется достаточно отчетливо.
Вторая важная особенность корреляционных связей состоит в том, что они являются неполными. Анализируя зависимость между уровнем энерговооруженности труда и его производительностью, мы берем важный фактор, от которого зависит производительность труда, но этот фактор не единственный. Производительность труда на предприятиях зависит от других существенных факторов. Поэтому даже на массовом материале, где случайные связи погашаются, обнаруженные зависимости не будут носить полного, то есть функционального характера. Они будут в той или иной мере приближаться к функциональной связи, но действие прочих «неучтенных» факторов проявится в том, что корреляционная связь окажется неполной, она не достигнет по силе связи функциональной.
150
Прямые и обратные связи.
В зависимости от направления действия как функциональные, так и корреляционные связи могут быть как прямыми, так и обратными.
При прямой связи направление изменения результативного признака совпадает с направлением изменения признака-фактора, то есть с увеличением факторного признака увеличивается и результативный и, наоборот, с уменьшением факторного признака уменьшается и результативный признак. В противном случае между рассматриваемыми величинами существуют обратные связи. В явлениях общественной жизни встречаются и те и другие виды связи.
Например: чем выше квалификация рабочего (разряд), тем выше уровень производительности труда – прямая связь. А чем выше производительность труда, тем ниже себестоимость продукции – обратная связь.
Прямолинейная и криволинейная связи.
По аналитическому выражению связи могут быть прямолинейными и криволинейными.
При прямолинейной связи с возрастанием величины факторного признака происходит непрерывное возрастание (или убывание) величин результативного признака. Математически такая связь представляется уравнением прямой:
ух = а + b х, где
у – индивидуальные значения результативного признака; х – индивидуальные значения факторного признака;
а, b – параметры уравнения;
ух – теоретическое значение результативного признака, а графически – прямой линией.
При криволинейной связи с возрастанием факторного признака возрастание (или убывание) результативного признака происходит неравномерно или направление его изменения меняется на обратное. Графически такие связи представляются кривыми линиями, а математически такие связи представляются:
Полулогарифмическая |
yx = a + b lg x; |
Показательная |
y = a + bx; |
|
x |
Степенная |
y = a xb; |
|
x |
Параболическая |
y = a + b x + с x2; |
|
x |
|
151 |
Гиперболическая y = a + b 1
x |
x |
|
и др.
Решение математических уравнений связи предполагает вычисление по исходным данным их параметров. Это осуществляется способом выравнивания эмпирических данных методом наименьших квадратов. В основу этого метода положено требование минимальности сумм квадратов отклонений эмпирических данных yi от выравненных yxi:
( yi yxi )2 min
При этом нужно иметь в виду, что только функциональные связи аналитическим уравнением выражаются точно, корреляционные связи – лишь приближенно, при условии абстрагирования от влияния всех прочих факторов. Поэтому на графике и будет наблюдаться разброс точек (у, х) вблизи теоретической линии.
Однофакторные и многофакторные связи.
Для корреляционных связей есть различие в том случае, если исследуется связь между одним признаком-фактором и результативным признаком (при абстрагировании влияния других) и несколькими факторными признаками и результативным признаком. В первом случае говорят о парной связи (связь между двумя признаками) и о парной корреляции, во втором случае – о многофакторной связи и о множественной корреляции. В этом случае имеется в виду, что все факторы действуют комплексно, то есть одновременно и во взаимосвязи.
Т.о., при сравнении функциональной и корреляционной зависимостей следует иметь в виду, что при наличии функциональной зависимости между признаками можно, зная величину факторного признака, точно определить величину результативного признака. При наличии же корреляционной зависимости устанавливается лишь тенденция изменения результативного признака при изменении величины факторного признака. В отличие от жесткости однозначно функциональной связи корреляционные связи характеризуются множеством причин и следствий и устанавливаются лишь их тенденции.
152
Для исследования функциональных связей применяются: -балансовый метод; -индексный метод.
Для изучения корреляционных связей используются разные методы:
-метод параллельных ранжированных рядов; -метод аналитических группировок; -метод дисперсионного анализа; -корреляционно-регрессионный метод; -простейшие методы.
5.2. Балансовый метод.
Балансовая система показателей, сгруппированных в сводную ведомость в виде двусторонней таблицы, отображающую зависимость между источниками формирования ресурсов (средств) и их использованием. Причем должно соблюдаться следующее условие: «итого» левой части таблицы равняется «итого» правой части. Свое проявление оно получает в формуле:
Он + П = В + Ок , где Он – остаток ресурсов на начало изучаемого периода;
П – поступление ресурсов за период; В – выбытие ресурсов в изучаемом периоде;
Ок – остаток ресурсов на конец периода.
Левая часть формулы (Он + П) характеризует предложение ресурсов, а правая часть (Ок + В) – их использование.
Ресурсы |
Их использование |
|
|
Итого: |
Итого: |
Нужно отметить, что в виде баланса выражается большинство народнохозяйственных связей.
5.3. Метод параллельных ранжированных рядов.
153
Простейшим приемом обнаружения связи является сопоставление двух параллельных рядов – ряда значений факторного признака и соответствующих ему значений результативного признака. Значения факторного признака располагают в ранжированном порядке и затем прослеживают направление изменения величины результативного признака.
Результативный признак в дальнейшем будем обозначать через «у», а факторный признак – через «х».
Пример: Имеются следующие данные обследования рабочих предприятия, принятых на работу за последние 5 лет.
По двадцати рабочим была выявлена зарплата (результативный признак) и процент выполнения нормы выработки (факторный признак).
Порядковый номер рабочего |
Зарплата за месяц, р. |
Процент выполнения |
|
нормы выработки |
|||
|
|
||
1 |
1.734 |
186 |
|
2 |
1.690 |
180 |
|
3 |
1.720 |
190 |
|
4 |
1.725 |
184 |
|
5 |
1.714 |
181 |
|
6 |
1.738 |
200 |
|
7 |
1.702 |
176 |
|
8 |
1.674 |
140 |
|
9 |
1.677 |
144 |
|
10 |
1.670 |
136 |
|
11 |
1.700 |
164 |
|
12 |
1.690 |
170 |
|
13 |
1.702 |
169 |
|
14 |
1.700 |
155 |
|
15 |
1.685 |
158 |
|
16 |
1.670 |
156 |
|
17 |
1.695 |
168 |
|
18 |
1.654 |
115 |
|
19 |
1.660 |
116 |
|
20 |
1.662 |
119 |
С целью установления зависимости процента выполнения нормы выработки и зарплаты за месяц проранжируем исходный ряд по проценту выполнения нормы выработки.
154
Порядковый номер рабоче- |
Процент выполнения нормы |
Зарплата за месяц, р. |
|
го |
выработки |
||
|
|||
1 |
2 |
3 |
|
18 |
115 |
16540 |
|
19 |
116 |
16600 |
|
20 |
119 |
16620 |
|
10 |
136 |
16700 |
|
8 |
140 |
16740 |
|
9 |
144 |
16770 |
|
14 |
155 |
17000 |
|
16 |
156 |
16700 |
|
15 |
158 |
16850 |
|
11 |
164 |
17000 |
|
17 |
168 |
16950 |
|
13 |
169 |
17020 |
|
12 |
170 |
16900 |
|
7 |
176 |
17020 |
|
2 |
180 |
16900 |
|
5 |
181 |
17140 |
|
4 |
184 |
17250 |
|
1 |
186 |
17340 |
|
3 |
190 |
17200 |
|
6 |
200 |
17380 |
Таким образом, можно видеть, что в целом для всей совокупности рабочих увеличение процента выполнения нормы выработки приводит к увеличению уровня зарплаты, получаемой рабочими. Хотя в отдельных случаях наличие такой зависимости может и не усматриваться.
В тех случаях, когда возрастание величины факторного признака ведет за собой возрастание и величины результативного признака, говорят о возможном наличии прямой корреляционной связи. Если же с увеличением факторного признака, величина результативного признака имеет тенденцию к снижению, то можно предполагать обратную связь между признаками.
Нужно отметить, что данный метод используется при небольшом количестве информации. А недостатком является отсутствие количественной оценки связи.
155
Для предварительного выявления наличия связи и раскрытия ее характера применяют графический метод. Используя данные об индивидуальных значениях признака-фактора и соответствующих ему значениях результативного признака, можно построить в прямоугольных координатах точечный график, который называют «полем корреляции». Для нашего случая «поле корреляции» имеет следующий вид.
17500 |
у |
|
|
|
|
|
|
|
|
|
|
17400 |
|
|
|
|
|
17300 |
|
|
|
|
|
17200 |
|
|
|
|
|
17100 |
|
|
|
|
|
17000 |
|
|
|
|
|
16900 |
|
|
|
|
|
16800 |
|
|
|
|
|
16700 |
|
|
|
|
|
16600 |
|
|
|
|
|
16500 |
|
|
|
|
|
16400 |
|
|
|
|
х |
0 |
50 |
100 |
150 |
200 |
250 |
Зависимостьуровнязарплатырабочихрабочих(у) от(упроцента) от процентавыполнениявыполненияими ими нормывыработки(х)(х)
5.4. Метод аналитических группировок.
Метод аналитических группировок используется при большом объеме информации. Для применения этого метода сначала все наблюдения разбиваются на группы в зависимости от величины признака-фактора, а затем по каждой группе вычисляют среднее значение результативного признака.
Пример: Имеются следующие данные по 30 предприятиям одной из отраслей промышленности.
156
№ предприятия |
Потери рабочего |
Выпуск продукции, млн р. |
|
времени, тыс. чел-дн. |
|||
|
|
||
1 |
66,0 |
65,0 |
|
2 |
44,0 |
78,0 |
|
3 |
91,0 |
41,0 |
|
4 |
78,0 |
54 |
|
5 |
57,4 |
66 |
|
6 |
42,0 |
80 |
|
7 |
100,0 |
45 |
|
8 |
79,8 |
57 |
|
9 |
57,0 |
67 |
|
10 |
38,0 |
81 |
|
11 |
23,1 |
92 |
|
12 |
112,0 |
48 |
|
13 |
72,0 |
59 |
|
14 |
55,7 |
68 |
|
15 |
36,0 |
83 |
|
16 |
85,2 |
52 |
|
17 |
72,8 |
62 |
|
18 |
54,6 |
69 |
|
19 |
37,0 |
85 |
|
20 |
56,4 |
70 |
|
21 |
56,0 |
71 |
|
22 |
70,4 |
64 |
|
23 |
53,6 |
72 |
|
24 |
34,9 |
88 |
|
25 |
55,4 |
73 |
|
26 |
52,0 |
74 |
|
27 |
20,4 |
96 |
|
28 |
53,1 |
75 |
|
29 |
12,0 |
101 |
|
30 |
46,0 |
76 |
Установим наличие и характер связи между величиной потерь рабочего времени и выпуском продукции методом аналитической группировки.
Вначале строим рабочую таблицу, образовав 5 групп предприятий с равными интервалами.
157
Распределение предприятий по величине потерь рабочего времени.
|
Группы предприятий по ве- |
|
Потери рабочего |
Выпуск |
|
№ |
личине потерь рабочего вре- |
№ п/п |
времени, |
продукции, |
|
|
мени |
|
тыс. чел-дн. |
млн р. |
|
А |
Б |
1 |
2 |
3 |
|
|
|
29 |
12 |
101 |
|
1 |
12 – 32 (+) |
27 |
20,4 |
96 |
|
|
11 |
23,1 |
92 |
||
|
|
||||
|
Итого: |
3 |
55,5 |
289 |
|
|
|
24 |
34,9 |
88 |
|
|
|
15 |
36 |
83 |
|
|
|
19 |
37 |
85 |
|
|
|
10 |
38 |
81 |
|
2 |
|
6 |
42 |
80 |
|
32 – 52 |
2 |
44 |
78 |
||
|
|||||
|
|
30 |
46 |
76 |
|
|
|
26 |
52 |
74 |
|
|
Итого: |
8 |
329,9 |
645 |
|
|
|
28 |
53,1 |
75 |
|
|
|
23 |
53,6 |
72 |
|
|
|
18 |
54,6 |
69 |
|
|
|
25 |
55,4 |
73 |
|
|
|
14 |
55,7 |
68 |
|
|
|
21 |
56,0 |
71 |
|
|
|
20 |
56,4 |
70 |
|
|
|
9 |
57,0 |
67 |
|
3 |
52 – 72 |
5 |
57,4 |
66 |
|
|
|
1 |
66,0 |
65 |
|
|
|
22 |
70,4 |
64 |
|
|
|
13 |
72,0 |
59 |
|
|
|
|
|
|
|
|
Итого: |
12 |
707,6 |
819 |
|
|
|
17 |
72,8 |
62 |
|
|
|
4 |
78 |
54 |
|
|
|
8 |
79,8 |
57 |
|
4 |
72 – 92 |
16 |
85,2 |
52 |
|
|
|
3 |
91 |
41 |
|
|
Итого: |
5 |
406,8 |
266 |
|
5 |
92 – 11 |
5 |
100 |
45 |
|
12 |
112 |
48 |
|||
|
|
||||
|
Итого: |
2 |
212 |
93 |
|
|
Всего: |
30 |
1711,8 |
2112 |
158
Для установления наличия и характера связи между величиной потерь рабочего времени и выпуском продукции по данным рабочей таблицы строим итоговую аналитическую таблицу.
Зависимость величины выпуска продукции (у) от уровня потерь рабочего времени (х).
|
|
|
Потери раб. времени, |
Выпуск продук- |
|||
№ |
Группы п/п по ве- |
Число |
|
тыс. чел-дн. |
ции, млн. руб. |
||
личине потерь ра- |
|
средн. уровень по- |
|
в сред- |
|||
п/п |
п/п |
|
|
||||
бочего времени |
всего |
терь рабочего вре- |
всего |
нем на |
|||
|
|
||||||
|
|
|
|
мени |
|
1 п/п |
|
А |
Б |
1 |
2 |
3 |
4 |
5 |
|
1 |
12 – 32 |
3 |
55,5 |
18,5 |
289 |
96,3 |
|
2 |
32 – 52 |
8 |
329,9 |
41,2 |
645 |
80,6 |
|
3 |
52 – 72 |
12 |
707,6 |
59 |
819 |
68,3 |
|
4 |
72 – 92 |
5 |
406,8 |
81,4 |
266 |
53,2 |
|
5 |
92 – 112 |
2 |
212 |
106 |
93 |
46,5 |
|
|
Итого: |
30 |
1711,8 |
57,06 |
2112 |
70,4 |
Данные таблицы показывают, что с увеличением уровня потерь рабочего времени, средняя величина выпуска продукции в расчете на одно предприятие уменьшается. Следовательно между исследуемыми признаками существует обратная корреляционная зависимость.
Корреляционная зависимость отчетливо обнаруживается только при рассмотрении средних значений результативного признака, соответствующих определенным значениям факторного признака, так как при достаточно большом числе наблюдений в каждой группе влияние прочих случайных факторов при расчете групповой средней будет взаимопогашаться, и четче выступит зависимость результативного признака от фактора, положенного в основу группировки. Иначе, предполагается, что все прочие причины, если они носят случайный характер, при определении средней по группам взаимопогашаются, то есть дают в каждой группе один и тот же результат. Следовательно, различия в величине средних будут связаны только с различиями данного факторного признака. Если бы связи между факторным и результативным признаком не было, то все групповые средние были бы примерно одинаковыми по величине.
159