Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция.docx
Скачиваний:
11
Добавлен:
17.08.2019
Размер:
190.78 Кб
Скачать

§ 3. Понятие о многомерных группировках.

Метод многомерных группировок в методологическом плане является антиподом типологических группировок, поскольку при использовании метода:

  1. Перечень типов неизвестен, и определяется только по итогам группировки.

  2. Ограничения на число признаков и интервалов значений признаков не играют столь существенной роли, как при типологической группировке.

Методы многомерных группировок представляют собой сложные итеративные процедуры, реализуемые с помощью пакетов прикладных программ на вычислительной технике.

Одним из важнейших методов многомерной группировки является кластер-анализ. Число алгоритмов кластер-анализа, а также родственных ему методов распознавания образов и таксономии очень велико.

Развитием многомерных группировок занимается особый раздел статистической науки – многомерный статистический анализ (подробнее см. раздел «Многомерные группировки», главы «Группировки» в учебнике).

Тема 4. Средние величины и показатели вариаций.

Рассмотрим случай расчёта средних величин, наиболее часто встречающийся на практике:

  1. Расчёт средней арифметической величины (среднее значение) по индивидуальным значениям признака: X1,…,,Xn производится по формуле:

Т акая средняя называется простой средней арифметической.

  1. Расчёт средней арифметической по данным дискретного вариационного ряда производится по формуле:

, где Xi – варианты вариационного ряда,

fi – частоты соответствующих вариантов,

n – число вариант в вариационном ряду.

Пример: Распределение семей С.-Пб. по размеру.

Размер семьи

1

2

3

4

5+

Итого

[варианты]

Число семей (тыс. чел.)

385

395

500

333

144

1757

[частоты]

Средний размер семьи в С.-Пб. = (1*385+2*395+3*500+4*333+5,5*144)/1757 = 2,7 чел.

  1. Расчёт средней по интервальному ряду производится по формуле:, где Xi' – середина i-го интервала.

, где , - середина i-того интервала.

  1. Расчёт средних вторичных признаков.

Первичными признаками называют абсолютные и непосредственно измеримые величины, например, число занятых в экономике страны, ВВП, фонд зарплаты работников предприятия.

Вторичные признаки (примеры: выработка продукции на 1 работника, средняя зарплата 1 работника и т.д.) рассчитываются путём деления одних первичных признаков на другие, например: выработку продукции на 1 работника получают путём деления объёма продукции на численность работников.

Как правило, среднее значение первичных признаков рассчитывается по формуле простой средней арифметической, тогда как расчёт среднего для вторичных признаков имеет свои особенности и производится в следующей последовательности:

  1. Записывается исходная формула показателей;

  2. Формулы преобразуются к виду, позволяющему производить расчёт искомой средней по имеющимся данным, после чего производится соответствующий расчёт.

Пример: продукция предприятия производится в 3 цехах, характеризующихся следующими данными:

Цех

Численность рабочих (X)

Выработка на 1 работника, тыс. руб.(W)

1

100

5

2

200

6

3

700

10

Итого

1000

8,7

Требуется рассчитать среднюю выработку на 1 рабочего предприятия.

  1. Запишем формулу расчёта данного показателя:

  2. Преобразуем данную формулу к виду, позволяющему производить расчёт по имеющимся данным:

Использованная формула расчёта средней носит название средней арифметической взвешенной. Эта средняя называется взвешенной, потому что значение удельного веса (доли) работников каждого цеха в общей численности работников предприятия dx выполняет в формуле (1) роль весов. В самом деле, формула (1) может быть преобразована к виду:

, где dx = x/Σx, т.е. расчёт:

5 • 0,1 + 6 • 0,2 + 10 • 0,7 = 8,7 (тыс. руб.)

Из-за того, что значение выработки в каждом цеху взвешивается по доле работников этого цеха в общей численности работников, полученное значение средней отличается от значения простой средней арифметической.

Средняя взвешенная оказалась больше простой средней потому, что наиболее высокая выработка была в том цехе, где работает большая часть (70%) всех работников. Иными словами, выработка в третьем цехе вошла в расчёт с наибольшим весом (0,7).

Возникает вопрос: почему в данном случае необходимо рассчитывать именно взвешенную, а не простую среднюю?

Это связано не с какими-либо формальными соображениями, а только с экономической логикой. В самом деле, средняя выработка по предприятию представляет собой частное от деления всей продукции, произведённой на предприятии, на число работников этого предприятия. Это и предопределяет расчёт по формуле (1).

Пример 2.

По предприятию имеются следующие данные:

Цех

Объем основных производственных фондов (y), млн. руб.

Фондоёмкость продукции (z)

1

80

4

2

200

5

3

720

6

Итого

1000

?

Требуется рассчитать среднюю фондоёмкость продукции по предприятию в целом.

  1. Запишем формулу расчёта фондоёмкости:

  2. Преобразуем данную формулу к виду, позволяющему провести необходимый расчёт: ;

Средняя, рассчитанная по формуле (2), носит название среднегармонической взвешенной. Роль веса в этой формуле (y) выполняет объём основных производственных фондов. В результате взвешивания значение средней (5,56) оказалось больше величины простой средней (4 + 5 + 6)/3 = 5. Это объясняется тем, что цех №3, где фондоёмкость была наиболее высокой, имел наибольший вес (72% всех ОФП). Подчеркнём, что и здесь необходимость расчёта по формуле гармонической взвешенной средней обусловлена экономической логикой расчёта (см. формулу расчёта фондоёмкости).