Задача 5
Расчет показателей вариации вручную достаточно трудоемок, особенно при больших объемах совокупностей. Стандартные статистические методы обработки данных
включены в состав электронных таблиц, математических пакетов (Mathcad, Mathlab и др.),
специализированных статистических пакетов (STATISTICA, SPSS, STATGRAPHICS и др). Рассмотрим порядок расчета показателей вариации для нашего примера с помощью табличного процессора Microsoft Excel.
Сформируем таблицу с исходными данными о среднем размере товарооборота фирм на рабочем листе Microsoft Excel (табл. 2.6).
Таблица 2.6. Исходные данные
|
А |
В |
|
Месяц |
Товарооборот, млн руб. |
1 |
Январь |
18,9 |
2 |
Февраль |
24,2 |
3 |
Март |
23,7 |
4 |
Апрель |
24,8 |
5 |
Май |
19,5 |
6 |
Июнь |
19,2 |
7 |
Июль |
19,7 |
8 |
Август |
21,5 |
9 |
Сентябрь |
22,3 |
10 |
Октябрь |
20,7 |
11 |
Ноябрь |
23,5 |
12 |
Декабрь |
20,4 |
Активизируем любую свободную ячейку, в которой мы хотим поместить результат вычисления того или иного показателя. Например, В16. Запускаем мастер функций командой Функция из меню Вставка или щелчком по кнопке вызова мастера функций на панели управления — fx. В открывшемся диалоговом окне Мастер функций — шаг 1 из 2 выбираем категорию Статистические и затем перемещаем строку выделения по списку функций до необходимой статистической функции. В нижней части окна будет представлена краткая информация о выделяемых функциях. В списке функций вы найдете все вычисленные для нашего примера функции:
СРЗНАЧ — рассчитывает среднюю арифметическую простую для заданных аргументов;
МОДА — отображает наиболее часто встречающиеся значения аргументов;
МЕДИАНА — рассчитывает медиану заданных аргументов;
СТАНДОТКЛОН — оценивает генеральное среднее квадратическое отклонение по выборке (если совокупность является генеральной, следует воспользоваться функцией СТАНДОТКЛОНП);
ДИСП — оценивает генеральную дисперсию по выборке (если совокупность является генеральной, следует воспользоваться функцией ДИСПР) и др.
Предположим, мы хотим рассчитать среднее квадратическое отклонение. После выбора функции щелкаем по кнопке ОК для перехода в следующее диалоговое окно Аргументы функции, в котором необходимо задать аргументы. Задать аргументы можно разными способами. Например, выделить блок ячеек с исходными данными, в нашем случае В4:В15. Для этого устанавливаем указатель мыши в ячейку В4 и, удерживая левую кнопку мыши, протаскиваем указатель до ячейки В15. Убедитесь, что в окне Аргументы
функций появилась запись В4:В15, а в строке формул отражена функция, по которой будет производиться вычисление — = СТАНДОТКЛОНП(В4:В15). Щелкаем ОК. В ячейке В16 появляется результат вычислений, равный 2,016322.
Возможен и другой порядок расчета. После формирования на рабочем листе Excel таблицы с исходными данными в меню Сервис выбираем команду Анализ данных. Появляется окно с одноименным названием, в котором представлен список, реализованных в Excel методах статистической обработки данных. Выделяем указателем мыши режим Описательная статистика и щелкаем по кнопке ОК. В диалоговом окне режима Описательная статистика задаем параметры:
• Выходной интервал — В4 : В15.
• Группирование — по столбцу.
• Выходной интервал — указываем любую свободную ячейку. Она будет верхней левой ячейкой выходной таблицы с результатами вычислений.
• Итоговая статистика — устанавливаем в активное состояние.
Щелкаем ОК.
Показатели, рассчитанные в данном режиме, представлены в табл. 2.7.
Таблица 2.7. Итоговая статистика
Столбец 1 |
|
|
|
Среднее |
21,53 |
Стандартная ошибка |
0,61 |
Медиана |
21,10 |
Мода |
#Н/Д |
Стандартное отклонение |
2,11 |
Дисперсия выборки |
4,44 |
Эксцесс |
-1,55 |
Асимметричность |
0,29 |
Интервал |
5,90 |
Минимум |
18,90 |
Максимум |
24,80 |
Сумма |
258,40 |
Счет |
12,00 |
Обратите внимание, что показатель среднее квадратическое отклонение (стандартное отклонение) несколько отличается от рассчитанного ранее. Это связано с тем, что в режиме Описательная статистика все функции реализуются по формулам для выборочных совокупностей.
Задачи
Задача 1
По данным о распределении сотрудников коммерческого банка по стажу работы определите размах вариации, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение и коэффициент вариации.
Стаж, лет |
5 |
6 |
7 |
8 |
9 |
10 |
Число сотрудников |
43 |
32 |
25 |
13 |
10 |
7 |
Ответ: R = 5лет; d = 1,3 года; σ2 = 1,5 года; V = 23,1%.
Задача 2
По данным о розничном товарообороте продовольственных магазинов города определите размах вариации, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение и коэффициент вариации.
Группы магазинов по товарообороту, млн руб. |
40–50 |
50–60 |
60–70 |
70–80 |
80–90 |
Число магазинов |
2 |
4 |
7 |
10 |
15 |
Продолжение
Группы магазинов по товарообороту, млн руб. |
90–100 |
100–110 |
110–120 |
120–130 |
130–140 |
Число магазинов 20 22 11 6 3
Ответ: R = 100 тыс. руб.; d = 13,5 тыс. руб.; σ2 = 399,36; σ = 19,98 тыс. руб. V = 21,2%.
Задача 3.
Средняя урожайность зерновых культур в двух районах за 2000–2004 гг. характеризуется следующими данными, ц/га:
Годы |
2000 |
2001 |
2002 |
2003 |
2004 |
1-й район |
30 |
20 |
23 |
16 |
22 |
2-й район |
25 |
34 |
30 |
28 |
29 |
Рассчитайте коэффициент вариации. Определите, в каком районе урожайность зерновых культур более устойчива.
Ответ: урожайность более устойчива во втором районе.
Задача 4
Предприятия одной из отраслей сгруппированы по стоимости реализованной продукции и услуг за год:
Стоимость реализованной продукции и услуг, млн руб. |
Число предприятий |
Средняя стоимость реализованной продукции и услуг по группе, млн руб. |
Групповая дисперсия |
3,5–6,5 |
9 |
5,59 |
6,13 |
6,5–9,5 |
10 |
7,06 |
6,51 |
9,5 и более |
11 |
12,2 |
72,16 |
Определите: 1) среднюю из групповых дисперсий, межгрупповую дисперсию, общую дисперсию
(по правилу сложения дисперсий); 2) эмпирическое корреляционное отношение.
Ответ:
у 2 = 30,47; δ2= 8,25; σ2= 38,72; η = 0,46.
Задача 5
Определите дисперсию и среднее квадратическое отклонение, если известно, что квадрат отклонений индивидуальных значений признака от некоторой величины А равен 1285, а разность между величиной А и средней равна 18.
Ответ: σ2 = 961; σ = 31.
Задача 6
Имеем следующие данные о численности занятых по возрастным группам (по данным выборочных обследований населения по проблемам занятости) на конец ноября (в %):
Возраст занятых в экономике, лет |
Мужчины |
Женщины |
до 20 |
2,5 |
1,4 |
20–24 |
10,3 |
9,1 |
25–29 |
13,6 |
12,2 |
30–34 |
12,7 |
12,1 |
35–39 |
11,7 |
11,7 |
40–44 |
13,9 |
15,1 |
45–49 |
13,6 |
15,4 |
50–54 |
11,2 |
13,0 |
55–59 |
6,8 |
6,6 |
60–72 |
3,8 |
3,4 |
Итого |
100,0 |
100,0 |
Рассчитать по данным о распределении численности занятых по возрастным группам для мужчин и женщин:
• средний возраст занятых;
• среднее квадратическое отклонение;
• коэффициент вариации.
Сравнить полученные показатели, сделать выводы.