Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
pr1-2.doc
Скачиваний:
33
Добавлен:
30.05.2015
Размер:
268.29 Кб
Скачать

Практическая работа № 1-2 Вычисления выборочных характеристик данных

Цель работы: научиться использовать специальные функции и инструменты Пакета анализа Microsoft Excel для расчета выборочных характеристик данных.

Задание. Прочитайте теоретические сведения, выполните примеры и задания для самостоятельного решения.

Математическая статистика подразделяется на две основные области: описательную и аналитическую статистику. Описательная статистика охватывает методы описания статистических данных, представления их в форме таблиц, распределений.

Аналитическая статистика или теория статистических выводов ориентирована на обработку данных, полученных в ходе эксперимента, с целью формулировки вы­водов, имеющих прикладное значение для самых различных областей человече­ской деятельности.

1.1 Характеристика пакета Excel

Пакет Excel оснащен средствами статистической обработки данных. И хотя Excel существенно уступает специализированным статистическим пакетам обработки данных, тем не менее этот раздел математики представлен в Excel наиболее полно. В него включены основные, наиболее часто используемые статистические проце­дуры: средства описательной статистики, критерии различия, корреляционные и другие методы, позволяющие проводить необходимый статистический анализ эко­номических, психологических, педагогических и медико-биологических типов данных.

При рассмотрении применения методов обработки статистических данных в данной практической работе огра­ничимся только простейшими и наиболее часто описательными статистиками, реали­зованными в мастере функций Excel.

1.2 Использование специальных функций

В мастере функций Excel имеется ряд специальных функций, предназначенных для вычисления выборочных характеристик.

Функция СРЗНАЧ(число1; число2; ...) вычисляет среднее арифметическое из нескольких аргументов (массивов) чисел.

Функция МЕДИАНА(число1;число2;...) позволяет получать медиану заданной выборки. Медиана — это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана.

Пример. Найти медиану для ряда с нечетным и четным числом элементов.

В первом случае медиана вычисляется по формуле =МЕДИАНА(b4:b8) и является серединным значением упорядоченного ряда. Во втором случае медиана вычисляется по формуле =МЕДИАНА(b4:b7) и является средним арифметическим двух срединных значений.

Функция МОДА(число1;число2; ...) возвращает наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных. Как и функция МЕДИАНА, функция МОДА является мерой взаимного расположения значений.

Пример. Определить костюмы какого размера пользуются наибольшим спросом

В данном примере не используется функция МОДА, т.к. таблица представлена двумя рядами данных. Чтобы определить модальное значение, определяется наибольшее количество купленных костюмов =МАКС(C4:C8), а затем данное значение индексируется с размером костюма =ИНДЕКС(B4:B8;ПОИСКПОЗ(C9;C4:C8)).

Функция ДИСП(число1; число2; ...) позволяет оценить дисперсию по выборочным данным. Дисперсия (от лат. dispersion – рассеяние) – числовая характеристика случайной величины, характеризующая рассеяние ее возможных значений около математического ожидания.

Функция СТАНДОТКЛОН(число1; число2; ...) вычисляет стандартное отклонение. Стандартное отклонение — это мера того, насколько широко разбросаны точки данных относительно их среднего.

Функция ЭКСЦЕСС(число1;число2; ...) вычисляет оценку эксцесса по выборочным данным. Эксцесс (Ek) характеризует так называемую «крутость», т.е. островершинность или плосковершинность распределения. Если Ek >0, распределение островершинное, если Ek <0 – плосковершинное.

Пример. Определить эксцесс данного ряда.

Ячейка С11 содержит формулу =ЭКСЦЕСС(C2:C10). Так как результат положительный, можно говорить что распределение островершинное. Для проверки построено распределение данной СВ.

Функция СКОС позволяет оценить асимметрию выборочного распределения. Всякое искажение формы кривой означает нарушение или изменение нормальных условий возникновения статистического материала. Для симметричного распределения среднее арифметическое (), мода(Mo) и медиана(Me) равны между собой. Чем больше разница между этими показателями тем больше асимметрия ряда. Асимметричность (коэффициент асимметрии или скоса) характеризует смещение распределения относительно математического ожидания. Если коэффициент асимметрии As>0 - асимметрия правосторонняя, т.е. распределение скошено вправо, т.е. его более длинная часть лежит правее центра (математического ожидания), если As<0 – левосторонняя.

Пример. Определить коэффициент асимметрии.

В ячейке С11 введена формула =СКОС(C2:C10). Результат говорит о правосторонней асимметрии.

Функция КВАРТИЛЬ возвращает квартиль множества данных. Квартили представляют собой значение признака, делящие ранжированную совокупность на четыре равновеликие части. Различают нижний квартиль (Q1), отделяющий ¼ часть совокупности с наименьшими значениями признака, и квартиль верхний (Q3), отделяющий ¼ часть совокупности с наибольшими значениями признака. Средним квартилем (Q2) является медиана.

Нижний квартиль Q1 – это значение, ниже которого в упорядоченном множестве данных находится четверть данных, а верхний квартиль Q3 – это значение, выше которого в упорядоченном множестве данных находится четверть значений.

Функция имеет формат КВАРТИЛЬ(массив, значение), где массив – интервал ячеек, содержащих значения случайных величин; значение определяет какая квартиль должна быть найдена (0 – минимальное значение, 1 – нижний квартиль (25-ую перцентиль), 2 – медиана (50-ую перцентиль), 3 – верхний квартиль (75-ую перцентиль), 4 – максимальное значение распределения). Перцентиль делит ранжированную совокупность на сто равных частей.

Пример. Найти значения квартиля при разных значениях.

В расчетах используются следующие формулы: =КВАРТИЛЬ($C$2:$C$10;0)

=КВАРТИЛЬ($C$2:$C$10;1)

=КВАРТИЛЬ($C$2:$C$10;2)

=КВАРТИЛЬ($C$2:$C$10;3)

=КВАРТИЛЬ($C$2:$C$10;4)

Пример. Провести статистический анализ методом описательной статистики доходов населения в регионе 1 и регионе 2.

п/п

Регион 1

Регион 2

1

2

50

2

4

52

3

5

48

4

45

50

5

5

48

6

56

51

7

4

49

8

24

52

9

5

49

10

350

51

500

500

сумма

50

50

среднее

11483,11

2,22

дисперсия

107,16

1,49

станд. отклонение

4,25

49

нижний квартиль

39,75

51

верхний квартиль

5

50

медиана

5

50

мода

9

-1,33

эксцесс

2,98

0

скос(асимметрия)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]