Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПрактРабота1.doc
Скачиваний:
92
Добавлен:
11.02.2015
Размер:
152.06 Кб
Скачать

Практическая работа №1

Лабораторная работа посвящена основам анализа данных, рассмотрены основные характеристики описательной статистики, кратко изложена суть корреляционного и регрессионного анализа. Приведены примеры решения задач в Microsoft Excel.

В этой работе мы рассмотрим некоторые аспекты статистического анализа данных, в частности, описательную статистику, корреляционный и регрессионный анализы.

Цель данной работы - дать самое общее представление о понятиях корреляции, регрессии, а также познакомиться с описательной статистикой. Рассматриваемые примеры намеренно упрощены.

Существует большое разнообразие прикладных пакетов, реализующих широкий спектр статистических методов, их также называют универсальными пакетами или инструментальными наборами. В Microsoft Excel также реализован широкий арсенал методов математической статистики, реализация примеров продемонстрирована именно на этом программном обеспечении.

Следует заметить, что существует сложность использования статистических методов, так же как и статистического программного обеспечения, - для этого пользователю необходимы специальные знания.

Анализ данных в Microsoft Excel

Microsoft Excel имеет большое число статистических функций. Некоторые являются встроенными, некоторые доступны после установки пакета анализа.

Обращение к Пакету анализа. Средства, включенные впакет анализаданных, доступны через командуАнализ данныхменюСервис. Если эта команда отсутствует в меню, в менюСервис/Надстройкинеобходимо активировать пункт"Пакет анализа".

Далее мы рассмотрим некоторые инструменты, включенные в Пакет анализа.

Описательная статистика

Описательная статистика(Descriptive statistics ) - техника сбора и суммирования количественных данных, которая используется для превращения массы цифровых данных в форму, удобную для восприятия и обсуждения.

Цель описательной статистики- обобщить первичные результаты, полученные в результате наблюдений и экспериментов.

Пусть дан набор данных А, представленный в таблице 8.1.

Таблица 8.1. Набор данных А

x

y

3

9

2

7

4

12

5

15

6

17

7

19

8

21

9

23,4

10

25,6

11

27,8

Выбрав в меню Сервис"Пакет анализа"и выбрав инструмент анализа"Описательная статистика", получаем одномерный статистический отчет, содержащий информацию оцентральной тенденциии изменчивости или вариации входных данных.

В состав описательной статистикивходят такие характеристики:среднее; стандартная ошибка;медиана; мода;стандартное отклонение;дисперсиявыборки;эксцесс; асимметричность; интервал;минимум; максимум; сумма; счет.

Отчет "Описательная статистика" для двух переменных из набора данных А приведен в таблице 8.2.

Таблица 8.2. Описательная статистика для набора данных А

x

y

Среднее

6,5

17,68

Стандартная ошибка

0,957427108

2,210922382

Медиана

6,5

18

Стандартное отклонение

3,027650354

6,991550456

Дисперсия выборки

9,166666667

48,88177778

Эксцесс

-1,2

-1,106006058

Асимметричность

0

-0,128299221

Интервал

9

20,8

Минимум

2

7

Максимум

11

27,8

Сумма

65

176,8

Счет

10

10

Наибольший (1)

11

27,8

Наименьший (1)

2

7

Уровень надежности (95,0%)

2,16585224

5,001457714

Рассмотрим, что же представляют собой характеристики описательной статистики.

Центральная тенденция

Измерение центральной тенденциизаключается в выборе числа, которое наилучшим способом описывает все значения признака набора данных. Такое число имеет как свои достоинства, так и недостатки. Мы рассмотрим две характеристики этого измерения, а именно:среднее значениеимедиану.

Главная цель среднего- представление набора данных для последующего анализа, сопоставления и сравнения.

Значение среднеголегко вычисляется и может быть использовано для последующего анализа. Оно может быть вычислено для данных, измеряемых по интервальной шкале, и для некоторых данных, измеряемых по порядковой шкале.Среднее значениерассчитывается как среднее арифметическое набора данных: сумма всех значений выборки, деленная на объем выборки. "Сжимая" данные таким образом, мы теряем много информации.

Среднее значениеочень информативно и позволяет делать вывод относительно всего исследуемого набора данных. При помощисреднегомы получаем возможность сравнивать несколько наборов данных или их частей.

При анализе данных средним не следует злоупотреблять, необходимо учитывать его свойства и ограничения. Известны характеристики "средняя температура по больнице" или "средняя высота дома", показывающие некорректность использования этой меры центральной тенденциидля некоторых случаев.