Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Задание 3 по статистике в Excel.doc
Скачиваний:
8
Добавлен:
20.09.2019
Размер:
69.12 Кб
Скачать

Математическая статистика в ms Excel. Часть 3.

Дисперсия.

Создайте книгу в ms Excel. Сохраните под названием матстат_3. Выполните все задания.

Часто приходится обрабатывать данные наблюдений. А наблюдать можно что угодно. Например, каждый день вы ходите в университет и обратно. Сколько шагов вы делаете, преодолевая это расстояние? Если в течение нескольких дней вы из любопытства проведете подсчеты, то наверняка у вас получатся близкие друг другу, но все же разные числа. Никому, конечно, и в голову не придет, что меняется расстояние между университетом и домом. Ясно, что на количество шагов влияют различные внешние факторы. Скажем, в университет вы шли быстро, чтобы не опоздать, и ваш шаг был шире, а по дороге домой вы шли не спеша, ваш шаг был короче.

Проведя 20 наблюдений, вы получите 20 значений случайной величины.

Пусть некий студент Иванов получил следующую последовательность чисел:

372, 376, 374, 375, 373, 364, 380, 374, 377, 375, 376, 373, 375, 374, 373, 371, 375, 373, 374, 376.

Их удобнее расположить в виде линейной таблицы. Какое же количество шагов естественно взять в качестве расстояния от университета до дома? Каждому ясно – среднее арифметическое. Для его вычисления мы можем применить только что полученные знания.

Выясним, какие значения получил Иванов. Пусть это набор чисел от А до В. У другого студента, естественно будет другой набор, но тоже в каком-то промежутке. Возьмем данные четырех студентов и занесем их в таблицу. Это будет двумерный массив размерностью 4*20 (пусть будет 20 измерений). Распечатаем эту таблицу и найдем среднее арифметическое для каждой строки.

Среднее арифметическое уберегает нас от ошибочных выводов. Но как же достаточно точно определить расстояние, проведя то или иное количество наблюдений?

Математики для этой цели ввели специальную величину и назвали ее дисперсией (то есть разброс данных). Обозначим значения случайной величины А1, А2, А3,…., Аn, а среднее арифметическое этих значений - буквой М.

Дисперсия – среднее арифметическое квадратов разностей между значениями случайной величины и ее средним значением. в наших обозначениях:

Из этой формулы видно, что чем меньше дисперсия, тем меньше отличаются результаты наблюдения от своего среднего значения и тем ближе среднее значение к истинному. В частности, если дисперсия равна нулю, то все числа Аi совпадают между собой и своим средним значением.

Вернемся к наблюдениям Иванова:

372, 376, 374, 375, 373, 364, 380, 374, 377, 375, 376, 373, 375, 374, 373, 371, 375, 373, 374, 376.

Среднее значение (374) числа шагов от дома до университета характеризует не только расстояние, но и длину человеческого шага: у разных людей и ширина шага разная. Куда больше можно узнать о человеке, его характере, темпераменте и некоторых наклонностях, зная всю последовательность наблюдений.

Например, рассматривая приведенную выше последовательность, можно предположить, что значение 364 получилось в тот день, когда Иванов опаздывал в университет. Вообще же характер у него довольно ровный, темперамент скорее флегматичный – лишь один раз он шел заметно медленнее, чем обычно, сделав 380 шагов. Подумайте, что еще можно сказать об Иванове.

Допустим, что Иванов сагитировал несколько своих товарищей провести тот же эксперимент. Через 10 дней каждый из них, в том числе и Иванов, представили по 20 результатов наблюдений, не указав своих фамилий.

Можно ли узнать, какие из результатов принадлежат Иванову, а какие нет? Да, можно.

Математики установили, что для этого достаточно сравнить дисперсии и средние значения.