Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5-стат2015(ср_велич)

.pdf
Скачиваний:
8
Добавлен:
02.03.2016
Размер:
1.74 Mб
Скачать

Подсчитаем среднее значений логарифмов, сложив их и разделив на число наблюдений (в данном случае 10).

Среднее log10(xi)=(l+l+2+2+2+2+4+5+5+6)/10 =30/10 =3

Возведя основание в степень среднее логарифмов в получаем среднюю геометрическую, 103 =1000.

Средняя геометрическая набора данных, приведенных выше, равна 1000.

Рассмотренные средние величины обладают

свойством мажорантности (превосходства):

17.02.2015

bea4ver7

21

Медиана.

Медиана является еще одним часто применяемым видом средней. Она особенно подходит для описания асимметрично распределенных данных. Медиана буквально означает середину. Медианой будет являться среднее значение набора данных, упорядоченных по возрастанию. Точнее, медиана это значение, делящее набор данных на две половины, одна из которых состоит из наблюдений больше значения медианы, а другая - из значений меньших медианы. Предположим, например, что имеется набор значений количества уголовных дел рассмотренных в суде за

пять месяцев: 110,120,122,130,180.

В этом примере два значения больше 122, а два других меньше; таким образом медиана равна 122, значению третьего наблюдения. Заметьте, что величина средней

арифметической (132) больше 4 –х из 5 значений.

17.02.2015

bea4ver7

22

Определение медианы набора данных

1. Расположите наблюдения по возрастанию или по убыванию.

2. Найдите номер среднего по порядку значения по следующей формуле:

Номер среднего по порядку = (n+1)/2

а. Если число наблюдений (n) нечетно, средним по порядку будет одно из наблюдений.

б. Если n четно, среднее по порядку попадает между двумя наблюдениями.

3. Определите значение медианы:

а. Если средним по порядку является одно из наблюдений (то есть, если n нечетно), медиана равна значению этого наблюдения.

б. Если среднее по порядку попадает между двумя значениями (то есть, если п четно), медиана равна среднему арифметическому этих значений.

17.02.2015

bea4ver7

23

В отличие от средней арифметической, медиана не так сильно подвержена воздействию крайних значений распределения. Обратите внимание, что следующие наборы данных различаются только последним наблюдением:

Набор А: 24, 25, 29, 29, 30, 31

среднее = 28,0, медиана = 29

Набор В: 24,25,29,29,30, 131

среднее 44,7, медиана= 29

Различие в одном наблюдении значительно изменяет величину средней арифметической, но совершенно не меняет значение медианы. Таким образом, использование медианы более предпочтительно, если вариационный ряд смещен в одну или в другую сторону, или если набор данных имеет несколько очень больших или очень маленьких значений.

17.02.2015

bea4ver7

24

Мода.

Мода - это значение, наиболее часто встречающееся в наборе данных. Например, мода следующего набора данных по количеству попаданий в мишень равна 1, так как это значение встречается 4 раза - чаще любого другого значения: 0, 0, 1, 1, 1, 1, 2, 2, 2, 3,4, 6.

Обычно моду вычисляют путем построения таблицы частотного распределения, в которую вносят частоту встречаемости каждого из значений.

Если оказывается, что каждое значение встречается один раз (или одинаковое количество раз), то у такого распределения не будет моды

Если окажется, что два значения встречаются чаще других, то у распределения будет более одной моды.

17.02.2015

bea4ver7

25

Покажем на примере как найти моду для следующего набора данных: 29, 31, 24, 29, 30 и 25 дней.

Расположим данные в виде частотного распределения, указав значения переменной (х,), и сколько раз эти значения встречаются (f,):

Определим значение, встречающееся чаще других: Мода = 29 дней

17.02.2015

bea4ver7

26

Покажем как найти моду для следующего набора данных: 17, 9, 15, 9, 17, 13

Расположим данные в виде таблицы частотного распределения, как это было

сделано выше

Два значения встречаются дважды, у распределения две моды, 9 и 17.

Такое распределение называют бимодальным.

17.02.2015

bea4ver7

27

Полуразмах.

Полуразмах

подсчитывается

как

сумма

максимального и минимального значений, деленная пополам. В случае расчета значения полуразмаха

набора данных о возрасте (единица измерения - годы жизни) к числителю добавляют единицу.

Обычно расчет величины полуразмаха проводят на начальном этапе перед проведением анализа данных. Формулы для вычисления полуразмаха значений набора данных (наблюдений):

Полуразмах (кроме возраста) = (х1 + хn)/2

Полуразмах (для данных о возрасте) = (x1 + хn + 1)/2

17.02.2015

bea4ver7

28

Выводы

Таким образом, средние величины являются обобщенной характеристикой набора наблюдаемых величин непрерывной (количественной) переменной. Наиболее распространенным видом средней является средняя арифметическая, часто называемая просто средней. Средняя арифметическая наиболее информативна, если данные распределены нормально. Она представляет собой центр тяжести набора данных. К сожалению, средняя арифметическая довольно чувствительна к влиянию экстремальных значений переменной и ее значение смещается в сторону экстремальных значений. Другой вид средней - медиана - не чувствительна к влиянию экстремальных значений.

17.02.2015

bea4ver7

29

Выводы

Медиана - это середина набора данных, половина из которых лежит ниже (или левее) медианы, а другая половина выше (или правее). В случае, когда набор данных асимметричен или есть несколько экстремальных значений с одной стороны, применение медианы будет более предпочтительно.

Мода это просто наиболее часто встречающееся значение. В то время как любой набор данных всегда обладает одним средним арифметическим и одной медианой, у набора данных может быть одна мода, ни одной моды или несколько мод. Мода полезна в том случае, когда нужно узнать какие значения наиболее, так сказать, популярны. Средняя геометрическая должна применяться в тех случаях, когда данные подчиняются законам экспоненциального или логарифмического распределения.

17.02.2015

bea4ver7

30