5-стат2015(ср_велич)
.pdfПодсчитаем среднее значений логарифмов, сложив их и разделив на число наблюдений (в данном случае 10).
Среднее log10(xi)=(l+l+2+2+2+2+4+5+5+6)/10 =30/10 =3
Возведя основание в степень среднее логарифмов в получаем среднюю геометрическую, 103 =1000.
Средняя геометрическая набора данных, приведенных выше, равна 1000.
Рассмотренные средние величины обладают
свойством мажорантности (превосходства):
17.02.2015 |
bea4ver7 |
21 |
Медиана.
Медиана является еще одним часто применяемым видом средней. Она особенно подходит для описания асимметрично распределенных данных. Медиана буквально означает середину. Медианой будет являться среднее значение набора данных, упорядоченных по возрастанию. Точнее, медиана это значение, делящее набор данных на две половины, одна из которых состоит из наблюдений больше значения медианы, а другая - из значений меньших медианы. Предположим, например, что имеется набор значений количества уголовных дел рассмотренных в суде за
пять месяцев: 110,120,122,130,180.
В этом примере два значения больше 122, а два других меньше; таким образом медиана равна 122, значению третьего наблюдения. Заметьте, что величина средней
арифметической (132) больше 4 –х из 5 значений.
17.02.2015 |
bea4ver7 |
22 |
Определение медианы набора данных
•1. Расположите наблюдения по возрастанию или по убыванию.
•2. Найдите номер среднего по порядку значения по следующей формуле:
•Номер среднего по порядку = (n+1)/2
–а. Если число наблюдений (n) нечетно, средним по порядку будет одно из наблюдений.
–б. Если n четно, среднее по порядку попадает между двумя наблюдениями.
•3. Определите значение медианы:
–а. Если средним по порядку является одно из наблюдений (то есть, если n нечетно), медиана равна значению этого наблюдения.
–б. Если среднее по порядку попадает между двумя значениями (то есть, если п четно), медиана равна среднему арифметическому этих значений.
17.02.2015 |
bea4ver7 |
23 |
В отличие от средней арифметической, медиана не так сильно подвержена воздействию крайних значений распределения. Обратите внимание, что следующие наборы данных различаются только последним наблюдением:
Набор А: 24, 25, 29, 29, 30, 31
среднее = 28,0, медиана = 29
Набор В: 24,25,29,29,30, 131
среднее 44,7, медиана= 29
Различие в одном наблюдении значительно изменяет величину средней арифметической, но совершенно не меняет значение медианы. Таким образом, использование медианы более предпочтительно, если вариационный ряд смещен в одну или в другую сторону, или если набор данных имеет несколько очень больших или очень маленьких значений.
17.02.2015 |
bea4ver7 |
24 |
Мода.
Мода - это значение, наиболее часто встречающееся в наборе данных. Например, мода следующего набора данных по количеству попаданий в мишень равна 1, так как это значение встречается 4 раза - чаще любого другого значения: 0, 0, 1, 1, 1, 1, 2, 2, 2, 3,4, 6.
Обычно моду вычисляют путем построения таблицы частотного распределения, в которую вносят частоту встречаемости каждого из значений.
Если оказывается, что каждое значение встречается один раз (или одинаковое количество раз), то у такого распределения не будет моды
Если окажется, что два значения встречаются чаще других, то у распределения будет более одной моды.
17.02.2015 |
bea4ver7 |
25 |
Покажем на примере как найти моду для следующего набора данных: 29, 31, 24, 29, 30 и 25 дней.
Расположим данные в виде частотного распределения, указав значения переменной (х,), и сколько раз эти значения встречаются (f,):
Определим значение, встречающееся чаще других: Мода = 29 дней
17.02.2015 |
bea4ver7 |
26 |
•Покажем как найти моду для следующего набора данных: 17, 9, 15, 9, 17, 13
•Расположим данные в виде таблицы частотного распределения, как это было
сделано выше
Два значения встречаются дважды, у распределения две моды, 9 и 17.
Такое распределение называют бимодальным.
17.02.2015 |
bea4ver7 |
27 |
Полуразмах.
Полуразмах |
подсчитывается |
как |
сумма |
максимального и минимального значений, деленная пополам. В случае расчета значения полуразмаха
набора данных о возрасте (единица измерения - годы жизни) к числителю добавляют единицу.
Обычно расчет величины полуразмаха проводят на начальном этапе перед проведением анализа данных. Формулы для вычисления полуразмаха значений набора данных (наблюдений):
•Полуразмах (кроме возраста) = (х1 + хn)/2
•Полуразмах (для данных о возрасте) = (x1 + хn + 1)/2
17.02.2015 |
bea4ver7 |
28 |
Выводы
Таким образом, средние величины являются обобщенной характеристикой набора наблюдаемых величин непрерывной (количественной) переменной. Наиболее распространенным видом средней является средняя арифметическая, часто называемая просто средней. Средняя арифметическая наиболее информативна, если данные распределены нормально. Она представляет собой центр тяжести набора данных. К сожалению, средняя арифметическая довольно чувствительна к влиянию экстремальных значений переменной и ее значение смещается в сторону экстремальных значений. Другой вид средней - медиана - не чувствительна к влиянию экстремальных значений.
17.02.2015 |
bea4ver7 |
29 |
Выводы
Медиана - это середина набора данных, половина из которых лежит ниже (или левее) медианы, а другая половина выше (или правее). В случае, когда набор данных асимметричен или есть несколько экстремальных значений с одной стороны, применение медианы будет более предпочтительно.
Мода это просто наиболее часто встречающееся значение. В то время как любой набор данных всегда обладает одним средним арифметическим и одной медианой, у набора данных может быть одна мода, ни одной моды или несколько мод. Мода полезна в том случае, когда нужно узнать какие значения наиболее, так сказать, популярны. Средняя геометрическая должна применяться в тех случаях, когда данные подчиняются законам экспоненциального или логарифмического распределения.
17.02.2015 |
bea4ver7 |
30 |