Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
экзамен по исследованиям.doc
Скачиваний:
16
Добавлен:
10.09.2019
Размер:
738.3 Кб
Скачать

39. Метод доверительных интервалов для генеральной доли.

Определение объема выборки: доля

При изучении альтернативного признака (доли р) объем необходимой численности выборки определяется по следующей формуле:

На стадии проектировки выборочного наблюдения, если невозможно хотя бы приблизительно определить дисперсию альтернативного признака [w(1 - w)], она

принимается равной своему максимуму (0,25).

40.Базовые методы статистического анализа данных. Предварительная обработка данных. Одномерный и многомерный статистический анализ.

41. Вариационный ряд. Частки. Достоверные частки. Накопленные частки.

42. Показатели центра распределения. Среднее. Мода. Медиана. (Статистики, связанные с распределением частот)

Показатели центра распределения Показатели центра распределения (measures of location) характеризуют положение центра распределения, вокруг которого концентрируются данные. Если всю выборку изменить, добавив определенную фиксированную величину к каждому наблюдению, то среднее, мода и медиана изменятся на аналогичную величину.

Среднее арифметическое или выборочное среднее (mean) — это наиболее часто используемый показатель, характеризующий положение центра распределения. Он применяется для оценки среднего значения в случае, если данные собраны с использованием интервальной или относительной шкалы. Его величина должна отражать некоторое среднее значение, вокруг которого распределена большая часть ответов. Эта величина получается делением суммы всех имеющихся значений переменной на количество значений.

Мода (mode) Значение переменной, которое чаще всего встречается в выборочном распределении.

Медиана (median) выборки — это значение переменной в середине ряда данных, расположенных в порядке возрастания или убывания. Положение медианы определяется ее номером. Если количество данных четное, то медиана равна полусумме двух серединных значений. Медиана — это 50-й процентиль. Она характеризует положение центра распределения порядковых данных. Значение переменной, которое приходится на середину распределения частот, т.е. одна половина всех значений больше медианы, а другая — меньше.

Если переменную измеряют по номинальной шкале, то лучше использовать моду. Если переменную измеряют по порядковой шкале, то больше подходит медиана. Если же переменную измеряют по интервальной или относительной шкале, то мода плохо отражает положение центра распределения. Медиана лучше подходит в качестве показателя, характеризующего положение центра распределения, для интервальной или относительной шкалы, хотя и она не учитывает всю информацию о значениях переменной.

Самый лучший показатель для интервальной или относительной шкалы — среднее арифметическое. Он учитывает всю доступную информацию, поскольку для его вычисления используются все значения. Однако среднее арифметическое чувствительно к выбросам значений (экстремально малым или экстремально большим). Если данные содержат выбросы, то среднее не будет хорошим показателем центра распределения и лучше использовать два показателя — среднее и медиану.