- •Основные элементы матстатистики
- •§32. Вариационный и статистический ряд
- •§33. Выборочные характеристики вариационного ряда
- •§34. Доверительный интервал
- •§35. Выборочный коэффициент корреляции
- •§36. Ранговая корреляция
- •§37. Статистические гипотезы
- •§38. Критерии Пирсона и Стьюдента
- •Алгоритм применения -критерия Стьюдента для сравнения оценки средних величин двух выборок
- •§19. Нормальный закон распределения
Основные элементы матстатистики
Термин статистика происходит от латинского слова "status" - состояние. В настоящее время статистика включает в себя следующие три раздела:
• сбор статистических сведений каких-либо массовых совокупностей;
• статистическое исследование полученных данных, выяснение закономерностей, которые могут быть установлены на основе данных массового наблюдения;
• разработка приемов статистического наблюдения и анализа статистических данных.
Последний раздел и составляет содержание математической статистики.
Совокупность значений какого-то признака объекта называется генеральной совокупностью, а основной задачей математической статистики является выяснение вероятностных свойств генеральной совокупности (распределение, числовые характеристики и т.д.). Полное исследование генеральной совокупности практически невозможно, поэтому обычно рассматривают только некоторые ее объекты, т.е. делают выборку, с помощью которой по вероятностным свойствам оценивают генеральную совокупность.
§32. Вариационный и статистический ряд
В математической статистике исследуются утверждения, которые могут быть сделаны на основе измерения некоторой величины, на простейшем примере поясним постановку (одной из многих) задач математической статистики.
Пусть требуется измерить некоторую величину . Результаты измерений
естественно рассматривать как значения случайных величин , полученных в данном эксперименте. Если измерительный инструмент не имеет систематической ошибки, то можно положить . Следовательно, возникает задача оценить параметр . Для решения задачи рассмотрим случайную величину
Тогда
Это обстоятельство приводит к мысли построить статистические характеристики:
Первая представляет среднее арифметическое наблюденных значений случайной величины и статистическую дисперсию - во втором случае. В соответствии с законом больших чисел эти среднеарифметические сходятся по вероятности соответственно к математическому ожиданию величины и к дисперсии
При ограниченности наблюдений эксперимента заменой и на и совершаем погрешность, а при небольшом числе наблюдений величины , являются случайными величинами. Возникает задача об оценке неизвестных параметров , случайной величины на основе экспериментальных данных, т.е. задача - найти подходящие значения этих параметров.
Множество результатов измерений величины называется выборкой объема . Для того, чтобы иметь возможность воспользоваться аппаратом теории вероятностей, целесообразно наблюдаемую величину рассматривать как случайную величину, функцию распределения которой
следует определить.
Полученный статистический материал , , ... наблюдений представляет собой первичные данные о величине, подлежащей статистической обработке. Обычно такие статистические данные оформляются в виде таблицы, графика, гистограммы и т.д.
Если выборка объема содержит различных элементов , причем встречается раз, то число называется частотой элемента , а отношение называется относительной частотой элемента . Очевидно, что
Вариационным (статистическим) рядом называется таблица, первая строка которой содержит в порядке возрастания элементы ', а вторая - их частоты (относительные частоты .
Полигоном частот (относительных частот) выборки называется ломаная с вершинами в точках ( , )( ( , )).
Функция , где - объем выборки, а - число значений в выборке, меньших , называется эмпирической функцией распределения. Функция служит оценкой неизвестной функции распределения , т.е. при n → ∞.
Пусть теперь - непрерывная случайная величина с неизвестной плотностью вероятности . Для оценки по выборке разобьем область значений на интервалы длины . Обозначим через середины интервалов, а через число элементов выборки, попавших в указанный интервал. Тогда - оценка плотности вероятности в точке . В прямоугольной системе координат построим прямоугольники с основаниями и высотами , т.е. площади прямоугольника, равной относительной частоте данного разряда. Полученная таким образом фигура называется гистограммой выборки.