- •Исследование и оптимизация свойств строительных материалов с применением элементов математической статистики
- •Оглавление
- •Введение
- •1. Основные понятия и теоремы теории вероятностей, используемые в математической статистике
- •1.1. События. Свойства
- •1.2. Теорема сложения вероятностей несовместных событий
- •1.3. Теорема умножения вероятностей
- •Вопросы для самоконтроля
- •2. Основные понятия и методы математической
- •Вопросы для самоконтроля
- •3. Параметры математической статистики
- •Вопросы для самоконтроля
- •4. Распределение случайных величин
- •4.1. Нормальное распределение
- •Часто наблюдаются кривые с вершинами, сдвинутыми вправо (рис. 4.9, а) или влево (рис. 4.9, б). В первом случае они имеют отрицательную асимметрию, а во втором – положительную.
- •4.2. Основные виды теоретических распределений
- •4.3. Критерий близости распределения к нормальному
- •4.4. Закон распределения при малом числе испытаний
- •Например, при и становится равным 2,45, т. Е.
- •4.5. Обработка результатов измерений
- •4.6. Расчет числовых характеристик распределения и установка доверительных интервалов
- •Вопросы для самоконтроля
- •5. Основные методы математической статистики
- •5.1. Дисперсионный анализ
- •В отдельных вариантах относительно общей средней для всей совокупности.
- •5.2. Корреляционный анализ. Метод наименьших квадратов
- •6. Оптимизация исследований технических свойств материалов
- •Теперь определим -отношение
- •Заключение
- •2. Общие статистические термины
- •3. Общие термины, относящиеся к наблюдениям
- •4. Общие термины, относящиеся к выборочным методам
- •Общие требования и методические рекомендации
- •Библиографический список
- •Исследование и оптимизация свойств
Вопросы для самоконтроля
1. Назовите степенные средние.
2. Назовите структурные средние.
3. Как определить среднее арифметическое?
4. Что называется степенью свободы?
5. Как вычислить дисперсию и среднее квадратическое?
6. Как определить ошибку среднего арифметического?
7. Назовите основные параметры математической статистики?
8. Как определить необходимое число наблюдений?
Рекомендуемая литература [1, 4, 10, 11, 22].
4. Распределение случайных величин
4.1. Нормальное распределение
Пусть из генеральной совокупности извлечена выборка, причем х1 наблюдалась n1 раз, х2 – n2, х3 – n3 раз, а ni = n – объем выборки. Наблюдаемые значения хi – варианты, а последовательное написание их в возрастающем порядке – вариационный ряд. Числа наблюдений ni называются частотами, а их отношение к объёму выборки – относительными частотами.
Перечень вариант и соответствующих им частот, или относительных частот называется статистическим распределением выборки или законом распределения случайной величины. Собственно законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями.
Простейшей формой задания этого закона является таблица, в которой перечислены значения случайной величины и соответствующие им частоты, относительные частоты или вероятности. Такую таблицу называют рядом распределения (табл. 4.1).
Таблица 4.1
Ряд распределения
хi |
х1 |
х2 |
х3 |
………. |
хn |
pi |
p1 |
p1 |
p1 |
………. |
pn |
Для наглядности строят различные графики распределения. В случае геометрического представления ряда распределения дискретных случайных величин получаем многоугольник распределения (рис. 4.1) или полигон частот.
х1 х2 х3 х4 х5 х6
Рис. 4.1. Многоугольник распределения
Для его построения на оси абсцисс откладывают варианты хi, а на оси ординат – соответствующие им относительные частоты wi, Точки (хi, wi,) соединяют отрезками прямых и получают полигон частот. Многоугольники распределения могут быть различными по форме, что еще раз подчеркивает случайность явления (рис. 4.2).
а
б
Рис. 4.2. Многоугольник дискретного распределения (а); кривая непрерывного распределения (б)
Если многоугольник распределения (кривая распределения) имеет более одного максимума, распределение называется «полимодальным». Иногда встречаются распределения, обладающие посередине не максимумом, а минимумом. Такие распределения называют «антимодальными» (рис. 4.3).
Рис. 4.3. Антимодальное распределение (а и б см. пояснения к рис. 4.2)
Два последних термина см. в разд. 3, где кроме важнейших из характеристик положения – математического ожидания, упоминались и другие, в частности мода (рис. 4.4) и медиана (рис. 4.5).
Рис. 4.4. Мода случайной величины Рис. 4.5. Медиана распределения
Модой случайной величины называется ее наиболее вероятное значение. В общем случае мода и математическое ожидание случайной величины не совпадают. В частном случае, когда распределение является симметричным и модальным (т. е. имеет моду) и существует математическое ожидание, то оно совпадает с модой и центром симметрии распределения.
Часто применяемой еще одной характеристикой положения – медианой (рис. 4.5), пользуются обычно только для непрерывных случайных величин, хотя формально ее можно определить и для дискретной величины.
Медианой случайной величины х называется такое число Me, для которого
Р(Х < Ме) = Р(Х > Ме),
т. е. одинаково вероятно, окажется ли случайная величина меньше или больше Me. Геометрическая медиана – это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам.
В случае симметричного модального распределения медиана совпадает с математическим ожиданием и модой.
Распределение случайных величин является математической моделью вероятностного процесса, отличающегося тем, что элементарные исходы могут проявляться в самой разнообразной форме по численному значению и частоте.
Математической модели может быть подобрана физическая модель, а для нее в свою очередь – математическая модель распределения.
Итак, ряд распределения является законом распределения для дискретной (непрерывной) случайной величины. Простейшим примером дискретного распределения является ситуация с п равновероятностными исходами. Физической моделью такого распределения являются исходы бросания монеты, кубика и т. д.
Но для непрерывной величины ряда не существует. В то же время различные области возможных значений случайной непрерывной величины не являются одинаково вероятными, поэтому и для непрерывной величины существует также распределение вероятностей.
В случае непрерывного признака для геометрического представления целесообразно строить гистограмму (рис. 4.6).
Рис. 4.6. Гистограмма частот
Для этого весь интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частных интервалов длиной х, находят для каждого частного интервала пi – сумму частот вариант, попавших в i-й интервал. Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частные интервалы длиной х, а высоты равны (плотность частоты). Площадь такого прямоугольника равна , а сумма площадей всех прямоугольников (площадь гистограммы) .В случае использования относительных частот или вероятностей площадь гистограммы будет равна единице.
Вероятность непрерывного события х есть функция от х. Эта функция называется функцией распределения случайной величины х и обозначается F(x). Функцию распределения называют также интегральной функцией распределения или интегральным законом распределения величин
. (4.1)
Функция распределения непрерывной случайной величины F(х), определяющая вероятность того, что случайная величина х принимает какое-нибудь значение в пределах интервала а, b, определится как
.
Интегральная кривая этой функции (рис. 4.7) монотонно возрастает от нуля (при х = – ) до единицы (при х = ). Обратная функция дает значение х, соответствующее заданной вероятности непревышения Р(х). Эти значения называют квантилями вероятности Р(х).
Рис. 4.7. Интегральная функция распределения
Функция является производной функции распределения F(х) и характеризует плотность, с которой распределяются значения случайной величины. Эта функция называется плотностью распределения или плотностью вероятности. Иногда её называют функцией распределения, или дифференциальным законом распределения случайной величины.
Плотность распределения является пределом отношения вероятности события, состоящего в том, что непрерывная случайная величина принимает значения, лежащие в заданном малом интервале, к длине интервала, когда эта длина стремится к нулю.
Кривую, изображающую плотность распределения случайной величины на графике дифференциальной функции распределения (рис. 4.8), называют кривой распределения. Кривые распределения могут иметь чрезвычайно разнообразную форму.
Рис. 4.8. Плотность распределения