- •Лекция № 1 Основные понятия теории вероятностей. Классическое определение вероятности. Элементы комбинаторики.
- •1. Основные понятия теории вероятностей.
- •2. Классическое определение вероятности.
- •3. Элементы комбинаторики.
- •Лекция № 2 Алгебра событий. Аксиомы тв. Основные теоремы теории вероятностей. Модели надежности технических систем
- •1. Алгебра событий.
- •3. Основные теоремы теории вероятностей
- •Определение 4.
- •4. Модели надежности технических систем
- •Лекция № 3 Формула полной вероятности. Формула Бейеса.
- •1. Формула полной вероятности.
- •2. Формула Байеса.
- •1. Повторение опытов (схема Бернулли).
- •2. Формула Бернулли
- •3. Локальная теорема Лапласа
- •4. Интегральная теорема Лапласа
- •5. Наивероятнейшее число наступления событий.
- •Лекция № 5 Случайные величины.
- •1. Дискретные случайные величины.
- •Формы задания закона распределения дискретной случайной величины
- •2.1. Ряд распределения.
- •2.2. Многоугольник распределения.
- •2.3. Интегральная функция распределения.
- •2. Многоугольник распределения
- •3. Интегральная функция распределения
- •3. Вероятность попадания случайной величины на заданный участок
- •Лекция № 6 Числовые характеристики случайных величин.
- •1. Характеристики положения случайной величины на числовой оси.
- •Математическое ожидание не случайное число, которое в зависимости от типа случайной величины определяется по формуле:
- •На рис.6.2 показана мода непрерывной унимодальной (с одной модой) случайной величины, заданной плотностью распределения.
- •2. Моменты случайных величин. Для характеристики различных свойств случайных величин используются начальные и центральные моменты.
- •3. Свойства моментов случайных величин. Особого внимания заслуживают свойства начальных и центральных моментов первого и второго порядков.
- •Первый центральный момент μ1 любой случайной величины равен нулю.
- •Математическое ожидание.
- •Дисперсия.
- •Среднее квадратичное отклонение.
- •1.2. Закон распределения Пуассона Закон распределения Пуассона связан с редкими событиями, составляющими простейший поток событий.
- •1. Математическое ожидание.
- •2. Дисперсия.
- •3. Среднее квадратичное отклонение.
- •4. Вероятность попадания пуассоновской случайной величины на заданный участок.
- •2. Законы распределения непрерывных случайных величин.
- •2.1. Равномерный закон распределения
- •Если участок [α,β] не входит в диапазон [a,b], то выражение (7.17) не является справедливым. В этом случае необходимо руководствоваться выражением если (7.18)
- •2.2. Показательный закон распределения
- •2.3. Нормальный закон распределения
- •1. Математическое ожидание.
- •2. Дисперсия.
- •3. Среднее квадратичное отклонение.
- •Поскольку 2-й центральный момент
- •4. Вероятность попадания случайной величины на заданный участок
- •Поскольку то (7.31) перепишется как
- •3. Правило трех сигм
- •Лекция № 8 Основные задачи математической статистики. Определение законов распределения случайных величин на основе экспериментальных данных.
- •Предмет и задачи математической статистики.
- •Основные понятия.
- •3. Простейшие приемы обработки результатов наблюдений.
- •3.1 Статистическое распределение выборки.
- •Гистограмма.
- •Эмпирическая функция распределения
- •Лекция №2. Выравнивание статистических рядов. Проверка статистических гипотез.
- •Лекция №3. Оценка параметров случайных величин.
Лекция №3. Оценка параметров случайных величин.
Оценка как функция случайных величин – результатов наблюдений.
Рассмотрим вопрос об определении числовых характеристик случайной величины Х по результатм n независимых опытов. Обозначим наблюденные значения случайной величины
Х1, Х2, …, Хn.
Их можно рассматривать как n «экземпляров» случайных величин Х, то есть n независимых случайных величин. Каждая из которых распределена по тому же закону, что и случайная величина Х.
Обозначим ã оценку параметра а. Любая оценка, вычисленная на основе материала Х1, Х2, …, Хn должна представлять собой функцию этих величин:
ã=φ(Х1, Х2, …, Хn)
и, следовательно, сама является величиной случайной. Такая оценка называется «точечной». Закон распределения ã зависит, во-первых, от закона распределения величины Х (и, в частности, от самого неизвестного параметра а): во-вторых, от числа опытов n. В принципе этот закон распределения может быть найден известными методами теории вероятностей.
Критерии оценок.
Состоятельность.
Если при увеличении числа опытов n оценка ã сходится по вероятности к параметру а, то такая оценка называется состоятельной.
Несмещенность.
Если математическое ожидание оценки ã равно оцениваемому параметру а, т. е. выполняется
М[ã]=a,
то такая оценка называется несмещенной.
Эффективность.
Если оценка ã обладает по сравнению с другими оценками наименьшей дисперсией, т. е.
D[ã]=min,
то она назывется эффективной.
На практике не всегда удается удовлетворять всем этим требованиям. Например, может оказаться, что, даже если эффективная оценка существует, формулы для ее вычисления оказываются слишком сложными, и приходится удовлетворяться другой оценкой, дисперсия которой несколько больше. Иногда применяются – незначительно смещенные оценки. Однако выбору оценки всегда должно предшествовать ее критическое рассмотрение со всех перечисленных выше точе зрения.
Оценки для математического ожидания и дисперсии.
Пусть имеется случайная величина Х с математическим ожиданием m и дисперсией D; оба парамеира неизвестны. Над величиной Х произведено n независимых опытов, давших результаты X1, X2, . . . , Xn.
В качестве оценки для математического ожидания естественно взять статистическое среднее m*:
Можно доказать, что эта оценка является состоятельной и несмещенной. Если величина Х распределена по нормальному закону, дисперсия будет минимально возможной, т. е. оценка является эффективной. Для других законов распределения это может быть и не так.
Если в качестве оценки дисперсии взять статистическую дисперсию D*
,
то при проверки окажетя, что эта оценка состоятельная, но не является несмещенной. Ее математическое ожидание:
Пользуясь оценкой D* вместо дисперсии D, мы будем совершать некоторую систематическую ошибку в меньшую сторону. Чтобы ликвидировать это смещение, достаточно ввести поправку, умножив величину D* на n/(n-1).
Оценка
называется «исправленной» статистической дисперсией. Эта оценка состоятельная и несмещенная, но эффективной она не является. Однако в случае нормального распределения она является «асимптотически эффективной», то есить при увеличении n отношение ее дисперсии к минимально возможной неограниченно приближается к единице.
Метод моментов для точечной оценки параметров распределения.
Это метод основан на том, что начальные и центральные статистические моменты являются состоятельными оценками соответственно начальных и центральных теоретических моментов того же порядка. Метод предложен К. Пирсоном и состоит в приравнивании теоретических моментов рассматриваемого распределения соответствующим стаистическим моментам того же порядка.
Пусть задан вид плотности распределения f(x,θ), определяемый одним неизвестным параметром θ. Требуется найти точечную оценку параметра θ.
Следуя методу моментов, приравняем начальный теоретический момент первого порядка начальному статистическому моменту первого порядка:
m=m*
Математическое ожидание, как видно из соотношения
есть функция от θ, поэтому выражение
можно рассматривать как уравнение с одним неизвестным θ. Решив это уравнение относительно параметра θ, тем самым найдем его точечную оценку.
Пусть задан вид плотности распределения f(x;θ1,θ2), определяемый неизвестными параметрами θ1 и θ2. Для отыскания двух параметров необходимы два уравнения относительно этих параметров. Следуя методу моментов приравняем начальный теоретический момент первого порядка начальному статистическому моменту первого порядка и центральный теоретический момент вторго порядка центральному статистическому моменту второго порядка:
m=m* D=D*
Учитывая, что
и
можем составить систему двух уравнений с двумя неизвестными
Решив эту систему относительно неизвестных парамеиров θ1 и θ2 ,тем самым получим их точечные оценки.
Метод наибольшего правдоподобия.
Предложен Р. Фишером.
Дискретные случайные величины. Пусть Х – дискретная случайная величина, которая в результате n испытаний приняла значения x1, x2, . . . , xn. Допустим, что вид закона распределения величины Х задан, но неизвестен параметр θ, которым определяется этот закон. Требуется найти его точечную оценку.
Обозначим вероятность того, что в результате испытания величина Х примет значение xi (i=1, 2, . . ., n), через p(xi; θ).
Функцией правдоподобия дискретной случайной величины Х называют функцию аргумента θ:
,
где x1, x2, . . . , xn – фиксированные числа.
В качестве точечной оценки параметра θ принимают такое его значение θ*, при котором функция правдоподобия достигает максимума. Оценку θ* называют оценкой наибольшего правдоподобия.
Функции L и ln L достигают максимума при одном и том же значении, поэтому вместо отыскания максимума функции L ищут (что удобнее) максимум функции ln L. Функцию ln L назывют логарифмической функцией правдоподобия.
Непрерывные случайные величины. Пусть Х – непрерывная случайная величина, которая в результате n ипытаний приняла значения x1, x2, . . . , xn . Допустим, что вид плотности распределения f(x; θ) задан, но не известен параметр θ, которым определяется эта функция.
Функцией правдоподобия непрерывной случайной величины Х назывют функцию аргумента θ
где x1, x2, . . . , xn – фиксированные числа.
Оценку наибольшего правдоподобия неизвестного параметра распределения непрерывной случайной величины ищут так же, как в случае дискретной величины.
Доверительный интервал. Доверительная вероятность.
Чтобы дать представление о точности и надежности оценки ã, в математической статистике пользуются так называемыми доверительными интервалами и доверительными вероятностями. Эти понятия особенно актуальны при малом числе наблюдений, когда точечная оценка ã в значительной мере случайна и приближенная замена а на ã может привести к серьезным ошибкам.
Пусть для параметра а получена несмещенная оценка ã. Мы хотим оценить возможную при этом ошибку. Назначим некоторую достаточно большую вероятность ( нпример, β=0,9, 0,95 или 0,99 ) такую, что событие с вероятностью β можно считать практически достоверным, и найдем такое значение ε, для которого
Тогда диапазон практически возможных значений ошибки, возникающей при замене а на ã, будет ; большие по абсолютной величине ошибки будут появляться только с малой вероятностью.
Перепишем приведнное выше равенство в виде:
Это означает , что с вероятностью β неизвестное значение патаметра а попадает в интервал
Iβ=(ã-ε; ã+ε).
Доверительным называют интервал, который покрывает неизвестный параметр с заданной вероятность (надежностью).
Доверительной вероятностью (надежностью) называется вероятность с которой осуществляется неравенство .
Величина а не случайна, зато случаен интервал. Случайно его положение на оси абсцисс, определяемое его центром ã; случайна вобще и длина интервала 2ε, так как величина ε вычисляеися, как правило, по опытным данным. Поэтому лучше толковать величину β не как вероятность «попадания» точки а в интервал Iβ, а как вероятность того, что случайный интервал Iβ накроет точку а.
Мы рассматривали доверительный интервал симметричный относительно относительно ã, вообще говоря это не обязательно.
Чтобы оценить точность и надежность оценки,нужно знать ее закон распределения. Если бы нам был известен закон распределения величины ã, задача нахождения доверительного интервала была бы весьма проста: достаточно было бы найти такое значение ε, для которого
.
Затруднение состоит в том, что закон распределения оценки ã зависит от закона распределения величины Х и, следовательно, от его его неизвестных параметров (в частности, и от самого параметра а).
Доверительный интервал для математического ожидания нормально распределенной случайной величины с известной дисперсией.
Примем без доказательства, что если случайная величина Х распределена нормально, то взяятое в качестве оценки ее математического ожидания статстическое среднее
,
есть случайная величина распределенная нормально, и параметры этого закона следующие:
,
где m, D и σ соответствующие параметры закона распределения случайной величины Х.
Рассмотрим случайную величину . Закон распределения Δ также будет нормальным, а его параметры:
M[Δ]=0, D[Δ]=0, σΔ=σ/√n
Определим вероятность попадания случайной величины Δ на отрезок [-α, α]
Обзначим
Задав доверительную вероятность β, по таблице значений интегральной функции Лаплпса легко определить значение u, учитывая что . Затем определяем α
.
Теперь можем записать
,
или
.
Таким образом это доверительный интервал для математического ожидания случайной величины Х, с нормальным законом распределения, при заданной доверительной вероятности β.