- •Запишите формулы для математического ожидания и дисперсии выборочной доли в случае повторной (бесповторной) выборки. Поясните все используемые обозначения.
- •Сформулируйте определение выборки из распределения. Как в этом случае определяются: выборочное среднее, выборочные начальные и центральные моменты, выборочная функция распределения?
- •Докажите формулы для математического ожидания и дисперсии выборочного среднего в случае повторной выборки.
- •Выведите формулу для дисперсии выборочного среднего бесповторной выборки.
- •Что такое точечная статистическая оценка? Какие оценки называются несмещенными, эффективными, состоятельными? Приведите пример эффективной оценки.
- •Запишите формулу для несмещенной оценки начального момента произвольного порядка. Докажите несмещенность.
- •Сформулируйте теорему Слуцкого и на ее основе докажите теорему о состоятельных оценках центральных моментов.
- •Сформулируйте и докажите теорему о состоятельности оценок метода моментов.
- •Сформулируйте определения распределений χ², Стьюдента и Фишера. Какие из этих распределений являются симметричными?
- •Что называется интервальной оценкой параметра распределения? Какие оценки называются симметричными по вероятности? Определите понятия: доверительная вероятность и точность оценки.
- •Пояснив используемые символы, запишите (1–α)-доверительный интервал (симметричный по вероятности) для дисперсии при известном математическом ожидании. В каких случаях применима данная формула?
- •Пояснив используемые символы, запишите (1–α)-доверительный интервал (симметричный по вероятности) для дисперсии при неизвестном математическом ожидании. В каких случаях применима данная формула?
- •Запишите приближенный (1–α)-доверительный интервал для генеральной доли признака в случае выборки большого объема n (n→∞). Поясните все используемые символы.
- •Пояснив используемые символы, запишите (1–α)-доверительный (симметричный по вероятности) интервал предсказания. Для каких генеральных распределений применима данная формула?
- •Опишите общую схему проверки статистических гипотез. Определите понятия: критическая область, уровень значимости, мощность критерия. Какие гипотезы называются простыми (сложными)?
- •Определите отношение правдоподобия для дискретных и абсолютно непрерывных распределений. Сформулируйте теорему (лемму) Неймана – Пирсона и приведите пример наиболее мощного критерия.
- •Для проверки каких гипотез применяется критерий Колмогорова? Каким образом находится значение статистики данного критерия?
- •Определите p-значение статистического критерия. Каким образом находится p-значение, если известно распределение статистики критерия ? Рассмотрите случай критической области вида
- •В чем состоит метод наименьших квадратов (мнк)? Используя матричную запись, укажите явный вид (приближенного) решения системы линейных уравнений по мнк. В каком случае мнк-решение не существует?
Определите p-значение статистического критерия. Каким образом находится p-значение, если известно распределение статистики критерия ? Рассмотрите случай критической области вида
Определение: Для фиксированной реализации выборки Р-значением статистического критерия называется такое число PV( ), что PV( )≥α для любого уровня значимости α, при котором гипотеза Н0 принимается, и PV( )≤альфа, для любого уровня значимости альфа, при котором гипотеза Н0 отвергается.
Предположим, что Р-значение PV( ) уже каким-либо способом найдено. Тогда решение о принятии (отклонении) Н0 для заданного α осуществляется на основе следующего простого правила: если PV( ) <α, гипотеза Н0 отвергается, а если PV( )> α гипотеза Н0 принимается.
Рассмотрим отдельно случай PV( ) =α. Как правило, критическую область можно представить в виде
Где с(α)-непрерывная убывающая функция. Как нетрудно видеть, в этом случае и для PV( ) =альфа имеет место равенство
Означающее, что Н0 принимается. Отсюда :
Действительно, при любом уровне значимости α имеем
Аналогично, ,где с(α) – непрерывная возрастающая функция, Р-значение удовлетворяет соотношению
В чем состоит метод наименьших квадратов (мнк)? Используя матричную запись, укажите явный вид (приближенного) решения системы линейных уравнений по мнк. В каком случае мнк-решение не существует?
Пусть имеется Система из 3-х уравнений:
a11х1+ a12х2=b1
a21х2+ a22х2=b2 (1)
a31х3+ a32х2=b3
Система, в общем говоря несовместн. После подстановки в нее произвольной пары чисел х1 и х2 одно или несколько уравнений будут нарушены.Отклонением (или невязкой) i-ого уравнения называются разность между его левой и правой частями.
ei= ai1х11+ ai2х2-bi
Сумма квадратов отклонений во всех уравнениях далее обозначается
S(х1, х2)= е1^2 + е2^2 + е3^2 (измеряет качество решения)
O: Метод наименьших квадратов – метод приближенных решений СЛУ состоит в том, что ищется приближенное решение с наименьшей суммой квадратов ошибок. (1) сводится к (2).
S(х1,х1)→min (2)
Явный вид решения системы лин. уравнений по МНК
Формула задает МНК-решение записанной в матричном виде линейной системы с произвольным числом неизвестных и уравнений. Единственное ограничение состоит в том, чтобы столбцы матрица А были линейно независимы, т.е. при линейсной зависимости столбцов матрицы А решения не существует. Несложно доказывается например, что при условии обратная матрица существует, что обеспечивает существование и единственность решения системы.
Используя метод наименьших квадратов, найдите коэффициенты α и β, удовлетворяющие соотношениям: α+βx₁ ≈ y₁, α+βx₂ ≈ y₂, ...,α+βxn ≈ yn.
Предположим, что на плоскости задано n точек (х1,y1),…,(xn,yn) и необходимо подобрать прямую , проходящую как можно ближе к этим точкам. Если бы все точки лежали на прямой, то коэффициенты были бы решением системы:
На самом деле точки обычно не лежат на одной прямой и система является несовместной. Тем не менее, коэффициенты α иβискомой функции легко находятся как МНК-решения системы.
,
где ,
и применяя формулу , получим
Исходные данные x1,…,xn; y1,…,yn далее интерпретируются как значения некоторых признаков Х, Y в совокупности ={1,..,n}, где xi=X(i), yi=Y(i),
, где – выборочная дисперсия