- •Введение
- •1.Структура пакета STATISTICA
- •Структура данных
- •Редактирование данных
- •Источники данных
- •Открытие файла данных
- •Создание файла данных
- •Сохранение файла
- •Импорт файла данных
- •Экспорт файла данных
- •Вычисление основных статистик и построение графиков
- •2. Лабораторные работы по теории вероятностей
- •Выполнение в пакете STATISTICA
- •. Работа с Probability Distr. Calculator
- •Моделирование распределений случайных величин
- •3. Лабораторные работы по статистическим методам
- •Выполнение в пакете STATISTICA
- •Основные понятия
- •Задание
- •Выполнение в пакете STATISTICA
- •Задания для самостоятельной работы
- •Работа 5. Доверительные интервалы для разности средних и отношения дисперсий
- •Основные понятия
- •Задание
- •Выполнение в пакете STATISTICA
- •Задания для самостоятельной работы
- •Работа 6. Группировка данных по классифицирующему признаку
- •Выполнение в пакете STATISTICA
- •4. Непараметрические методы математической статистики
- •Задания для самостоятельной работы
- •Задания для самостоятельной работы
- •Коэффициент ранговой корреляции Спирмена
- •Задания для самостоятельной работы
- •Задания для самостоятельной работы
- •Задание 1
- •Задание 2
- •4.8. Критерий знаков (Sign test)
- •4.9. Критерий Вилкоксона (Wilcoxon watched pairs test)
- •Задания для самостоятельной работы
- •5. Однофакторный дисперсионный анализ
- •5.1. Основные понятия
- •5.2. Решение примеров в пакете STATISTICA
- •6. Регрессионный анализ
- •Работа 7. Простая линейная регрессия
- •Литература
2. Лабораторные работы по теории вероятностей
Работа 1. Характеристики основных вероятностных распределений.
Моделирование распределений случайных величин. Вычисление вероятностей
Основные понятия. Дискретные и непрерывные случайные величины. Ряд распределения. Функция и плотность распределения и их свойства. Числовые характеристики случайных величин: математическое ожидание, дисперсия, среднее квадратическое отклонение, мода, медиана, начальные и центральные моменты, асимметрия, эксцесс. Квантиль порядка р.
Литература.
[1], гл. 18, § 2; гл. 19, § 2; [6], гл. 5, 6.
Задание.
1. Изучить основные свойства, характеристики и зависимость от параметров следующих распределений: биномиального B(n, p), пуассоновского Pu(a), геометрического Ge(p), равномерного R(a, b), экспоненциальное Ex(λ), нормального N(m, σ2), а также распределений
хи-квадрат, Стьюдента T(k) и Фишера F(k1, k2). При этом необходимо знать:
∙ определение математической или физической модели, приводящее к данному распределению, а также область, где оно встречается и используется;
25
∙функцию и плотность распределения, параметры, математическое ожидание, дисперсию, особенности формы распределения и асимптотические свойства;
∙вычисление квантилей xp заданного порядка и вероятностей;
∙связь данного распределения с другими распределениями.
2.Определить по номеру V в списке группы значения параметров распределений для случайных
величин X1, X2, …, X9 своего варианта по формулам:
1) X1 имеет биномиальное распределение B(n, p), параметры n и p определить по следующим формулам:
n = 10, если 1≤ V ≤ 10; n = 15, если 10 < V ≤ 20; n = 20, если 20 < V;
p = (V mod 10)/10, если V ¹ 10 и V ¹ 20; p = 0,1, если V = 10;
p = 0,5, если V = 20.
Указание: функция V mod a, равна остатку от деления V на a.
Например: 21 mod 10 = 1; 21 mod 3 = 0; 21 mod 6 = 3;
2)X2 имеет пуассоновское распределение Pu(a), параметр
a = (V mod 3) + 2;
3)X3 имеет геометрическое распределение Ge(p),
параметр p равен значению параметра р для B(n, р);
4)X4 имеет равномерное распределение R(a, b), параметры a и b взять равными: a = (V mod 10); b = a + 10;
5)X5 имеет экспоненциальное распределение Ex(λ), параметр λ взять равным значению р для B(n, р);
6)X6 имеет нормальное распределение N(m, σ2), параметры m и σ2 взять равными: m = (V mod 10) – 5; σ2
=(V mod 3) + 1;
26
7)X7 имеет распределение хи-квадрат с k степенями свободы х2k, параметр k = (V mod 10) + 7;
8)X8 имеет распределение Стьюдента с k степенями свободы T(k), параметр k = (V mod 10) + 2;
9)X9 имеет распределение Фишера с k1 и k2 степенями свободы, параметр k1 = (V mod 10) + 7; k2 = (V mod 5) + 8.
3. Выполнить следующие расчеты:
1)для каждого из распределений 1) - 6) определить точные значения математического ожидания М[X],
дисперсии D[X], Р[2 ≤ X ≤ 4], квантили порядков 0,25; 0,5; 0,75. Параметры распределений и результаты представить в виде таблицы;
2) вычислить и показать на графиках плотностей распределения соответствующую вероятность
P[ X - m ³ kσ] для Х4, Х5, Х6 при k = 1, 2, 3;
3)сформулировать правило "трех сигм" для Х6;
4)исследовать асимптотические (при n→∞, k→∞,
k1→∞, k2→∞) свойства распределений биномиального, Стьюдента, хи-квадрат и Фишера. Привести эскизы графиков плотностей для исходных и асимптотических распределений;
5)методом моделирования получить выборки объемом 100 для каждого из непрерывных
распределений Х4 - Х9. Параметры распределений взять из таблицы, составленной для п. 3. Используя полученные выборки, для каждого из распределений Х4
-Х9 найти оценки М[X], D[X], P[2 < X < 4] квантилей порядков 0,25; 0,5; 0,75, а также оценки моды, медианы, эксцесса и асимметрии. Результаты занести в таблицу для п. 3. Сравнить точные значения параметров с их оценками по выборке.
27
Выполнение в пакете STATISTICA
Откройте новый файл для выполнения расчетов и записи результатов моделирования: File → New Data → OK присвоить имя файлу → OK.
Cases → Add (добавить число случаев до 200) →
ОК.
А. Описание вероятностных функций пакета STATISTICA, необходимых для
выполнения расчетов работы 1
Установите курсор на VAR1 и нажмите правую кнопку мыши.
Воткрывшемся меню выберите Variable Specs…
Вокне Variable Specs… (рис.2.1) задаются: имя переменной, число десятичных знаков, тип переменной.
Внижней части окна в поле long name можно записать функцию для пересчета значений переменной VAR1 или вставить соответствующую формулу, выбрав функции из списка после нажатия кнопки Functions (Функции).
Если в окне списка функций (рис.2.2) нажать кнопку Syntax, то появится текст, поясняющий правила записи формул и назначение функций. Функции, используемые в вероятностных расчетах, поясняются в дополнительном тексте, который появляется, если щелкнуть мышью по кнопке Distribution functions and their integrals (Функции распределения и их интегралы).
28
Рис.2.1. Окно Variable Specs…. для VAR1
Рис.2.2. Окно списка функций
29
Для непрерывных распределений, например нормального, вычисляются три функции:
∙ Normal (x; μ; σ) = |
|
1 |
|
− |
(x−μ)2 |
|
|
|
|
e 2σ2 |
- значение функции |
||||
|
|
|
|
||||
σ |
|
2π |
|||||
|
|
|
|
|
|
плотности нормального распределения N(m, σ²) в точке
х;
|
|
1 |
|
x |
− |
(t −μ)2 |
||
∙ Inormal (x; μ; σ) = |
|
|
òe |
2σ2 |
dt - значение |
|||
σ |
|
|
|
|
||||
2π |
|
|||||||
|
|
|
|
|
−∞ |
|
|
|
функции распределения нормального распределения N(μ; σ²) в точке х;
∙ Vnormal (x; μ; σ) - значение функции, обратной к функции Inormal (x; μ; σ) в точке х. Функция, обратная к функции распределения, используется для моделирования случайных величин (см. ниже).
Для дискретных распределений, например распределения Пуассона (Poisson), вычисляются две функции:
∙ Poisson (x; λ) = xλ e−λ - вероятность того, что
x!
случайная величина, имеющая распределение Пуассона с параметром λ, примет значение х, где x - целое неотрицательное число, λ > 0;
k = x |
k |
λ |
|
|
|
∙ IPoisson (x; λ) = å |
|
e−λ |
- суммарная накопленная |
||
k! |
|||||
k =0 |
|
|
|||
|
|
|
|
вероятность (аналог функции распределения) в точке х. Пример. Использование функций плотности и
распределения для построения графиков.
Построим соответствующие графики для Х ~ N (m = 7, σ² = 4).
В файле данных для VAR1 в поле long name введем формулу
30
=(V0 – 7)/10. Напомним, что оператор V0 вводит номера строк:
1, 2, …, 100. После пересчета по этой формуле в переменной VAR1(v1) получим значения х: –0,6; –0,5; – 03; ….
Для переменных VAR2 и VAR3 в поле long name соответственно введем формулы: =Normal (v1; 7; 2) и =Inormal (v1; 7; 2). После пересчета получим: в столбце переменной V2 значение плотности распределения, а в V3 - значение функции распределения.
Чтобы построить графики, войдем в меню Graphs → Stats 2D Graphs → Scatterplots… Тип графика Double - Y (рис.2.3). Установим значения переменных: VARX:
VAR1:
ØLeft Y: VAR2
ØRight Y: VAR3
ØFit → Off
Нажав кнопку OK, получим графики, приведенные на рис.2.4.
Рис.2.3. Установка вида графика
31