- •Введение
- •1.Структура пакета STATISTICA
- •Структура данных
- •Редактирование данных
- •Источники данных
- •Открытие файла данных
- •Создание файла данных
- •Сохранение файла
- •Импорт файла данных
- •Экспорт файла данных
- •Вычисление основных статистик и построение графиков
- •2. Лабораторные работы по теории вероятностей
- •Выполнение в пакете STATISTICA
- •. Работа с Probability Distr. Calculator
- •Моделирование распределений случайных величин
- •3. Лабораторные работы по статистическим методам
- •Выполнение в пакете STATISTICA
- •Основные понятия
- •Задание
- •Выполнение в пакете STATISTICA
- •Задания для самостоятельной работы
- •Работа 5. Доверительные интервалы для разности средних и отношения дисперсий
- •Основные понятия
- •Задание
- •Выполнение в пакете STATISTICA
- •Задания для самостоятельной работы
- •Работа 6. Группировка данных по классифицирующему признаку
- •Выполнение в пакете STATISTICA
- •4. Непараметрические методы математической статистики
- •Задания для самостоятельной работы
- •Задания для самостоятельной работы
- •Коэффициент ранговой корреляции Спирмена
- •Задания для самостоятельной работы
- •Задания для самостоятельной работы
- •Задание 1
- •Задание 2
- •4.8. Критерий знаков (Sign test)
- •4.9. Критерий Вилкоксона (Wilcoxon watched pairs test)
- •Задания для самостоятельной работы
- •5. Однофакторный дисперсионный анализ
- •5.1. Основные понятия
- •5.2. Решение примеров в пакете STATISTICA
- •6. Регрессионный анализ
- •Работа 7. Простая линейная регрессия
- •Литература
|
|
Scatterplot (NEW.STA 10v*200c) |
|
|
|
||
0,22 |
|
|
|
|
|
1,1 |
|
0,18 |
|
|
|
|
|
0,9 |
|
0,14 |
|
|
|
|
|
0,7 |
|
0,10 |
|
|
|
|
|
0,5 |
|
0,06 |
|
|
|
|
|
0,3 |
|
0,02 |
|
|
|
|
|
0,1 |
|
-0,02 |
|
|
|
|
|
-0,1 |
VAR2 (L) |
|
|
|
|
|
VAR3 (R) |
||
-2 |
2 |
6 |
10 |
14 |
18 |
22 |
VAR1
Рис.2.4. Графики функций плотности и распределения
N(7; 4)
В. Работа с Probability Distr. Calculator
Для непрерывных распределений все необходимые расчеты можно выполнить, используя вероятностный калькулятор. Войдите в модуль Basic Statistics and Tables → Analysis → Startup Panel →
Probability Calculator (рис.2.5).
Рис.2.5. Окно вероятностного калькулятора
Чтобы понять работу с вероятностным калькулятором, откройте таблицу значений функции
32
распределения нормального закона N(0, 1)
|
|
1 |
|
x |
− |
t 2 |
|
Ф(x) = |
|
|
òe |
|
dt (см. [1], с. 411). |
||
|
|
2 |
|||||
|
|
|
|
||||
2π |
|
||||||
|
|
|
|
−∞ |
|
|
|
В поле Distribution слева выберите нормальное распределение Z(normal), математическое ожидание mean = 0, стандартное отклонение st.dev. = 1. Если теперь ввести значение x (например x = 0,1) и щелкнуть левой кнопкой на Compute, то в поле р появится число, равное вероятности события Z < x, где Z - случайная величина, имеющая стандартное нормальное распределение N(0, 1), Z ~ N(0, 1), т.е. р = P[Z < x] = Φ(x).
Так, при х = 0,1 получим р = P[Z < 0,1] = Φ(0,1) = 0,539828. (Проверьте по таблице значений функции Φ(x)!)
На графике плотности распределения (Density Function) вычисленная вероятность р равна заштрихованной части площади под графиком плотности распределения (вся площадь под графиком плотности равна единице). На графике функции распределения (Distribution Function) р - это ордината Φ(x), соответствующая абсциссе x. Точные значения на графиках можно получить, если левой кнопкой установить опцию Create graph и нажать кнопку пересчета Compute.
Напомним, что квантиль порядка р для непрерывного распределения случайной величины X с плотностью f(x) - это число xp, удовлетворяющее условию
x p
P[X − xp ]= F(xp ) = p, или ò f (x)dx = p .
−∞
33
Таким образом, используя вероятностный калькулятор, можно для данного распределения: 1) по значению квантили xp = x найти порядок квантили р; 2) по значению порядка квантили р найти соответствующую квантиль xp = x.
Задания для самостоятельной работы
1.Составьте таблицу квантилей порядка 0,01; 0,05; 0,1; 0,9; 0,95; 0,99 для распределений: N(0, 1),
Стьюдента (t-распределения) (k = 10), хи-квадрат
(k = 19), Фишера F (k1 = 10, k2 = 15).
2.Для случайной величины X~N(1, s2 = 4) вычислите вероятности следующих событий: P[X < 2],
P[X ³ 3], P[0 < X < 3], P[½X½ < 1], P[½X½ ³ 2], P[½X – 1½ < 1], P[½X – 2½ > 1]. Расчеты проведите, используя функцию Ф(x), и сравните результаты со значениями, вычисленными с помощью вероятностного калькулятора. Покажите соответствующие вероятности на графиках плотности распределения.
3. Объясните, что вычисляет вероятностный калькулятор, если используются опции two-tailed и 1- Cumulative p. Приведите примеры расчетов с использованием этих опций.
C. Построение графиков плотностей и функций распределения с использованием опции Graphs
График любой функции из списка функций, используемых в вероятностных расчетах, строится так: Graphs → Stat 2D Graphs → Custom Function Plots…
Custom Function: в поле введем, например, normal(x; 7; 2) - график плотности нормального распределения с m = 7 и σ = 2; далее введем диапазон изменения х: xmin = 0, xmax = 14 и нажмем ОК. График показан на рис.2.6.
34
Function Plot (NEW.STA 10v*110c)
|
|
=Normal(x;7;2) |
|
|
0,22 |
|
|
|
|
0,18 |
|
|
|
|
0,14 |
|
|
|
|
0,10 |
|
|
|
|
0,06 |
|
|
|
|
0,02 |
|
|
|
|
-0,02 |
3,5 |
7,0 |
10,5 |
14,0 |
0,0 |
Рис.2.6. График плотности нормального распределения
спараметрами m = 7, σ = 2
D.Моделирование распределений случайных величин
Взадачах статистического анализа сложных систем, например систем автоматического проектирования (САПР), широко используется метод моделирования выборки из генеральной совокупности с заданным законом распределения.
Пусть случайная величина X имеет функцию распределения F(x). Как известно из теории вероятностей, случайная величина Y = F(X) имеет равномерное распределение R(0, 1). Отсюда следует, что случайная величина X может быть получена из равномерно распределенной случайной величины Y по
формуле X = F −1(Y) , где F–1 - функция, обратная к F
(заведомо существующая для случайных величин непрерывного типа).
Метод моделирования выборки из генеральной совокупности с законом распределения F(x) реализуется следующим алгоритмом:
x j = F −1( y j ) , j = 1, 2, …, n,
35
|
F(x) |
|
1 |
|
|
yj |
|
|
0 |
xi |
x |
Рис.2.7. Получение выборки из генеральной |
|
|
совокупности с заданным законом распределения F(x) |
где y1, y2, …, yn - выборка из генеральной совокупности с равномерным распределением R(0, 1), являющаяся последовательностью случайных чисел.
Алгоритм получения выборки из генеральной совокупности с законом распределения F(x) поясняется на рис.2.7.
Таким образом, для моделирования выборки из непрерывного распределения нужно получить выборку из генеральной совокупности, имеющую равномерное распределение R(0, 1), а затем использовать функцию, обратную к функции распределения соответствующей случайной величины.
В пакете STATISTICA распределение R(0, 1) моделируется с помощью функции :=rnd(1).
Для примера смоделируем выборку из равномерного распределения R(0, 1) и запишем результат в переменной VAR4: курсор на поле VAR4 → щелчок правой кнопкой мыши → Variable Specs…→ в поле long name ввод формулы :=rnd(1) → ОК.
36
После пересчета 200 значений переменной VAR4 будут заполнены числами, представляющими случайную выборку наблюдений из генеральной совокупности, имеющей равномерное распределение R(0, 1). Чтобы получить выборку из нормального распределения N (m = 7; σ2 = 4) и записать ее в переменную VAR5, нужно в поле long name переменной
VAR5 записать формулу :=Vnormal (v4; 7; 2).
Можно в качестве аргумента функции Vnormal сразу записать rnd(1), тогда соответствующая формула будет :=Vnormal (rnd(1); 7; 2).
Аналогично моделируются выборки для любого непрерывного распределения.
37