- •Методичнi вказiвки
- •6.0708 «Екологія та охорона навколишнього середовища»,
- •6.0707"Геологія") м. Донецьк
- •Методичнi вказiвки
- •6.0708 «Екологія та охорона навколишнього середовища»,
- •6.0707"Геологія")
- •Введение Знакомство с пакетом программ для моделирования и подготовка экспериментальных данных к обработке
- •1 Лабораторная работа №1
- •Построение закона распределения показателя
- •Задание для самостоятельной работы:
- •1.2 Вычисление описательных статистик
- •1.3 Построение доверительного интервала для среднего
- •Задание для самостоятельной работы
- •2 Лабораторная работа №2
- •3. Лабораторная работа №3
- •3.2 Двухфакторная дисперсионная модель
- •4 Лабораторная работа №4
- •4.1 Анализ диаграмм рассеяния
- •Задание для самостоятельной работы:
- •4.2 Изучение связи между переменными: линейный коэффициент корреляции Пирсона
- •4.3 Построение доверительного интервала для коэффициента корреляции
- •Задание для самостоятельной работы: Ваша задача состоит в том, чтобы:
- •5.1 Парная линейная регрессия
- •5.2 Множественная линейная регрессия
- •6.1 Быстрый кластерный анализ
- •Задание для самостоятельной работы:
- •6.2 Иерархический кластерный анализ
- •Задание для самостоятельной работы:
Построение закона распределения показателя
Для построения таблицы одномерного распределения необходимо в главном меню выбрать последовательность команд Statistics | Summarize | Frequencies. Появится следующее диалоговое окно (рис. 2):
Рисунок 2. Диалоговое окно построения закона распределения
Перенесите имена показателей из левого списка в список Variables (при помощи кнопки переноса или сдвоенным щелчком по имени), затем щелкните кнопку OK. Визуально таблицы распределения частот представляют в виде гистограммы. На ней высота столбиков соответствует частотам значений В окне распечатки будет выведена гистограмма (рис.3) и таблица с одномерным распределением признака:
Рисунок 3. Гистограмма частотного распределения показателя
Таблица рапсределения признака
A1.V078
Valid Cum
Value Label Value Frequency Percent Percent Percent
1 25 10.3 10.4 10.4
2 134 55.4 55.6 66.0
3 82 33.9 34.0 100.0
. 1 .4 Missing
Total 242 100.0 100.0
Valid cases 241 Missing cases 1
В этой таблице имеются следующие столбцы:
Value — список значений переменной. Помимо значений 1, 2 и 3 в этом списке содержатся пропущенные значения (анг. Missing), которые обозначаются десятичной точкой (.);
Frequency — частота встречаемости значений в выборке. Например, в данной таблице видно, что первый интервал (значение 1) встречается в выборке 25 раз и одно пропущенное значение;
Percent — процент наблюдений в выборке, имеющих соответствующее значение. Для вычисления процента частота значения делится на общее число наблюдений и умножается на 100.
Valid Percent — процент к общему числу наблюдений с непропущенным значением. Если в данных много пропущенных значений, то Percent и Valid Percent могут существенно различаться.
Слово Total переводится как "Всего". В соответствующей строке подводятся итоги столбцов частот и процентов.
В отличие от таблицы, график позволяет легко схватывать соотношения между частотами, обнаруживать неочевидные закономерности. Наиболее удачной является гистограмма, имеющая 5-7 интервалов. Обычно она получается для показателей, имеющих наиболее разнообразные значений в файле исходных данных.
Задание для самостоятельной работы:
Проанализируете все показатели (столбцы) на разнообразие значений
Выберите наиболее вариабельный из них.
Постройте гистограмму и проанализируйте ее по количеству частичных интервалов, наличие разрывов (однородность), похожесть на известный теоретический закон распределения.
Попробуйте достигнуть максимальной похожести на теоретический закон с помощью изменения числа частичных интервалов.