Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
VUKOLOV2.pdf
Скачиваний:
136
Добавлен:
05.06.2015
Размер:
2.12 Mб
Скачать

Министерство образования и науки Российской Федерации

Московский государственный институт электронной техники

(технический университет)

––––––––––––––––––––––––––––––––––––––––––––––––

Э.А. Вуколов

Лабораторный практикум по теории вероятностей и статистическим

методам с использованием пакета

STATISTICA

Утверждено редакционно-издательским советом института

в качестве методических указаний

Москва 2005

УДК 519.246.8

Рецензенты: докт. техн. наук, проф. А.И. Кобзарь; канд. техн. наук А.А. Васенков

Вуколов Э.А.

Лабораторный практикум по теории вероятностей и статистическим методам с использованием пакета

STATISTICA. - М.: МИЭТ, 2005. - 208 с.: ил.

Практикум содержит краткое описание процедур пакета STATISTICA и лабораторные работы по основным разделам курсов теории вероятностей и статистики. Представлены необходимые теоретические сведения. Приведены примеры выполнения расчетов с использованием соответствующих процедур пакета, а также примеры решения задач. Во все лабораторные работы включены задания для самостоятельного выполнения.

Предназначен для студентов вузов, изучающих статистику.

4

Вуколов Эдуард Александрович

Лабораторный практикум по теории вероятностей и статистическим методам с использованием пакета STATISTICA

Редактор Е.Г. Кузнецова. Технический редактор Л.Г. Лосякова. Компьютерная верстка А.А. Григорашвили

Подписано в печать с оригинал-макета . .05. Формат 60x84 1/16. Печать офсетная. Бумага офсетная. Гарнитура Times New Roman. Усл. печ. л. 12,06. Уч.-изд. л. 10,04. Тираж 300 экз. Заказ .

Отпечатано в типографии ИПК МИЭТ.

124498, Москва, Зеленоград, проезд 4806, д. 5, МИЭТ.

© МИЭТ, 2005

5

Цель расчетов - не числа, а понимание. Р. Хэмминг

Введение

Теория вероятностей и математическая статистика являются теоретической основой обширной области знаний - анализа данных.

Задачи, решаемые методами современной статистической науки, весьма разнообразны. Они связаны как с обработкой и интерпретацией данных различного вида, так и с прогнозированием (анализ временных рядов и регрессионный анализ), классификацией и детерминацией (кластерный и дискриминантный анализ), выявлением наиболее существенных факторов (дисперсионный анализ), снижением размерности данных (факторный анализ и метод главных компонент), статистическим контролем качества и т.п.

Владение основами статистических методов необходимо каждому экономисту, менеджеру, социологу и инженеру. В связи с этим статистический анализ данных введен в программы подготовки специалистов по управлению экономикой и финансами, разработчиков маркетинговых стратегий, социологов, психологов.

В настоящее время статистические методы используются чрезвычайно широко благодаря уникальным возможностям современных компьютеров в обработке громадных объемов самой разнообразной информации. Разработано большое количество статистических пакетов программ, представляющих удобную форму программного обеспечения. Пользователями таких пакетов являются не только научные организации, но и коммерческие предприятия, аналитические и маркетинговые отделы фирм, банки, страховые компании, медицинские учреждения.

6

Применение статистических пакетов упрощает использование статистических методов, однако для осмысленного и эффективного их употребления необходимо не только правильно вводить информацию и выбирать тот или иной способ ее обработки, но и понимать основные идеи статистических методов обработки данных и, что особенно важно, предположения, при которых теоретически обоснованы эти методы. При осмысленном использовании статистических методов невозможны курьезы и абсурдные выводы, которыми так богата история статистики.

Предлагаемый читателю практикум написан на основе лекций, практических занятий и лабораторных работ, в течение многих лет проводившихся автором на факультете (институте) экономики, управления и права (ИнЭУП) МИЭТ, а также курсов, читаемых для слушателей, получающих второе высшее образование.

Практикум можно использовать при изучении всех разделов традиционного учебного курса атематической и общей статистики для инженерных и экономических специальностей.

Все практические расчеты и примеры рассматриваются в процедурах пакета STATISTICA. В главе 1 приводится краткое, но достаточное, на наш взгляд, описание структуры пакета. Более подробно с описанием пакета можно ознакомиться по специальной литературе [15 - 17].

Пакет STATISTICA содержит большое количество статистических процедур. Понять их особенности, предположения, при которых они могут быть использованы, и, наконец, выбрать ту или иную процедуру при решении конкретной задачи можно только с помощью специальной литературы. Для студента или специалиста, желающего использовать статистические методы в своей области знаний, такую литературу либо

7

трудно найти, либо весьма сложно читать, так как она написана на достаточно высоком математическом уровне. Для таких читателей в практикуме рассмотрены отдельные разделы статистического анализа, выходящие за рамки учебных программ, но имеющие большое значение в практике научных и инженерных исследований. Это прежде всего непараметрические методы математической статистики (глава 4). Подробно рассмотрены методы регрессионного анализа: множественная регрессия, процедуры пошагового выбора наиболее значимых факторов, вопросы проверки значимости и адекватности моделей, корреляционный анализ (глава 6).

Суть статистических методов находится "на кончике пера": как нельзя научиться считать без практики, не зная правил арифметики и алгебры, а используя только калькулятор, так нельзя понять существо статистических методов, используя только компьютер и не занимаясь вычислениями "вручную". Поэтому при подготовке практических работ по возможности использовался следующий подход: сначала студент решает простую задачу на данную тему "вручную", без компьютера; затем эта же задача решается с применением того или иного пакета на компьютере; результаты анализируются и сравниваются, и после этого студенту предлагается ряд дополнительных заданий для самостоятельной работы. При этом основное внимание уделяется пониманию сущности статистических методов, условиям их применимости и интерпретации результатов.

Автор выражает глубокую благодарность студентам ИнЭУП МИЭТ Панкратову К., Миляеву К., Ушаковой Е., Сухушиной В., Чамовой А., Вербицкой Е., Курьянову А., Бартко Н., Семиной И. и многим другим за помощь в подготовке книги к изданию.

8

1.Структура пакета STATISTICA

Универсальный статистический пакет STATISTICA разработан и производится фирмой Statsoft Inc. (США). Последние версии пакета полностью совместимы со средой Windows. В России пакет распространяется фирмой Statsoft Russia. Подробную информацию о пакете можно получить на сайте http://www.statsoft.ru. Работа с пакетом детально описана в ряде книг на русском языке [15 - 17], кроме того, пакет содержит понятную и хорошо структурированную документацию в системе Help. В связи с этим мы ограничимся очень кратким описанием структуры пакета.

Пакет STATISTICA имеет модульную структуру. Модули открываются простым щелчком мыши из Переключателя модулей (STATISTICA Module Switcher) (рис.1.1), который выводится на экран при запуске пакета.

Рис.1.1. Переключатель модулей пакета

STATISTICA

9

Каждый модуль может работать независимо от других модулей системы. В данном практикуме используются следующие модули:

Data Management (Управление данными); Basic Statistics/Tables (Основные

статистики/Таблицы);

Nonparametrics/Distributions (Непараметрические методы и подгонка распределений);

Multiple Regression (Множественная регрессия); ANOVA/MANOVA (Одно/многофакторный

дисперсионный анализ);

Time Series/Forecasting (Временные ряды/прогнозирование);

Cluster Analysis (Кластерный анализ).

Чтобы запустить модуль, нужно высветить название модуля в Переключателе модулей и нажать кнопку Switch to (Переключиться в) либо просто дважды щелкнуть по названию модуля. После этого на экране появится рабочее окно системы со стартовой панелью модуля.

На рис.1.2 показано окно STATISTICA после запуска модуля Basic Statistics/Tables.

Вторая сверху строка окна (строка меню) содержит ряд пунктов меню, общих для Windows-приложений: File (Файл), Edit (Правка), View (Вид), Window (Окно), Help (Помощь). Меню Analysis (Анализ) выводит на экран стартовую панель (Startup Panel) любого модуля. Меню Graphs (Графики) предназначено для построения различных графиков (такое же назначение имеют верхние инструментальные кнопки, расположенные в вертикальном ряду с левой стороны экрана). В меню

10

Options (Опции) задаются значения параметров конфигурации пакета.

Третья сверху строка окна и вертикальный ряд с левой стороны окна содержат инструментальные кнопки для быстрого доступа к командам меню. Назначение наиболее часто используемых кнопок указано на рис.1.2. Часть кнопок снабжена общепринятыми пиктограммами.

Работа в каждом модуле имеет общие черты:

открыть файл данных;

выбрать переменные для анализа;

выбрать метод анализа из меню в стартовой панели модуля;

выбрать конкретную вычислительную процедуру

изадать ее параметры;

произвести запуск вычислительной процедуры;

выбрать следующий шаг анализа.

11

12

Переключатель

Операции над

 

модулей

переменными

 

Двухмерные графики

Операции над

Быстрые основные

 

случаями

 

статистики

Трехмерные графики

 

 

Пересчет

 

 

Добавление на один Спецификации десятичный разряд

переменной

Графическая галерея

Рис.1.2. Окно STATISTICA (в правом нижнем углу кнопка Vars -

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]