Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практикум по пакету Statistica.doc
Скачиваний:
110
Добавлен:
17.05.2013
Размер:
121.34 Кб
Скачать

Упражнение: заполните всю таблицу случайными числами. Очистите ее.

В контекстном меню заголовка столбца выберите пункт Variable Specs…. Появится уже знакомое окно Variable N. Другой способ активировать это окно – дважды кликнуть на заголовке столбца. Здесь можно выбрать имя столбца (Name), тип данных, представляемых столбцом (Type), длину (Length) для текстовых (Text) данных и значение, присваиваемое по умолчанию пустой ячейке (MD code), для числовых (Double, Integer или Byte). В большинстве случаев вам не придется изменять эти значения. В поле Display format можно выбрать вид, в котором данные будут выводиться на экран (только для числовых типов). Выберем, к примеру, формат Number. Появится еще одно поле – Decimal places, в котором можно указать желаемое количество десятичных знаков (весьма полезно в том случае, когда рассматривается случайная величина, имеющая смысл, например, расстояния в метрах или курса иностранной валюты в рублях). Отметим, что, выбирая тот или иной формат вывода, мы не изменяем сами данные. Чтобы убедиться в этом, нажмите кнопку Values/Stats. Появится новое окно, в котором будет приведена краткая информация о столбце: его имя, тип и формат данных, в отдельном поле эти данные будут перечислены (по возрастанию), а также значения средней (Mean), стандартного отклонения (SD) и количества непустых ячеек (N). Поле Long Name используется как комментарий и является необязательным для заполнения. В этом поле можно поместить, например, развернутое описание параметра, соответствующего данному столбцу в таблице. Делается это в поле Long name окна Variable N. Нажав кнопку All Specs…, мы попадем в новое окно, в котором можно изменить некоторые настройки сразу для нескольких столбцов.

Упражнение: создайте столбцы с числовыми данными форматов DATE, TIME, CURRENCY, FRACTION. Какие варианты представления этих данных возможны? Что произойдет при случайном заполнении этих столбцов? Какие форматы допустимы для других типов данных (BYTE, INTEGER, TEXT)?

В поле Long name окна Variable N можно указать описание параметра, соответствующего тому или иному столбцу, или задать формулу, по которой высчитываются данные в этом столбце. Для того, чтобы, например, занести в ячейки столбца значения случайной величины, имеющей равномерное распределение на интервале (0,1), (аналог случайного заполнения при помощи Fill Random Values), надо напечатать в этом поле команду «= RND(1)» (обязательно вместе со знаком “равно” в начале!). Команда «=RND(10)» заполнит столбец случайными числами из интервала (0,10), команда «=20+RND(10)» – случайными числами из интервала (20,30). Можно выбрать другие распределения: команда «=RNDNORMAL(X)»,к примеру, заполняет столбец числами – значениями нормально распределенной случайной величины со средним, равным 0, и стандартным отклонением, равным X. Вообще в систему встроено большое количество различных функций, которые можно вставлять в формулы. Для знакомства с этими функциями нажмите кнопку Functions (прямо над полем Long name). Откроется окно Function Browser, в котором можно выбрать категорию (Category) функции, саму функцию (в поле Item), и посмотреть краткую справку по ее синтаксису. Например, функция NORMAL(X;Mu;Sigma) вычисляет значение нормальной функции распределения с параметрами Mu (математическое ожидание, или средняя) и Sigma (стандартное отклонение) в точке X. В качестве аргументов функций могут выступать значения других столбцов. Дело в том, что каждому столбцу в системе Statistica назначена своя переменная вида vXXX, где XXX – номер столбца. Например, для того, чтобы в качестве аргумента какой-либо функции выступали значения первого столбца, мы должны будем указать этот столбец при помощи переменной v1, значения, второго– при помощи переменной v2, и т.д. Существует также переменная v0, в которой содержатся номера строк; то есть значение v0 для первой строки равно 1, для второй – 2, для десятой – 10. Команда «=NORMAL(v0;0;1)», к примеру, будет в каждой строке своего столбца помещать значения нормальной функции распределения в точках 1, 2, 3….

Допустим, нам надо исследовать зависимость стоимости помещения от его площади в каком-нибудь районе города. Мы измеряем длину и ширину каждого помещения (из некоторой выборки) и заносим эти данные в столбцы «Длина» (первый столбец, v1) и «Ширина» (второй, v2). Третий столбец мы назовем «Площадь», и назначим ему формулу «=v1*v2». Отметим, что такого же результата можно добиться, указав формулу «=Длина*Ширина», то есть указав в качестве аргумента функции придуманные нами имена столбцов.

Упражнение: создайте столбцы со случайными значениями различных распределений. В качестве аргументов подставляйте значения других столбцов. Попробуйте другие типы функций. Чему равен косинус в точке 10? В точке 11? Пусть в первом столбце содержатся случайные числа из интервала (-1,1). Какую формулу надо указать во втором столбце, чтобы значения в нем были равны +1 для положительных чисел первого столбца и -1 для отрицательных? А для значений 1 и 0?

Иногда приходится для анализа данных преобразовать их каким-либо специальным образом, не предусмотренным системой. В этом случае возникает необходимость написать макрос. Делается это с помощью языка программирования STATISTICA Visual Basic в специальном редакторе, доступном по сочетанию клавиш Alt+F11 (или из меню Tools-> Macro->STATISTICA Visual Basic Editor). Пусть, например, требуется выделить цветом те ячейки таблицы, значения которых удовлетворяют определенным условиям. На картинке вы видите один из вариантов программы, которая проверяет значения (value) всех ячеек активной таблицы и изменяет цвет текста на красный для некоторых из них. Для выполнения макроса нажмите клавишу F5.

Упражнение: Создайте максимальную таблицу, которую можно разместить на экране, заполните ее случайными числами. Перепишите и запустите указанный выше макрос. Как надо изменить этот макрос, чтобы числа меньше 0,3 красились в один цвет, а числа, большие 0,8 – в другой? Как сделать так, чтобы очистить все ячейки, значения которых больше 0,3 и меньше 0,8 (команда очистки ячейки – clear)? Напишите макрос, который запрашивает у пользователя значения верхней и нижней границ. (последнее задание необязательно)

В том случае, когда вы не уверены, что правильно понимаете какое-либо сообщение или просто не знаете, какие действия от вас ожидаются, можно обратиться к справочной системе пакета Statistica. Справка доступна из меню Help (общая справка); также имеется возможность вызвать ее для любого рабочего окна (кнопка со знаком вопроса – см. рисунок). В этой справке вы сможете найти краткое описание того, как действуют элементы управления данного окна. Очень часто дается дополнительная информация – примеры, рекомендации по установке значений различных полей, теоретическое обоснование реализуемых методов, справка по некоторым вопросам математической статистики, ссылки на смежные статьи.

Упражнение: запустите Вероятностный калькулятор (меню Statistics – Probability Calculator – Distributions…). Выясните назначение полей этого окна. Какие параметры определяют распределения Хи-квадрат, нормальное, Стьюдента, Фишера? Найдите по ссылкам справку по этим распределениям.