Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛБ_1.doc
Скачиваний:
36
Добавлен:
01.02.2015
Размер:
5.12 Mб
Скачать

4.2 Ввод данных

Теперь необходимо ввести в программу данные из таблицы 1.1 Данные можно вводить по отдельным наблюдениям (строкам) или по отдельным переменным (столбцам).

Введенные в программу данные выглядят следующим образом:

Рис.1.9. - Вид заполненной страницы данных

5 Сохранение файла данных

Для сохранения созданного файла данных можно выбрать в меню команду File (Файл) Save as... (Сохранить как...) и задайте имя файла vv.sav.

По умолчанию SPSS сохраняет файл данных в текущем каталоге с расширением .sav. 

6. Запуск statistica

После установки STATISTICA Вы можете запустить программу, выбрав ярлык STATISTICA в меню Programs – ПрограммыкнопкиПускWindows (Вы можете также дважды кликнуть на файле STATIST.exe вПроводникеWindows или на ярлыке любого файла STATISTICA, например, электронные таблицы).

При запуске системы STATISTICA открывается последний файл, с которым вы работали. Если вы запускаете STATISTICA в первый раз, открывается пустая электронная таблица.

В верхней части рабочего окна пакета (как и в любом Windows-приложении) расположено главное меню

Как видим, пункты из панели главного меню: File (Файл), Edit (Правка), View (Вид), Insert (Вставка), Format (Формат), Tools (Сервис), Windows (Окно) и Help (Справка) по своей функциональной принадлежности являются стандартными для Windows-приложений.

Специфическими пунктами меню можно считать следующие: Statistics (Вычисления) – данный пункт меню содержит огромное количество методов статистической обработки данных начиная от расчета описательных статистик (максимум, минимум, средняя и т.д.) до сложнейших многомерных статистических алгоритмов. Graphs (Графики) – в данном пункте доступны огромное количество разнообразных графиков и диаграмм, как двухмерных так и трехмерных. Date (Данные) – в данном меню доступны алгоритмы направленные на преобразование имеющихся данных (стандартизация, ранжирование и т.д.).

6.1. Создание файла данных.

Создать файл данных в пакете STATISTICA можно двумя способами:

  1. Импортировать готовые данные из других программ (баз данных, математических и статистических пакетов прикладных программ).

  2. Ввести необходимую информацию с клавиатуры.

Для создания файла данных первым способом введем в табличном редакторе Excel данные представленные в таблице 1.1. Далее сохраним файл с именем data.xls на диске С или папке Мои документы (или другой папке) после этого необходимо закрыть табличный редактор Excel.

Импорт данных из внешних программ. Для импорта файла с данными в пакет STATISTICA необходимо пройти следующие шаги:

Шаг 1. В главном меню пакета выберем File → Open (Файл - Открыть).

Шаг 2. В появившемся окне необходимо выбрать тип файла, в данном случае файл электронной таблицы Excel (т.е. необходимо выбрать расширение *.xls) и имя искомого файла, далее нажать кнопку Открыть.

Шаг 3. В открывшемся диалоговом окне (рисунок 1.5) будет предложено импортировать отдельную страницу или все страницы рабочей книги.

где: Import all sheets to a Workbook - Импорт всех страниц рабочей книги

Import selected sheets to a Spreadsheet - Импорт выбранных страниц рабочей книги

Set as default - Установки отсутствуют

В нашем случае выберем второй вариант и перейдем к следующему шагу.

Шаг 4. В появившемся диалоговом окне Select Sheet to Import (Выбор импортируемой страницы) выберем необходимую страницу и нажмем клавишу ОК.

Рисунок 1.6 – Диалоговое окно Select Sheet to Import

Шаг 5. В следующем окне будет предложено указать размер таблицы, а также предоставлена возможность оставить имеющиеся имена импортируемых переменных и имена записей. Сделаем установки как показано на рисунке 1.7 и нажмем кнопку ОК.

Рисунок 1.7 – Диалоговое окно Open Excel File

где: Имя файла: - File name:

Диапазон - Range

Столбцы: с 1 по 2 - Columns: from

Строки: с 1 по 20 - Rows: from

Имена наблюдений из первого столбца - Get cases names from first column

Имена переменных из первой строки - Get variable names from first row

Импорт формата ячеек - Import cell formatting

Пройдя вышеперечисленные шаги, получим следующий лист рабочей книги пакета STATISTICA (рисунок 1.8).

Рисунок 1.8 – Результат импорта файла табличного редактора Excel в пакет STATISTICA

При желании пользователь может ввести заголовок для создаваемой таблицы, для этого в главном меню необходимо ввести View Display Header (Вид Вывод заголовка таблицы).Далее необходимо установить курсор на белой строке таблицы между ее техническим заголовком (в котором указано имя файла и размерность таблицы) и названием столбцов. Затем дважды щелкнуть левой кнопкой мыши и ввести необходимый заголовок.

6.2. Электронные таблицы.

Панель инструментов Spreadsheet – Электронная таблица содержит кнопки(Переменные) и(Наблюдения), открывающие меню, содержащие средства для реструктуризации файла данных (например,Add – Добавить,Move – Переместить переменные).

меню:

меню:

6.2 Панель инструментов электронной таблицы.

Исходные и итоговые данные можно редактировать в окне таблицы данных. Также доступны различные функции управления с базами данных, преобразования и перекодирования данных. Панель инструментов Spreadsheet - Таблица данныхдоступна всегда при открытой таблице данных. В ней предоставлен быстрый доступ ко всем часто используемым функциям управления данными и форматирования. Все функции, доступные на панели инструментов, можно использовать с помощью программных элементов управления.

Поля Font Name - Имя шрифтаиSize - Размериспользуются для изменения типа и размера шрифта в новой таблице данных или в выбранном тексте. Шрифты, размеры шрифта и стили могут различаться в ячейках таблицы данных.

Кнопки Формат символов.Эти кнопки управляют стилем выделенного текста:- полужирный текст,- текст курсивом,- подчеркнутый текст.

Кнопки Формат параграфа. Группа из этих кнопок управляет форматом параграфа (в отчетах) и выделенными ячейками в таблицах данных.- выравнивание по левому краю текста и графиков,- выравнивание текста и графиков между полями или в ячейках,- выравнивание по правому краю текста и графиков.

Кнопка Формат ячеек. Кнопкадля вызова диалогаFormat Cells - Формат ячеек, который используется для задания формата выбранных ячеек. Формат – это группа опций форматирования, которую Вы можете сохранить с заданным именем для дальнейшего использования. Форматам могут соответствовать числа или текст.

Вкладка Number - Числодля задания формата отображения выделенных ячеек. ВкладкаAlignment – Выравниваниеможно выбрать вертикальную, горизонтальную ориентацию и выравнивание значений в каждой ячейке. ВкладкаFont – Шрифтдля выбора шрифт, размер, цвет и стиль выбранного текста. ВкладкаBorder – Границадля выбора стиля и цвета границ ячеек.

Кнопка Fill Color - Цвет заливкидля вызова стандартной палитры цветов, в которой вы можете выбрать цвет фона ячеек таблицы данных.

Кнопка Format Menu - Меню форматдля вызова меню формат, в котором вы можете выбрать новый формат выбранных ячеек.

Для создания нового формата, основанного на текущих ячейках, выберите команду New from Selection - Копировать форматдля вызова диалогаFormat Name - Имя формата, в котором необходимо задать имя формата.

После этого, новый формат будет добавлен в меню формат.

Кнопка Показать/Спрятать текстовые меткидля переключения между режимами отображения текстовых меток в таблице данных и режимом отображения численных значений.

Кнопка Показать/Скрыть Имена наблюденийдля переключения между режимом отображения имен наблюдений и режимом отображения порядковых чисел наблюдений.

Кнопка Добавить десятичный разряддля добавления одного десятичного разряда к значению, отображаемому в текущей ячейке.

Кнопка Удалить десятичный разряддля удаления одного десятичного разряда в значении, отображаемом в текущей ячейке.

Кнопка Показать/Скрыть отмеченные ячейкидля применения/отмены шаблонаMarked Cells - Отмеченные ячейки к отмеченным ячейкам в таблице данных.

Кнопка Показать условия выборадля применения/отмены шаблонаSelection Conditions - Условия выборокотмеченным ячейкам, удовлетворяющим условиям выбора наблюдений. Таким образом, вы можете визуально отличить наблюдения, которые удовлетворяют условиям выбора.

Кнопка Включить/выключить условиядля включения/выключения условий выбора наблюдений. Для просмотра или редактирования условий выбора наблюдений необходимо дважды нажать на поле в строке состояний.

Кнопка Вес для вызова диалогаSpreadsheet Case Weights – Веса в таблице данных.

Определение весов позволяет задать влияние каждого отдельного наблюдения при анализе.

Кнопка Сортировка для вызова диалогаSort Options - параметры сортировки. Этот диалог используется для задания параметров сортировки переменных или наблюдения, используя до трех различных ключей.

Кнопка Пересчитать для пересчета формул в выбранных переменных в текущем файле данных.

Эти формулы можно ввести в качестве спецификаций переменной. Для ввода или изменения спецификаций, дважды нажмите на имени переменной в таблице данных.

Кнопка Переменные для вызова меню с глобальными параметрами и командамиVariable - Переменная: Add - Добавить, Move - Переместить, Copy -Копировать, Delete - Удалить, Specs - Спецификации, All Specs - Все спецификации, Text Labels - Текстовые метки, Create Subset/Random Sampling -Создать Подмножество/Случайную выборку, Verify Data-Проверка данных, Rank-Ранг, Recalculate-Пересчитать, Recode - Перекодировать, Replace Missing Data-Замена пропущенных данных, Shift(Lag)-Сдвинуть(Лаг), Standardize-Стандартизовать, и Date Operations-Операции с данными.

Кнопка Наблюдения для вызова меню с глобальными параметрами и командами Case - Наблюдение: Add-Добавить, Move-Переместить, Copy-Копировать, Delete-Удалить, Case Names Manager-Диспетчер имен наблюдений, Sort Cases-Сортировать наблюдения, Delete All Case Names-Удалить все имена наблюденийи Select Case Names Only-Выбрать только имена наблюдений.

6.3. Создание файла данных.

Набор данных в пакете STATISTICA – это прямоугольная таблица, столбцам которой соответствуют обрабатываемые переменные (Variables), а строкам отвечают наблюдения (Cases) значений переменных. Для создания нового набора данных нужно, прежде всего, завести файл с трафаретом таблицы нужных размеров.

В результате открытия нового файла в окне пакета появляется (как на рис. 3.) начальный трафарет создаваемого набора данных с исходными размерами в 10 переменных на 10 наблюдений. Реально нужное количество переменных и наблюдений выставляется после этого у трафарета по меню инструментальных кнопок VarsиCases. Как наблюдениям, так и переменным в трафарете создаваемого набора данных можно дать содержа тельные названия по менюCases – Case Name Manager.

Рис. 3. - Окно пакета STATISTICA

Каждая переменная − variables имеет свое имя, формат и другие атрибуты, которые называются спецификацией и задаются пользователем. Переменная представляет собой наблюдаемую величину. Результаты наблюдений записываются в строках таблицы − случаях Cases. Ими могут быть даты наблюдений, либо другие имена естественным образом, возникающие в конкретной задаче.

Перед тем, как начать работу с данными, необходимо преобразовать исходную таблицу (по умолчанию 10v * 10c- (10 переменных (variables) - столбцов по 10 наблюдений (cases) - строк).

Для этого необходимо добавить 6 переменных и 40 наблюдений.

Для того, чтобы добавить столбцы в таблицу необходимо: нажать кнопку Vars (на экране) -Add; в окнеAdd Variables укажем какое количество переменных - столбцов добавитьHow many: 6, и после какой переменной их вставить After:10 Остальные настройки примем по умолчанию -OK.

При необходимости также можно передвинуть некоторое число столбцов в указанное место (кнопка Vars - Move), скопировать некоторое количество столбцов (Vars - Copy), удалить (Vars – Delete) и т.д.

Для того, чтобы добавить строки в таблицу необходимо: нажать кнопку Cases -Add (добавление) – в открывшемся окнеAdd Cases: укажем, сколько строк добавить и куда :Number of Cases to Add :40, Insert after Case : 10- OK.

В результате будет получена таблица размерностью 16*50.

6.4. Определение формата переменных

Столбцы электронной таблицы имеют стандартные имена VAR1, VAR2, VAR3,… По желанию пользователя эти имена и формат переменной могут быть изменены. Для этого, установив указатель мыши на имени столбца таблицы, надо дважды щелкнуть левой кнопкой мыши. После этого откроется диалоговое окно спецификаций переменной, в котором можно изменить имя текущей переменной, формат, значение пропущенных данных, длинную метку, формулу или связь DDE. (Как и многие другие функции, используемые в системе STATISTICA, это диалоговое окно можно вызвать через панель инструментов, контекстные меню, вызываемые правой кнопкой мыши, а также через выпадающие меню.)

Это диалоговое окно можно также использовать для доступа к описательным статистикам и списку отсортированных числовых и текстовых значений текущей переменной. Из этого диалогового окна можно также вызвать окно Диспетчер текстовых значений (кнопка Text Values), чтобы посмотреть и изменить соответствия между текстовыми и числовыми значениями текущей переменной. От одной спецификации легко переходить к соседним, используя кнопки со стрелками, расположенные в верхней правой части диалогового окна (под кнопкой «Отмена»).

Имя переменной задается по тем же правилам как и в SPSS.

Тип переменной. Таблиц данных STATISTICA поддерживают четыре основных типа данных (отметим, что таблицы данных могут содержать также связи с другими источниками данных, внедренными мультимедийными объектами различных типов, макросами, и т.д., однако, такие элементы не будут использоваться напрямую при анализе):

Double - Двойной.Тип данных Double-Двойной (аббревиатура Двойная Точность) является форматом по умолчанию для численных значений в STATISTICA. С технической стороны это означает, что значения сохраняются в виде 64-битных действительных чисел с плавающей точкой (1 бит для знака, 11 – для экспоненты и 52 – для мантиссы). Диапазон значений этого типа данных равен примерно ±1.7*10E308. Каждое численное значение может иметь соответствующую текстовую метку практически неограниченной длины, еслиDisplay format - Формат отображенияGeneral - Общий. Это единственный тип данных, позволяющий содержать десятичные дроби. Если указан тип данных Double - Двойной, то каждая ячейка занимает 8 байт (плюс текстовая метка). Для типа данных Double-Двойной, код пропущенных данных равен -9999.

Integer - Целый.Тип данных Integer – Целый предоставляет возможность ввода целых чисел между -2,147,483,648 и 2,147,483,647. В переменную этого типа вы не можете вводить дробные численные значения. Каждое численное значение может иметь соответствующую текстовую метку практически неограниченной длины, если Display format-Формат отображения General-Общий.

Если указан тип данных Integer-Целый, то каждая ячейка занимает 4 байта; поэтому этот тип данных предоставляет более экономичный путь для хранения чисел по сравнению с типом Double - Двойнойи рекомендуется для хранения целочисленных данных в больших файлах данных. Для типа данных Integer-Целый, код пропущенных данных равен -9999.

Byte-Байтовый. Если указан тип данных Byte-Байтовый, вы можете вводить целый числа от 0 до 255. Вы не можете вводить дробные значения в переменную этого типа. Каждое байтовое значение может иметь соответствующую текстовую метку практически неограниченной длины, если Display format-Формат отображения General - Общий. Преимущества типа данных Byte-Байтовый заключается в возможности более экономичного хранения значений, поскольку каждая ячейка занимает только 1 байт. Для типа данных Byte-Байтовый, код пропущенных данных равен 255.

Text-Текстовый. Тип данных Text – Текстовый оптимизирован для хранения последовательности символов неограниченной длины. В STATISTICA вы можете выполнять численные анализы с текстовыми значениями. В этом случае, STATISTICA присваивает уникальные числа каждым текстовым значениям (в отличие от рассмотренной связи между численными типами данных и постоянными текстовыми метками, связи между текстовыми значениями и числами создают временно и не сохраняются в STATISTICA). Длина поля, зарезервированная для текстового типа данных, не является постоянной, и может быть изменена. Для типа данных Text-текстовый, код пропущенных значений – это пустая строка.

Более тонкая настройка типа переменной выполняется далее в поле Display Format (формат отображения): General (общий), Number (число), Date (дата), Time (время), Scientific (научный), Currency (денежный), Percentage (проценты), Fraction (дробный), Custom (другой).

Для переменной должен быть задан тип (шкала) измерений, который может быть Continuous (непрерывным), Categorical (категориальным), Ordinal (порядковым), unspecified (не указано). Также система может подобрать его автоматически.

Среди остальных элементов рассматриваемого окна особого внимания заслуживает поле Long name (длинное имя). Оно может работать как записная книжка, в которой бывает удобно оставить свои заметки по поводу той или иной переменной или хода расчетов. Кроме того, если текст в поле Long name – Длинное имя начинается с символа равенства (=), STATISTICA будет интерпретировать его как формулу [комментарии могут следовать за точкой с запятой (;)]. Например, можно ввести в поле Long name – Длинное имя (для первой переменной) выражение =(v2+v3+v4)/3 или =mean(v2:v4), тогда для каждого наблюдения (строки) электронной таблицы текущие значения этой переменной заменятся на среднее значений второй, третьей и четвертой переменных.

Спецификации всех переменных можно просмотреть и отредактировать в “комбинированном” диалоговом окне Variable Specifications Editor – Редактор спецификаций переменных, доступного с помощью кнопкиAll Specs – Все спецификациив окне спецификаций переменнойVariable – Переменная.

Эта таблица удобна для сравнения или изменения спецификаций нескольких переменных, особенно для копирования или вставки значений (например, комментария, формулы или связи), а также для копирования формата или кода пропущенных данных с одной переменной на последующие (с помощью команды контекстного менюЗаполнить блок вниз (Fill block down)).

Кроме атрибутов переменных можно задать также общую информацию обо всей таблице в целом, включая информационную часть и атрибуты внешнего оформления таблицы: информационную строку, отображаемую в поле заголовка таблицы; несколько строк комментариев или заметки о конкретном файле в виде текстового параграфа; список файлов, связанных с таблицей и называемых "Рабочей книгой" −"Workbooks", цвет, шрифт, размер, различных структурных элементов таблицы.

Имена наблюдений. Первый столбец в файле может (по выбору) содержать имена наблюдений. Чтобы ввести имя наблюдения, необходимо щелкнуть два раза левой клавишей мыши на левом поле строки и ввести имя.

STATISTICA предоставляет полную поддержку текстовых значений, которые могут иметь практически неограниченную длину, кроме того, внедрено форматирование внутри ячеек. Однако, для большинства анализов статистических данных, бывает полезно использовать текстовые значения, которые облегчают интерпретацию соответствующих численных значений.

Переменная «sex» содержит текстовую метку, то есть является численной переменной с текстовым значением, которое ассоциировано с численным значениям.

Вы можете переключаться между двумя способами отображения данных (численный или текстовый) в таблице данных, нажав кнопку Text Labels-Текстовые метки на панели инструментовSpreadsheet - Таблица данных.

Для определения переменной sex необходимо:

  • ввести в поле Name текст "sex";

  • задать тип переменной Double(двойной);Displayformat–General(общий);

  •  в поле Measure typeщелкните на кнопке— откроется список с возможными шкалами измерения:

  • Измените первоначальную настройку Auto(Автоматически) наCategorical(Категориальную).

  • для метки переменной задайте текст "Пол респондента".

  • кликом на кнопке (Text Labels)открыть диалоговое окно(Text Labels Editor).

  •  ввести в поле Text Label (Текст мсетки)текст "woman";

  •  введите в поле Numeric (числовой)число "1";

  •  повторите эти действия для значений "2" — "man" и "0" — "is not";

Максимально допустимая длина описания метки (Description)значения составляет 60 знаков.

Результат ввода всех значений в диалоговом окне показан на рис.

Определение переменной age:

  • Ввести в поле Name текст "age";

  • задать тип переменной integer (целый); Displayformat– Numberи установить количество десятичных разрядов "0";

  • в поле Measure Typeоставьте первоначальную настройкуAuto(Автоматически).

  • для метки переменной введите текст "Возраст респондента";

Определение переменной “height”:

  • Ввести в поле Name текст “height”;

  • задать тип переменной integer (целый); Displayformat– Numberи установить количество десятичных разрядов "0";

  • в поле Measure Typeоставьте первоначальную настройкуAuto(Автоматически).

  • для метки переменной введите текст "Рост респондента";

Переменная “profit” будет закодирована виде интервальной шкалы. Определение переменной“profit”:

  • Ввести в поле Name текст “profit”;

  • задать тип переменной Double(двойной);Displayformat–General(общий);

  •  в поле Measure Type - Ordinal (порядковая)

  • для метки переменной задайте текст "Доход респондента".

  • кликом на кнопке (Text Labels)открыть диалоговое окно(Text Labels Editor).

  •  ввести в поле Text Label (Текст метки)текст "меньше 3000";

  •  введите в поле Numeric (числовой)число "1";

  •  повторите эти действия для значений "2" — "3000-5000" и "3" — "больше 5000", "0" - "нет данных"

Определение переменной “food”:

  • Ввести в поле Name текст “food”;

  • задать тип переменной Integer(целый),Displayformat–Number(числовой)/ и установить количество десятичных разрядов "0";

  • для метки переменной введите текст "правильное питание";

  • кликом на кнопке (Text Labels)открыть диалоговое окно(Text Labels Editor).

  •  ввести в поле Text Label (Текст метки)текст "totallyagree";

  •  введите в поле Numeric (числовой)число "1";

  •  повторите эти действия для значений "2" — "agree"…;

Определение переменной “illness”

Ответ на этот вопрос допускает несколько вариантов ответа. Для того, чтобы его правильно закодировать, необходимо каждый вариант ответа выделить в отдельную биномиальную переменную («OP_DV_AP», «SERD_SOS», «JEL_KISH», «DIX_PUT», «ENDOKRIN»), в которой «0» - будет означать отсутствие соответствующей болезни, а «1» - соответственно её наличие.

По образу и подобию заполним оставшиеся переменные.

Таким образом, получим описанные переменные

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]