5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Медицинская_статистика_Жижин_К_С_
.pdfГлава 3. Компыотеры в медико-биологической статистике |
19 |
При выделении пиктограммы появляется подсказка,
содержащая название команды. Любое действие в SPSS
можно выполнить с помощью текстового менюипи пане
ли инструментов. Таким образом, пользователь может оп
тимизировать свою работу, выбирая для себя наиболее
удобные способы действий. Когда что-то становится не
понятным, есть соблазн обратиться к Справке (Help): не
рекомендуем этого делать.
И вот почему: даже если ваша версия русифицирова
на, из справочного материала вы все равно не сможете
извлечь никакой пользы, поскольку переводы делают не
профессионалы, и по сути это H~ настоящий перевод, а
поДстрочник, т. е. буквальный перевод английских фраз,
нуждающийся в дополнительном профессиональном
разъяснении смысла того, что переведено.
Рассмотрим последовательно основные операции по работе с данными
Результаты измерений в окне при запуске пакета пред
стамены в виде прямоyroльной таблицы или матрицы дан ных. Информация, внесенная по вертикали: в столбцы -
Ilеременные (признаки), а по строкам - наблюдения (из
меренные результаты). Количество строк и столбцов в па
кете может быть большим, но, конечно, не бесконечным.
Все случаи уже автоматически пронумерованы с левой сто
роны, поэтому исследователь избавлен от этой утомитель
ной процедуры.
Характерная особенность описываемого пакета в том,
что исследователь может вводить свои данные двумя спо
собами:
-в отдельные столбцы;
-в один и тот же столбец.
В последнем случае для каждой группы данных в со седнем столбце указывается номер ее выборки, т. е. зна
чение так называемой группирующей (Grouping УаПаЫе).
Она, как маркер, позволяет отличать выборки друг от дру
га: 1, 2, 3 и т. Д.
20 |
Медицинская статистика |
Выбор стратегии ввода данных (с использованием
группирующей переменной или без нее) зависит от пла нируемого метода обработки, поэтому на практике (напри
мер, при решении примеров, приведенных в последую
щих главах) суть методики ввода данных в макет таблицы
определяется самим исследователем.
Упражнение 1. • • • • • • • • • • • • • • • • • • • • • • •
Тренировочный ввод данных в таблицу пакета·SPSS
Получены исходные данные числа положительных·нахо-
док кишечной палочки в смывах с инвентаря и (JocYAbI сто
ловых двух 110левых станов «А» и «В»:
Nt А А в А в
1 |
24 |
35 |
3 |
35 |
24 |
5 |
33 |
22 |
2 |
43 |
34 |
4 |
19 |
20 |
6 |
26 |
28 |
Введем эти исходные данные в матрицу данных пакета в
отдельные столбцы. Переменные в этом случае получают ремарку типа уагООО 1••. vагОООЗ и т. д.
К слову сказать, исследователь может названия изме
нить .по ходу обработки данных.
Для задания характеристик переменной надо, подведя
курсор к ее названию, дважды щелкнуть левой кнопкой мыши.
Открыв диалоговое окно, выполним следующие действия:
1. BBeдe~ имя переменной. Вам надо быть готовым к
..,
тому, что сразу возникают ограничения: имя переменнои
доnжно содержать не боnее 8 симвоnов! И хотя пакет ру
сифицирован, с русскими названиями возникают проблемы.
Исходя из зтого, лучше присваивать переменным англоязыч ные имена. Например: Stan 1, Stan2.
2. Зададим тип данных, кнопкой Туре (ТИll данных). Дан
ные в принципе могут ВКЛlQчать бесконечное собрание ти
пов, в медицинских исследованиях часто встречаются сле
дующие:
•Numeric (Числовой) - для него важно иметь Width
(Общая длина), или количество десятичных знаков
после запятой;
Глава З. Компьютеры в медико-биологической статистике |
21 |
•String (Текстовой) - для него задается только об
щая длина;
•Date (Тип даты) - с конкретным форматом резуль
тата.
Наши данные - числовые (двузначные числа), и мы за
даем для них числовой ТИll С длиной «два» ·и «нулевым» ко
личеством знаков после запятой.
з. Вводим Labels (Метки) - они отражают комментарии, поясняющие смысл переменной. Для переменной Stan1 вве
дем метку «Полевой стан 1», а Для переменной Stan2 -
«Полевой стан 2». Метки будут «всплывать» как подсказки,
стоит только подвести курсор к названию переменной и се
кунду подождать.
Есть одно «но»: нецелесообразно вводить метки для от
дельных значений переменных, но в порядке эксперименти
рования можно ввести новую условную переменную в тре
тьем столбце. Пусть это будет переменная, которую назо
вем SUM, прис·воив ей метку: «Новая "еременная», зададим ей тип: числовая с количеством знаков после запятой О, а ее
значениям присвоим следующие метки: 1 - «Полевой стан
1»,2- «Полевой стан 2».
Для задания меток значений надо ввести в соответству
ющие поля используемое значение и название его метки, а
затем нажать Add (Добавить). Для тренировки введем не
сколько значений 1 и 2 для переменной SUM.
В таблице показываются сами эти числовые значения~ Чтобы перейти от них к меткам, жмем кнопку Value Labels
(~етки значений). Автоматически покажутся не числовые значения, а их метки. Отжав второй раз кнопку (Метки зна
чений), вернемся вновь к числовому представлению данных.
Бывает так, что в подборке данных появляются «окна», т. е. пропущенные данные (невнимательность исследовате ля, сбои в регистрирующей аппаратуре и т. д.). Эти огрехи в SPSS можно сгладить способом обработки эмпирического
материала с пропущенными значениями. Нажимаем кнопку
Missing Values (Пропущенные значения), и дальнейшая ста
"гистическая обработка ведется с учетом данной особеннос
ти Вtilборки.
zz |
Медицинская статистика |
в данном примере нам ее использовать нет смысла.
Определим формат столбца: Columll Format (Формат
столбца). Можно задать Column width (UJирина столбца),
Text аligпmепt (Способ выравнивания данных). Зададим, к
примеру, ширину, равную б. Выравниваем данные по пра
вому краю, для этого «включим» флажок Right (Вправо).
Если данные достаточно однородны и их немного, как в на
шем примере, можно осуществить процесс выравнивания по
центру - «включив» флажок Center.
Для определения типа используемой измерительной
шкалы существует блок полей Measurement (Тип шкалы).
Шкалирование по сути Оllределяет все дальнейшие спосо
бы математической обработки эмпирических данных. Ilакет
SPSS предлагает следующие типы шкал:
•Scale (непрерывную, интервальную),
•Огdiпаl (порядковую),
•Nоmiпаl (номинальную).
Использование интервальных шкал в медицине в насто
ящее время ограничено очень узким кругом научных иссле
дований. Шире используются порядковы'е, как в нашем слу чае, поэтому, естественно, задать значение «Порядковая».
На этом определение переменных нами закончено.
Теперь необходимо осуществить процедуру сохранения данных в файле. Она позволит обеспечить дальнейшую ра боту с цифрами. Это можно сделать несколькими спосо бами:
1) Активизировать на стандартной IlанеJIИ значок, на
котором изображена дискета.
2)Или рядом, слева активизировав значок File (Файл), ВЫllОЛНИТЬ в его меню команду Save (Сохранить).
В любом случае при первом сохранении открывается
диалоговое окно для определения маршрута размещения
файла и определения его имени. Выберем папку, к 1"lриме
ру, «Мои документы), но лучше - «SPSS)), а в качестве
имени - «упражнение 1)).
После этой процедуры имя файла появляется на площа
ди окна.
Глава З. Компьютеры в меДико-биологической статистике |
21 |
Внесение 'дальнейших изменений в файл системой от
слеживается автоматчески: новый вариант фаЙ.аа будет по
мещен под тем же именем и в той же папке, по тому же мар
шруту размещения. |
|
Редактирование данных |
|
Введем наши данные вторым способом |
в один об- |
щий столбец с использованием группирующей переменной~
Группирующая переменная SUM у нас уже определена.
Переместим ее из третьего столбца в четвертый:
1. Щелкнем правой клавишей мыши по названию пере
менной SUM. Столбец выделится, появит~я контекст
ное меню. _
2. В нем, выберем команду Cut (Вырезать).
з. С помощью правой клавиши активизируем перемен
ную четвертого столбца. Столбец выделится, и откро
ется меню.
4.Тут же выбираем команду Paste (Вставить). И пере менная SUM сразу же перекочевала из третьего столб
ца в четвертый.
5.Пометим переменную в третьем столбце, присвоив ей
имя, тип переменной - «числовой» с длиной 10 и
,количеством знаков после запятой О, метку перемен ной, формат столбца - ширина 10 и выравнивание
вправо, шкала измерений - порядковая.
,Таким же образом осуществим копирование введенных
данных из первого и второго столбцов в третий столбец. Для
этого выделим с помощью «мыши» данные в первом столбце.
Выберем команду Сору (Копировать).
Установим курсор в начале третьего столбца, щелкнем
клавишей и в контекстном меню выберем команду Paste, тем
самым вставив данные из первого столбца в третий. После довательно скопируем данные из второго столбца в продол же~ие третьего столбца. Таким образом, все наши данные
внесены в один общий столбец. Расставим значения группи-
7'
рующей переменной, о которых мы условились ранее: 1 и 2.
Группирующая !1еременная - своеобразная метка: все
24 |
Медицинская статистика |
данные, отнесенные к первой выборке, мы помечаем
единицей, а ко второй - двойкой.
Вновь сохраним данные, щелкнув по значку дискета
(Save -.сохранить) на панели инструментов. У нашего фай
ла уже есть имя, и в силу этого система выполнила это дей
ствие автоматически, задача полностью решена.
• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
ОСОБЕННОСТИ ИСПОЛЬЗОВАНИЯ ПАКЕТА
STATISTICA FOR WINDOWS
Пакет Statistica, как и предыдущий - SPSS, имеет мо
дульную структуру, и модулей у него большое количество,
а размещение на платформе Windows обеспечивает связь
пакета Statistica практически со всеми. Windоws-приложе
ниями [15].
К несомненным достоинствам пакета Statistica for Windows можно отнести большой выбор методов обработ
ки данных: от достаточно простых приемов описательной
статистики до сложных методов многомерного анализа и
планирования эксперимента. Кроме всего прочего, осо
бенность пакета Statistica for Windows и в том, что он как
никакой другой имеет широчайшие графические возмож ности и хорошую методическую базу на русском языке.
Недостатки этого пакета, как и пакета SPSS, все те же:
отсутствие ряда широко применяемых в нашей стране ста тистических методов обработки данных, ограничения при
вводе данных, еще - «пиратские» копии практически не
русифиuироваliы, а лицензионная русифиuированная пол
Haя разработка пакета дос.таточно дорога для массового потребителя. И все же, несмотря на эти издержки, дан ный пакет в ряду наиболее востребованных, в том числе и
в медико-биологических исследованиях.
Остается большой загадкой, что аналитические центры
ни Министерства здравоохранения и социального разви
тия, ни Министерства образования России до сих пор не
разработали методические указания для массового исполь
зования указанных статистических пакетов в практическом
Глава 3. Компьютеры в медика-биологической статистике |
25 |
здравоохранении, в научных учреждениях и учебных заве дениях среднего и высшего медицинского и биологическо
го образования.. Это, во-первых, значительно подняло бы
культуру труда специалистов всех рангов, во-вторых, объек
тивизировало бы получаемые' данные, сбор и обработка и |
|
, |
. |
анализ которых оставляют желать лучшего.
В настоящее время разработано шесть версий Statistica for Windows, как ранние, '!ак и последние версии при ре
шении задач вполне совместимы без особых сложностей.
Стартовое окно пакета служит для выбора одного из статистических модулей и называется Statistica Module switcher (Переключатель модулей пакета «Статистика») .
в каждой из шести версий имеется следующий и обя
зательный набор модулей:
•OCJ::l0BHble статистики и таблицы (Basic Statistic and Tables);
•непараметрические критерии и подгонка распреде
лений (Nonparametric Statistic& Distribution Fitting);
•одно- И многофакторный дисперсионный анализ
(ANOVA/MANOVA);
•линейная регрессия (Linear Regression);
•канонический дискриминантный анализ (Canonical
Analysis);
•кластерный анализ (Cluster Analysis);
•управление данными (Data Management);
•дискриминантный функциональный анализ (Discri-
minant Function Analysis);'
•факторный анализ (Factor Analysis).
Наиболее часто используемые кнопки при начале ана-
лиза данных:
•Переключиться в... (Switch То...);
•Список для выбора (Customize List);
•Закончить выбор и переключиться в (End & Switch
То);
•Отказаться (Cancel).
Стандартная панель такая же, как и в пакете SPSS:
• файл, |
' |
Z& |
|
Медицинская статистика |
•правка,
•анализ,
•параметры,
•окно,
•помощь...
Особенностью данного пакета, как мы отметили ра
нее, является широкий спектр двух- и трехмерных графи ческих форм,
Процедура запуска пакета аналогична Spss. Посколь
ку в данной ситуации нам безразлично, какой· модуль
ВЮIючать, то начнем с .модуля «Основные статистики и
таблицы», Обычно при открытии пакета «выскакивает»
уже готовая таблица с данными из какого-то примера, на
ходящихся в изобилии I<аталоге (Examples).
Чтобы создать свой личный файл, нажимаем кнопку File (Файл) и в его меню - New Data (Файл новых дан
ных) присвоим ему |
имя Stanl-2 (автоматически к нему |
будет присоединено |
расширение «sta...»). |
Упражнение 2. • |
• • • • • • • • • • • • • • • • • • • • • • |
Создаем файл данных в пакете Statistica.
Сначала мы введем данные в отдельные столбцы табли
цы. Характерно: в отличие от SPSS размер матрицы дан ных в Statistica изначально ограничен десятью Cases (слу чаями) и 10-ю VariabIes (переменными). В нашем примере
число переменных излишне, а количество случаев надо уве
личить. Для упорядочения ситуации проделаем следующее:
•нажмем кнопку Cases (Случаи);
•выберем Add (Добавить), в поле Number ofCases to Add (Количество добавляемых случаев) введем чис
ло 5, а в поле Insert аНег Cases (Вставить после слу
чая) - цифру 10.
Таблица данных приобретет размеры 10 х 15. дналогич
но варьируется и количество переменных. Для тренировки
проделаем это, для чего:
•нажмем KHOI1KY Var5 (Переменные), в открывшемся подменю выберем команду Delete (Удалить) и в по-
Глава 3. Компьютеры в медико-биологической статистике |
27 |
лях From variabIe (От переменной) и То variabIe (До переменной), введем соответственно значения 4 и 10.
Тем самым мы удалили переменные с ном~рами 4-10,
и таблица изменила размер: 3 х 15.
Опредеnениепер~менных
Переменные в пакете Statistica for Windows изначально
имеют звания VAR 1, VAR2, VAR3 и т. д. Эти обозначения
можно менять по своему усмотрению, щелкнув п·о названию
переменно. Откроется окно, в котором вы сможете произ
вести перенастройку. Напоминаем: название переменной
не может содержать боnее 8 симвоnов, и лучше - анг
лийское написание. Дело в том, что и данный пакет, как и
предыдущий, дает сбои, если исследователем используется
в названиях случаев и переменных русский алфавит.
Гораздо лучше уже Ilосле обработки данных перед вы
водом на печать русифицировать название таблиц, графи
ков. Так как наши данные имеют числовой тип и представ
ляют двузначные числа в поле Width (Общая ширина), надо
ввести значение 2.
Будьте готовы к тому, что столбец может автоматически
сузиться и не будет соразмерен названию переменной. Для
этого полю переменной надо задать адекватную ширину.
В поле Decimal (Количество десятичных знаков после запя
той) для обеих переменны x зададим о. в поле Data (Дата)
зададим формат ВВОДИМЫХ значений.
В поле Long Name (Ilолное - длинное - имя) можно
ввести Label (Метку) Ilеременной, в этом варианте ее «длин
ное» название будет выводиться при подытоживании резуль
татов. Введем те же самые метки, что и в предыдущем при
мере. Кстати, сюда же можно вводить и формулы.
В пакете Statistica можно оперировать метками отдель
ных значений переменной, задавать текстовые названия для
числовых результатов измерений. Введем (для тренировки)
новую переменную с именем SUM, присвоим ей метку «Груп-
11ИРУЮЩая 11еременная», тип ..... числовой с длиной 1 и коли
чеством знаков после запятой о. Для этой цели в диалоговом
28 |
Медицинская статистика |
окне нажмем кнопку Text Values (Текстовые значения) и вве
дем текстовые названия, числовые значения и их метки.
По условиям разработчиков текстовые названия не дол
жны выходить за пределы восьми символов, а длина меток
числовых значений - 40 символов. Новая строка вводится
клавишей Insert. nOтренируемся, вводя несколько значений
1 и 2. В таблице показываются сами значения, а чтобы пе
рейти к их текстовым названиям, t:tажмем на панели инстру
ментов кнопку Тext Value (Текстовые названия). двтомати
чески появляются не числовые значения, а их названия. По
вторное нажатие кнопки возвращает нас к числовым
значениям.
И вновь, как и в предыдущем примере, на этом опреде
ление используемых переменных нами закончено. Сохраним введенные данные в файле для дальнейшей работы с ним.
Приемы редактирования данных в пакете аналогичны соот
ветствующим для пакета SPSS.
• • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •
Говорят, что лучший опыт - это личный опыт, хотя
подчас и горький, поэтому проделайте изложенное выше
несколько разд.лЯ эакреrшения, не боясь ошибиться. Увы, обработка статистических данных - процедура практичес кая и требует систематической тренировЮf и упорства, так что не унывайте, если не получится сразу. Как говорили древние: per Лsреса ad Astra - через тернии - к звездам!