Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Медицинская_статистика_Жижин_К_С_

.pdf
Скачиваний:
1
Добавлен:
24.03.2024
Размер:
8.17 Mб
Скачать

Глава 3. Компыотеры в медико-биологической статистике

19

При выделении пиктограммы появляется подсказка,

содержащая название команды. Любое действие в SPSS

можно выполнить с помощью текстового менюипи пане­

ли инструментов. Таким образом, пользователь может оп­

тимизировать свою работу, выбирая для себя наиболее

удобные способы действий. Когда что-то становится не­

понятным, есть соблазн обратиться к Справке (Help): не

рекомендуем этого делать.

И вот почему: даже если ваша версия русифицирова­

на, из справочного материала вы все равно не сможете

извлечь никакой пользы, поскольку переводы делают не­

профессионалы, и по сути это H~ настоящий перевод, а

поДстрочник, т. е. буквальный перевод английских фраз,

нуждающийся в дополнительном профессиональном

разъяснении смысла того, что переведено.

Рассмотрим последовательно основные операции по работе с данными

Результаты измерений в окне при запуске пакета пред­

стамены в виде прямоyroльной таблицы или матрицы дан­ ных. Информация, внесенная по вертикали: в столбцы -

Ilеременные (признаки), а по строкам - наблюдения (из­

меренные результаты). Количество строк и столбцов в па­

кете может быть большим, но, конечно, не бесконечным.

Все случаи уже автоматически пронумерованы с левой сто­

роны, поэтому исследователь избавлен от этой утомитель­

ной процедуры.

Характерная особенность описываемого пакета в том,

что исследователь может вводить свои данные двумя спо­

собами:

-в отдельные столбцы;

-в один и тот же столбец.

В последнем случае для каждой группы данных в со­ седнем столбце указывается номер ее выборки, т. е. зна­

чение так называемой группирующей (Grouping УаПаЫе).

Она, как маркер, позволяет отличать выборки друг от дру­

га: 1, 2, 3 и т. Д.

20

Медицинская статистика

Выбор стратегии ввода данных (с использованием

группирующей переменной или без нее) зависит от пла­ нируемого метода обработки, поэтому на практике (напри­

мер, при решении примеров, приведенных в последую­

щих главах) суть методики ввода данных в макет таблицы

определяется самим исследователем.

Упражнение 1. • • • • • • • • • • • • • • • • • • • • • • •

Тренировочный ввод данных в таблицу пакета·SPSS

Получены исходные данные числа положительных·нахо-

док кишечной палочки в смывах с инвентаря и (JocYAbI сто­

ловых двух 110левых станов «А» и «В»:

Nt А А в А в

1

24

35

3

35

24

5

33

22

2

43

34

4

19

20

6

26

28

Введем эти исходные данные в матрицу данных пакета в

отдельные столбцы. Переменные в этом случае получают ремарку типа уагООО 1••. vагОООЗ и т. д.

К слову сказать, исследователь может названия изме­

нить .по ходу обработки данных.

Для задания характеристик переменной надо, подведя

курсор к ее названию, дважды щелкнуть левой кнопкой мыши.

Открыв диалоговое окно, выполним следующие действия:

1. BBeдe~ имя переменной. Вам надо быть готовым к

..,

тому, что сразу возникают ограничения: имя переменнои

доnжно содержать не боnее 8 симвоnов! И хотя пакет ру­

сифицирован, с русскими названиями возникают проблемы.

Исходя из зтого, лучше присваивать переменным англоязыч­ ные имена. Например: Stan 1, Stan2.

2. Зададим тип данных, кнопкой Туре (ТИll данных). Дан­

ные в принципе могут ВКЛlQчать бесконечное собрание ти­

пов, в медицинских исследованиях часто встречаются сле­

дующие:

Numeric (Числовой) - для него важно иметь Width

(Общая длина), или количество десятичных знаков

после запятой;

Глава З. Компьютеры в медико-биологической статистике

21

String (Текстовой) - для него задается только об­

щая длина;

Date (Тип даты) - с конкретным форматом резуль­

тата.

Наши данные - числовые (двузначные числа), и мы за­

даем для них числовой ТИll С длиной «два» ·и «нулевым» ко­

личеством знаков после запятой.

з. Вводим Labels (Метки) - они отражают комментарии, поясняющие смысл переменной. Для переменной Stan1 вве­

дем метку «Полевой стан 1», а Для переменной Stan2 -

«Полевой стан 2». Метки будут «всплывать» как подсказки,

стоит только подвести курсор к названию переменной и се­

кунду подождать.

Есть одно «но»: нецелесообразно вводить метки для от­

дельных значений переменных, но в порядке эксперименти­

рования можно ввести новую условную переменную в тре­

тьем столбце. Пусть это будет переменная, которую назо­

вем SUM, прис·воив ей метку: «Новая "еременная», зададим ей тип: числовая с количеством знаков после запятой О, а ее

значениям присвоим следующие метки: 1 - «Полевой стан

1»,2- «Полевой стан 2».

Для задания меток значений надо ввести в соответству­

ющие поля используемое значение и название его метки, а

затем нажать Add (Добавить). Для тренировки введем не­

сколько значений 1 и 2 для переменной SUM.

В таблице показываются сами эти числовые значения~ Чтобы перейти от них к меткам, жмем кнопку Value Labels

(~етки значений). Автоматически покажутся не числовые значения, а их метки. Отжав второй раз кнопку (Метки зна­

чений), вернемся вновь к числовому представлению данных.

Бывает так, что в подборке данных появляются «окна», т. е. пропущенные данные (невнимательность исследовате­ ля, сбои в регистрирующей аппаратуре и т. д.). Эти огрехи в SPSS можно сгладить способом обработки эмпирического

материала с пропущенными значениями. Нажимаем кнопку

Missing Values (Пропущенные значения), и дальнейшая ста­

"гистическая обработка ведется с учетом данной особеннос­

ти Вtilборки.

zz

Медицинская статистика

в данном примере нам ее использовать нет смысла.

Определим формат столбца: Columll Format (Формат

столбца). Можно задать Column width (UJирина столбца),

Text аligпmепt (Способ выравнивания данных). Зададим, к

примеру, ширину, равную б. Выравниваем данные по пра­

вому краю, для этого «включим» флажок Right (Вправо).

Если данные достаточно однородны и их немного, как в на­

шем примере, можно осуществить процесс выравнивания по

центру - «включив» флажок Center.

Для определения типа используемой измерительной

шкалы существует блок полей Measurement (Тип шкалы).

Шкалирование по сути Оllределяет все дальнейшие спосо­

бы математической обработки эмпирических данных. Ilакет

SPSS предлагает следующие типы шкал:

Scale (непрерывную, интервальную),

Огdiпаl (порядковую),

Nоmiпаl (номинальную).

Использование интервальных шкал в медицине в насто­

ящее время ограничено очень узким кругом научных иссле­

дований. Шире используются порядковы'е, как в нашем слу­ чае, поэтому, естественно, задать значение «Порядковая».

На этом определение переменных нами закончено.

Теперь необходимо осуществить процедуру сохранения данных в файле. Она позволит обеспечить дальнейшую ра­ боту с цифрами. Это можно сделать несколькими спосо­ бами:

1) Активизировать на стандартной IlанеJIИ значок, на

котором изображена дискета.

2)Или рядом, слева активизировав значок File (Файл), ВЫllОЛНИТЬ в его меню команду Save (Сохранить).

В любом случае при первом сохранении открывается

диалоговое окно для определения маршрута размещения

файла и определения его имени. Выберем папку, к 1"lриме­

ру, «Мои документы), но лучше - «SPSS)), а в качестве

имени - «упражнение 1)).

После этой процедуры имя файла появляется на площа­

ди окна.

Глава З. Компьютеры в меДико-биологической статистике

21

Внесение 'дальнейших изменений в файл системой от­

слеживается автоматчески: новый вариант фаЙ.аа будет по­

мещен под тем же именем и в той же папке, по тому же мар­

шруту размещения.

 

Редактирование данных

 

Введем наши данные вторым способом

в один об-

щий столбец с использованием группирующей переменной~

Группирующая переменная SUM у нас уже определена.

Переместим ее из третьего столбца в четвертый:

1. Щелкнем правой клавишей мыши по названию пере­

менной SUM. Столбец выделится, появит~я контекст­

ное меню. _

2. В нем, выберем команду Cut (Вырезать).

з. С помощью правой клавиши активизируем перемен­

ную четвертого столбца. Столбец выделится, и откро­

ется меню.

4.Тут же выбираем команду Paste (Вставить). И пере­ менная SUM сразу же перекочевала из третьего столб­

ца в четвертый.

5.Пометим переменную в третьем столбце, присвоив ей

имя, тип переменной - «числовой» с длиной 10 и

,количеством знаков после запятой О, метку перемен­ ной, формат столбца - ширина 10 и выравнивание

вправо, шкала измерений - порядковая.

,Таким же образом осуществим копирование введенных

данных из первого и второго столбцов в третий столбец. Для

этого выделим с помощью «мыши» данные в первом столбце.

Выберем команду Сору (Копировать).

Установим курсор в начале третьего столбца, щелкнем

клавишей и в контекстном меню выберем команду Paste, тем

самым вставив данные из первого столбца в третий. После­ довательно скопируем данные из второго столбца в продол­ же~ие третьего столбца. Таким образом, все наши данные

внесены в один общий столбец. Расставим значения группи-

7'

рующей переменной, о которых мы условились ранее: 1 и 2.

Группирующая !1еременная - своеобразная метка: все

24

Медицинская статистика

данные, отнесенные к первой выборке, мы помечаем

единицей, а ко второй - двойкой.

Вновь сохраним данные, щелкнув по значку дискета

(Save -.сохранить) на панели инструментов. У нашего фай­

ла уже есть имя, и в силу этого система выполнила это дей­

ствие автоматически, задача полностью решена.

• • • • • • • • • • • • • • • • • • •

ОСОБЕННОСТИ ИСПОЛЬЗОВАНИЯ ПАКЕТА

STATISTICA FOR WINDOWS

Пакет Statistica, как и предыдущий - SPSS, имеет мо­

дульную структуру, и модулей у него большое количество,

а размещение на платформе Windows обеспечивает связь

пакета Statistica практически со всеми. Windоws-приложе­

ниями [15].

К несомненным достоинствам пакета Statistica for Windows можно отнести большой выбор методов обработ­

ки данных: от достаточно простых приемов описательной

статистики до сложных методов многомерного анализа и

планирования эксперимента. Кроме всего прочего, осо­

бенность пакета Statistica for Windows и в том, что он как

никакой другой имеет широчайшие графические возмож­ ности и хорошую методическую базу на русском языке.

Недостатки этого пакета, как и пакета SPSS, все те же:

отсутствие ряда широко применяемых в нашей стране ста­ тистических методов обработки данных, ограничения при

вводе данных, еще - «пиратские» копии практически не

русифиuироваliы, а лицензионная русифиuированная пол­

Haя разработка пакета дос.таточно дорога для массового потребителя. И все же, несмотря на эти издержки, дан­ ный пакет в ряду наиболее востребованных, в том числе и

в медико-биологических исследованиях.

Остается большой загадкой, что аналитические центры

ни Министерства здравоохранения и социального разви­

тия, ни Министерства образования России до сих пор не

разработали методические указания для массового исполь­

зования указанных статистических пакетов в практическом

Глава 3. Компьютеры в медика-биологической статистике

25

здравоохранении, в научных учреждениях и учебных заве­ дениях среднего и высшего медицинского и биологическо­

го образования.. Это, во-первых, значительно подняло бы

культуру труда специалистов всех рангов, во-вторых, объек­

тивизировало бы получаемые' данные, сбор и обработка и

,

.

анализ которых оставляют желать лучшего.

В настоящее время разработано шесть версий Statistica for Windows, как ранние, '!ак и последние версии при ре­

шении задач вполне совместимы без особых сложностей.

Стартовое окно пакета служит для выбора одного из статистических модулей и называется Statistica Module switcher (Переключатель модулей пакета «Статистика») .

в каждой из шести версий имеется следующий и обя­

зательный набор модулей:

OCJ::l0BHble статистики и таблицы (Basic Statistic and Tables);

непараметрические критерии и подгонка распреде­

лений (Nonparametric Statistic& Distribution Fitting);

одно- И многофакторный дисперсионный анализ

(ANOVA/MANOVA);

линейная регрессия (Linear Regression);

канонический дискриминантный анализ (Canonical

Analysis);

кластерный анализ (Cluster Analysis);

управление данными (Data Management);

дискриминантный функциональный анализ (Discri-

minant Function Analysis);'

факторный анализ (Factor Analysis).

Наиболее часто используемые кнопки при начале ана-

лиза данных:

Переключиться в... (Switch То...);

Список для выбора (Customize List);

Закончить выбор и переключиться в (End & Switch

То);

Отказаться (Cancel).

Стандартная панель такая же, как и в пакете SPSS:

файл,

'

Z&

 

Медицинская статистика

правка,

анализ,

параметры,

окно,

помощь...

Особенностью данного пакета, как мы отметили ра­

нее, является широкий спектр двух- и трехмерных графи­ ческих форм,

Процедура запуска пакета аналогична Spss. Посколь­

ку в данной ситуации нам безразлично, какой· модуль

ВЮIючать, то начнем с .модуля «Основные статистики и

таблицы», Обычно при открытии пакета «выскакивает»

уже готовая таблица с данными из какого-то примера, на­

ходящихся в изобилии I<аталоге (Examples).

Чтобы создать свой личный файл, нажимаем кнопку File (Файл) и в его меню - New Data (Файл новых дан­

ных) присвоим ему

имя Stanl-2 (автоматически к нему

будет присоединено

расширение «sta...»).

Упражнение 2. •

• • • • • • • • • • • • • • • • • • • • • •

Создаем файл данных в пакете Statistica.

Сначала мы введем данные в отдельные столбцы табли­

цы. Характерно: в отличие от SPSS размер матрицы дан­ ных в Statistica изначально ограничен десятью Cases (слу­ чаями) и 10-ю VariabIes (переменными). В нашем примере

число переменных излишне, а количество случаев надо уве­

личить. Для упорядочения ситуации проделаем следующее:

нажмем кнопку Cases (Случаи);

выберем Add (Добавить), в поле Number ofCases to Add (Количество добавляемых случаев) введем чис­

ло 5, а в поле Insert аНег Cases (Вставить после слу­

чая) - цифру 10.

Таблица данных приобретет размеры 10 х 15. дналогич­

но варьируется и количество переменных. Для тренировки

проделаем это, для чего:

нажмем KHOI1KY Var5 (Переменные), в открывшемся подменю выберем команду Delete (Удалить) и в по-

Глава 3. Компьютеры в медико-биологической статистике

27

лях From variabIe (От переменной) и То variabIe (До переменной), введем соответственно значения 4 и 10.

Тем самым мы удалили переменные с ном~рами 4-10,

и таблица изменила размер: 3 х 15.

Опредеnениепер~менных

Переменные в пакете Statistica for Windows изначально

имеют звания VAR 1, VAR2, VAR3 и т. д. Эти обозначения

можно менять по своему усмотрению, щелкнув п·о названию

переменно. Откроется окно, в котором вы сможете произ­

вести перенастройку. Напоминаем: название переменной

не может содержать боnее 8 симвоnов, и лучше - анг­

лийское написание. Дело в том, что и данный пакет, как и

предыдущий, дает сбои, если исследователем используется

в названиях случаев и переменных русский алфавит.

Гораздо лучше уже Ilосле обработки данных перед вы­

водом на печать русифицировать название таблиц, графи­

ков. Так как наши данные имеют числовой тип и представ­

ляют двузначные числа в поле Width (Общая ширина), надо

ввести значение 2.

Будьте готовы к тому, что столбец может автоматически

сузиться и не будет соразмерен названию переменной. Для

этого полю переменной надо задать адекватную ширину.

В поле Decimal (Количество десятичных знаков после запя­

той) для обеих переменны x зададим о. в поле Data (Дата)

зададим формат ВВОДИМЫХ значений.

В поле Long Name (Ilолное - длинное - имя) можно

ввести Label (Метку) Ilеременной, в этом варианте ее «длин­

ное» название будет выводиться при подытоживании резуль­

татов. Введем те же самые метки, что и в предыдущем при­

мере. Кстати, сюда же можно вводить и формулы.

В пакете Statistica можно оперировать метками отдель­

ных значений переменной, задавать текстовые названия для

числовых результатов измерений. Введем (для тренировки)

новую переменную с именем SUM, присвоим ей метку «Груп-

11ИРУЮЩая 11еременная», тип ..... числовой с длиной 1 и коли­

чеством знаков после запятой о. Для этой цели в диалоговом

28

Медицинская статистика

окне нажмем кнопку Text Values (Текстовые значения) и вве­

дем текстовые названия, числовые значения и их метки.

По условиям разработчиков текстовые названия не дол­

жны выходить за пределы восьми символов, а длина меток

числовых значений - 40 символов. Новая строка вводится

клавишей Insert. nOтренируемся, вводя несколько значений

1 и 2. В таблице показываются сами значения, а чтобы пе­

рейти к их текстовым названиям, t:tажмем на панели инстру­

ментов кнопку Тext Value (Текстовые названия). двтомати­

чески появляются не числовые значения, а их названия. По­

вторное нажатие кнопки возвращает нас к числовым

значениям.

И вновь, как и в предыдущем примере, на этом опреде­

ление используемых переменных нами закончено. Сохраним введенные данные в файле для дальнейшей работы с ним.

Приемы редактирования данных в пакете аналогичны соот­

ветствующим для пакета SPSS.

• • • • • • • • • • • • • • • • • • • • • • • •

Говорят, что лучший опыт - это личный опыт, хотя

подчас и горький, поэтому проделайте изложенное выше

несколько разд.лЯ эакреrшения, не боясь ошибиться. Увы, обработка статистических данных - процедура практичес­ кая и требует систематической тренировЮf и упорства, так что не унывайте, если не получится сразу. Как говорили древние: per Лsреса ad Astra - через тернии - к звездам!