3.5. Підготовка даних до обробки

Інформацію, отриману під час опитування, готують до подальшої обробки. Зібрана інформація має відповідати вимогам повноти, надійності, технологічності,

Під час вивчення дослідник часто стикається з відмовою частини респондентів брати участь в опитуванні або відповідати на окремі запитання. Через це необхідно на стадії конструювання інструментарію ретельно будувати запитання. Важливу роль відіграють також психологічні фактори взаємовідносин між анкетером (інтерв’юером) та респондентом, час і місце проведення опитування. Одержати всі відповіді майже ніколи не вдається. Тому після проведення опитування здійснюють контроль повноти даних і вибраковують анкети з надмірною кількістю “пропусків”.

Загальних норм, стандартів наповнення інструментарію немає. Дослідник має їх визначити для себе сам, виходячи з поставлених завдань та вибраних статистичних методів обробки. Як правило, вимоги до наповнення відкритих запитань суб’єктивного характеру (думка, погляди читача) не можуть бути високими, тому що багато респондентів залишають їх без відповіді, не маючи чіткої точки зору.

Під надійністю даних розуміють, по-перше, відповідність структури вибірки структурі генеральної сукупності, по-друге, змістовну однаковість інтерпретації запитань і відповідей дослідником і респондентом, по-третє, точність і логічну несуперечливість відповідей.

Якщо структура генеральної сукупності відома, під час формування вибірки та проведення опитування стежать за дотриманням пропорційної відповідності соціально-демографічного складу респондентів цій структурі. Незважаючи на це, бажано ще раз перевірити вже зібраний матеріал, одержати кількісні показники реального складу респондентів і, якщо виявлено розбіжності із структурою генеральної сукупності, виконати так званий ремонт вибірки.

Є два способи “відремонтувати” вибірку: за допомогою вилучення документів (заповнених бланків інструментарію) з масиву та за допомогою додаткового опитування.

Обсяг вибіркової сукупності слід визначати з деяким запасом (10—20 % для анкетних опитувань) для компенсації втрат, які будуть спричинені вибракуванням певної частини анкет під час перевірок. Якщо відхилення від вибірки невеликі, користуючись запасом обсягу вибірки і вилученням відповідних анкет з масиву, вирівнюють структуру вибірки. Для цього беруть за основу соціально-демографічну групу з найбільш заниженою квотою у вибірці і відносно неї перераховують в абсолютних числах, якими б за обсягом мали бути інші групи пропорційно до структури генеральної сукупності. За кожною групою підраховують різницю між її теоретичним та наявним (перебільшеним) розміром і так визначають, скільки анкет з кожної групи треба вилучити. Випадковим способом або підрахунком інтервалу (кроку) визначають порядкові номери анкет, що вилучаються, окремо в кожній скорочуваній групі.

Інколи роблять додаткове опитування, відбираючи респондентів, які мають представляти недостатньо заповнені у вибірці соціально-демографічні групи. Анкети, одержані під час додаткового опитування, перевіряють на якість даних, як і анкети основного масиву.

Причиною для вибраковування анкети може бути не тільки велика кількість “пропусків”. Деякі люди відповідають навмання, трапляються й “жартівники”. Інколи людина не зовсім точно зрозуміла запитання, у підкреслений варіант вкладає трохи інший зміст, ніж складач анкети, або вважає, що запитання сформульовано недостатньо гостро, не актуально, і тому відповідає на своє власне запитання, більш “правильне”.

Фальсифікацію анкет можна розпізнати за змістом відповідей, особливо відкритих. Якщо в масиві, одержаному з одного населеного пункту, є подібні анкети, роблять припущення, що їх заповнювала одна людина. Припускають також, що ця людина — респондент, тому одну анкету залишають, як його власну, а решту (“за іншого”) вилучають з подальшої обробки. Коли ж виявляється, що фальшиві анкети вигадував анкетер (таке іноді трапляється в масштабних дослідженнях із одноразовим залученням тимчасових помічників у ролі анкетерів та інтерв’юерів), ці анкети вибраковують усі.

Вилучаються й анкети, заповнені несерйозно, поспіхом, “аби відчепилися”. Їх можна розпізнати за характерними відповідями на відкриті запитання (або коли таких відповідей майже немає), за логічною суперечливістю відповідей на пов’язані між собою запитання. Але треба приймати рішення про відбраковку виважено, обережно. Може статися, що вся анкета заповнена вдумливо, а два-три запитання викликали іронію респондента лише через їх недосконалу побудову. Цілком імовірно, що і для решти респондентів ці запитання мали дещо дивний або недоречний вигляд, тобто не “спрацювали” так, як передбачалося. У такому разі можна прийняти рішення про відмову від статистичної обробки саме цих запитань. Щоб не було таких неприємних сюрпризів, недосконалість інструментарію намагаються виявити у пробному (пілотажному) дослідженні.

Технологічністю даних називають можливість оперативно й легко працювати з відповідями. Для цього необхідно, щоб варіанти відповідей були позначені одноманітно, чітко, відкриті відповіді вписані зрозумілим почерком, сформульовані ясно і не допускали подвійного тлумачення. Забезпечення цих вимог особливо важливе, коли анкети кодуються та вводяться в ЕОМ операторами, що не мають безпосереднього відношення до дослідження. Тому виникає потреба виконати технічну корекцію відповідей. Анкети можуть містити механічні огріхи респондентів — відповідь помилково занесена у поле сусіднього запитання, вписана дуже нерозбірливо, містить вузькопрофесійні абревіатури (такі як скорочена назва місця роботи), маловідомі слова одного з розмовних діалектів тощо. Такі відповіді редагують, а якщо це неможливо — вибраковують анкету.

Після перевірки якості інформації підраховують кількість документів у робочому масиві (кожний вид документа — анкети, бланки інтерв’ю, картки аналізу формулярів — окремо), одночасно нумеруючи їх. Якщо документи логічно взаємопов’язані між собою — наприклад, опитували читачів, чиї формуляри потрапили у вибірку для аналізу — на них проставляють однакові номери. До речі, такі документи вилучати з масиву треба всі разом, якщо бракується хоча б один із них. Нумерація необхідна, якщо обробка здійснюється за допомогою ЕОМ. При виявленні помилок у комп’ютерній копії масиву даних лише номер анкети дає можливість звернутися до першоджерела на папері.

Підготовка масиву до статистичного аналізу завершується процедурою кодування відповідей. Для повноцінного використання статистичних методів необхідно, щоб початкові дані були формалізовані, тобто подані у вигляді чисел, інтервалів або уніфікованих варіантів. Формалізовані відповіді становлять так звану кількісну (математичну) модель якісних властивостей досліджуваного об’єкта.

Процес формалізації починається ще на етапі підготовки інструментарію, коли “кристалізуються” списки варіантів майбутніх напівзакритих і закритих запитань. Після одержання всього масиву зібраних даних і перевірки його якості закривають усі відкриті запитання. Ця робота складається з трьох частин: підготовка списків відповідей, класифікація (узагальнення) відповідей, “заміна” відповідей респондентів їхніми формалізованими аналогами (кодування).

Класифікацію проводять для кожного запитання окремо. Виняток становлять запитання, які мають спільну предметну основу, наприклад, якщо пропонувалося респонденту назвати газети, які він передплачував у минулому році, передплачує тепер і які збирається передплачувати у наступному році, то ці три запитання доцільно закривати спільно.

Усі відповіді виписують в окремий список безповторним способом, тобто тотожні за змістом формулювання подаються лише одним прикладом, але з підрахованою кількістю повторів (частотою). Рахунок ведеться на папері за допомогою “паличок”. Можуть траплятись формулювання, в яких міститься фактично декілька відповідей. Такі формулювання розбивають на прості неподільні вислови, які починають фігурувати в загальному списку окремо один від одного.

Одержаний список детально аналізують з метою узагальнення відповідей, тобто об’єднання їх у характерні смислові групи, у більш загальні класи. Фактографічна інформація класифікується, як правило, легше, ніж особисті думки, погляди, пропозиції респондентів.

Обробку відкритих запитань найчастіше закінчують узагальненням відповідей. Одержані частоти переводять у відсотки, а у звіті аналізують їх лише в порівнянні між собою, не маючи можливості простежити зв’язки з іншими запитаннями анкети. Таке вимушене обмеження пов’язане з високою трудомісткістю ручної обробки даних.

Якщо планується побудування комбінаційних таблиць, після узагальнення відкритих відповідей одержаний список варіантів знову “розчиняють” у масиві анкет, тобто кожній відповіді в анкеті приписують відповідний варіант. Виконують цю процедуру за допомогою кодів, тому називається вона кодуванням відкритих відповідей, а формалізований список варіантів з кодами — кодифікатором. Комплексним формулюванням відповідатимуть одночасно декілька кодів. В анкеті заздалегідь передбачають вільні місця для майбутніх кодів біля кожного відкритого запитання. Користуються і таким прийомом: оцінюють імовірну кількість майбутніх формальних варіантів (наприклад, їх не може бути більше 5-7) і в такій же кількості поряд із запитанням друкують ланцюжок кодів, які наповнюватимуться конкретними значеннями після узагальнення відповідей.

Подальша робота залежить від запланованого способу обробки даних.

Системи кодування можна поділити на символьні і позиційні. У позиційній системі кожному варіанту анкети відведене місце (позиція) на спеціальній картці, і для фіксації даних ці позиції або заштриховують олівцем, або пробивають. Для обробки таких карток необхідне спеціальне обладнання.

Більш поширена символьна система кодування, в якій кожний варіант позначається певним символом, кодом. Під символом розуміють умовну позначку, яка може бути номером, літерою, коротким словом. Найпоширеніші цифрові коди, що зумовлено їх високою технологічністю (спрощується введення в ЕОМ). Коди не повинні повторюватися в межах одного запитання, можуть не повторюватися взагалі в межах всієї анкети (так зване наскрізне, або безперервне, кодування), і, навпаки, нумерація варіантів може починатися з одиниці у кожному наступному запитанні (періодичне кодування). Оскільки в наскрізній системі всі коди унікальні, для великих анкет (декілька десятків запитань) доводиться користуватися дво- і тризначними числами. Це дещо перевантажує інструментарій і уповільнює перенесення даних на машинні носії у порівнянні з компактнішою періодичною системою кодування, але дає можливість виявляти такі помилки операторів, як уведення коду в позицію іншого запитання.

При застосуванні персонального комп’ютера порядок попередньої підготовки масиву до обробки може бути дещо іншим. На комп’ютер можна перекласти рутинну роботу з перевірки репрезентативності вибірки, логічності відповідей. З’являється навіть така цінна можливість, як швидке закриття відкритих відповідей однією людиною: машина бере на себе складання списків відповідей і автоматичне кодування за кодифікатором (звичайно, не на папері, а лише у комп’ютерній пам’яті), соціологу залишається творча робота — класифікація, яка проводиться також за допомогою ЕОМ. Але, крім наявності відповідного програмного забезпечення, для використання таких можливостей необхідне введення повного масиву даних у комп’ютер до виконання всіх подальших процедур, тобто традиційно остання операція підготовки даних (уведення в ЕОМ) має бути першою. Зокрема відкриті иідповіді необхідно вводити в їх первісному вигляді. Деяка частка введених анкет пізніше виявиться вибракуваною. Це все, звичайно, помітно збільшує обсяг роботи з перенесення даних на магнітний диск, але витрати потім повністю перекриваються оперативністю, зручністю і точністю обробки.

<<< < Предыдущая 8 9 10 11 12 13 14 15 16 17 18 1920 / 5220 21 22 23 24 25 26 27 28 29 30 31 32 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.02.2016336.2 Кб10Звіт2013.docx
#
11.02.201619.1 Кб205Здравствуйте,дети. Амонашвили Ш.А..docx
#
11.02.201634.64 Кб51ЗМІСТ и ввсе.docx
#
08.11.2019137.22 Кб1Зміст.doc2003.doc
#
05.09.201979.62 Кб1Зміст2.docx
#
18.08.2019596.75 Кб18Змістовний модуль 1.docx
#
11.02.20161.09 Mб7ЗНО-2015.pdf
#
11.02.201688.06 Кб39Зоопсихология_рефераты.doc
#
11.02.2016251.39 Кб142Зоопсихология_тезаурусы.doc
#
11.02.201691.41 Кб6зубарева реферат сурдо ист.docx
#
11.02.201648.72 Кб5Игорь НДЗ.docx