Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Научное исследование для студентов.doc
Скачиваний:
16
Добавлен:
19.11.2019
Размер:
2.32 Mб
Скачать

1.3. Проверка данных

После создания таблицы на бумаге или компьютере необходимо прове­рить качество полученных данных. Для этого часто достаточно вниматель­но осмотреть массив данных. Начать проверку следует с выявления оши­бок (описок), которые заключаются в том, что неправильно написан поря­док числа. Например, 100 написано вместо 10, 9,4 - вместо 94 и т. п. При внимательном просмотре по столбцам это легко обнаружить, поскольку сравнительно редко встречаются параметры, которые сильно варьируют. Чаще всего значения одного параметра имеют один порядок или ближай­шие порядки. При наборе данных на компьютере важно соблюдать требо­вания к формату данных в используемой статистической программе. Преж­де всего это относится к знаку, который должен отделять в десятичном чис­ле целую часть от дробной (точка или запятая).

Затем массив данных надо проверить на наличие «выскакивающих», вариант - выделяющихся значений, которые могли быть получены в резуль­тате неточных измерений, ошибок в записях, отвлечения внимания испыту­емого и т. д. Если обнаружены «подозрительные» значения, то принять обо­снованное решение об их выбраковке, используя достаточно мощный пара­метрический критерий t. Он рассчитывается по следующей формуле:

V – M

t = 0 > t st

где t - критерий выпада; V — выпадающее значение признака; М- средняя величина признака для всей группы, включающей артефакт; tst - стандарт­ные значения критерия выпадов, определяемые для трех уровней довери­тельной вероятности по таблице приложения 1. Смысл критерия в том, что­бы определить, находится ли данная варианта в интервале, характерном для большинства членов выборки, или же вне его.

Допустим, нами принят уровень значимости 0,05 (доверительная веро­ятность 0,95), а значение критерия составило 1.5. Поскольку 95 % вариант лежат в пределах М ± 1,96 о (1,5 меньше 1,96), то, следовательно, и данная варианта лежит в указанном интервале. Если же значение критерия боль­ше, например, 2,4, то это означает, что данное значение не относится к ана­лизируемой совокупности (выборке), включающей 95 % вариант, а есть про­явление иных закономерностей, ошибок и пр. и поэтому должно быть ис­ключено из рассмотрения.

Например, в эксперименте вы предлагаете решать мыслительные зада­чи и регистрируете в числе других параметров время решения. При про­смотре данных обнаруживаете, что у одного из испытуемых время решения заметно больше, чем у остальных. Это бывает связано с тем, что вместо решения очередной задачи испытуемый начинает «искать закономерность более широкого плана», «выводить общий принцип» или нечто подобное. Об этом он может сообщить, но может и не сообщить экспериментатору. Понятно, что время решения конкретной задачи при этом может сильно отличаться от средней величины. Если у вас есть предположение, что ре­зультаты какого-либо опыта, пробы обусловлены влиянием, которое вы не можете оценить или его оценка не входит в ваши планы, то вы окажетесь перед необходимостью принять обоснованное решение - включать полу­ченное численное значение в дальнейшую обработку или нет.

Предположим, в эксперименте были получены следующие значения не­которого параметра: 10,20, 20, 30, 30, 40,40, 50, 210. Следовательно, п = 9. Вычислили: М = 50, а = 61. Можно ли считать значение 210 выпадающим?

t = 210 – 50 = 2,6; ( по табл.) = 2,4 (для Р = 0,95;. 61

61

Следовательно, значение 210 может считаться выпадающим и должно быть исключено из дальнейшей обработки.

После исключения выпадающих значений первичные статистические параметры вычисляются заново.

Вопрос № 2

МАТЕМАТИКО-СТАТИСТИЧЕСКАЯ ОБРАБОТКА