Добавил:
udipliz@icloud.com во имя гнозии и офх Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Итоговое занятие ОНИ.docx
Скачиваний:
12
Добавлен:
27.11.2022
Размер:
176.09 Кб
Скачать

7 Методичка

Занятие 7. Основы теории случайных ошибок и методов оценки

случайных погрешностей в измерениях

Исследователь должен одновременно с производством опытов и

измерений проводить предварительную, а затем и окончательную обработку

результатов измерений, их анализ, что позволяет корректировать

эксперимент, контролировать и улучшать методику в ходе опыта.

Анализ случайных погрешностей основывается на теории случайных

ошибок. Он даёт возможность с определенной гарантией вычислить

действительное значение измеренной величины и оценить возможные

ошибки.

Основу теории случайных ошибок составляют следующие предположения:

– большие погрешности встречаются реже, чем малые, так как вероятность

появления погрешности уменьшается с ростом ее величины;

– при большом числе измерений случайные погрешности одинаковой

величины, но разного знака встречаются одинаково часто;

– при бесконечно большом числе измерений истинное значение измеряемой

величины равно среднеарифметическому значению всех результатов

измерений, а появление того или иного результата измерения как случайного

события описывается нормальным законом распределения.

Совокупность измерений может быть генеральной и выборочной.

Генеральная совокупность – это все множество возможных значений

изменений хi или возможных значений погрешности Δ хi.

При выборочной совокупности число измерений n ограничено и в

каждом случае строго определяется. Обычно считают, что если n > 30, то

среднее значение совокупности измерений x достаточно точно приближается

к истинному значению.

Теория случайных ошибок позволяет оценить точность и надежность

измерения при данном количестве замеров или определить минимальное

количество замеров, гарантирующее требуемую точность и надежность

измерений. Также необходимо исключить возможность появления грубых

ошибок и определить достоверность полученных результатов.

Измерения являются основой любого эксперимента. Каждый

экспериментатор должен знать закономерности измерительных процессов, а

именно:

• правильно измерить необходимые величины;

• оценить погрешности при измерениях;

• с требуемой точностью определить значения величин и их

минимальное количество;

• определить оптимальные условия измерений, при которых

погрешности будут минимальными;

• провести анализ результатов измерений, сделать предварительные

выводы.

Измерение – сравнение измеряемой величины с эталоном, нахождение её

соотношения с единицей измерения и определение значения этой величины в

заданных единицах.

Теорией и практикой измерений занимается специальная наука –

метрология, согласно которой все виды измерений классифицируются по

различным критериям.

По способу нахождения значения величины измерения делятся:

– на прямые измерения – измерения, при которых значения измеряемых

величин определяются непосредственно с помощью измерительных

приборов. Например, температура – термометром, артериальное давление –

тонометром, пульс – пульсоксиметром и т.д.

– косвенные измерения – измерения, при которых значение искомой

величины определяется по формуле, в которую входят величины,

подвергаемые прямым измерениям.

При косвенных измерениях определяют не саму величину, а те

величины, которые функционально с ней связаны. Затем значение величины

находят по определенной формуле .

Примером косвенных измерений служит определение индекса массы

тела (ИМТ) с помощью весов и ростомера. Здесь путем прямых измерений

находят значение веса и роста, а необходимую величину (ИМТ) определяют

по формуле: ИМТ=вес/рост(м)2

Помимо них в практике используются:

– совокупные измерения – проводимые одновременно измерения нескольких

одноименных величин, через которые, путем решения системы уравнений,

находят искомые значения величин. Совокупные измерения являются

разновидностью косвенных измерений;

– совместные измерения – производимые одновременно измерения

нескольких неоднородных величин с целью нахождения зависимости между

ними. При этом искомые величины находятся путем прямых или косвенных

измерений.

В зависимости от динамики измеряемой величины с течением времени

измерения разделяются:

− на статические, когда измеряемая величина остается постоянной во

времени;

− динамические – измеряемая величина изменяется с течением времени.

При динамических измерениях необходимо учитывать такое изменение

величины с течением времени. Для оценки точности результатов

динамических измерений необходимо знать динамические свойства средств

измерений.

По точности результатов измерения бывают:

− максимальной точности, достигаемой при существующем уровне

технических возможностей;

− контрольно-поверочные, погрешность которых не превышает некоторого

заданного значения;

− технические измерения, в которых погрешность определяется

характеристиками используемых приборов.

По способу выражения результатов различают:

– абсолютные измерения, основанные на прямых измерениях одной или

нескольких величин и (или) использовании значений физических констант;

– относительные измерения, определяемые отношением величины к

одноименной величине, играющей роль условной единицы (или

принимаемой за исходную).

Показателями качества измерений являются погрешность, точность,

правильность, сходимость и воспроизводимость измерений.

Погрешность измерения – это отклонение результата измерения от

истинного (действительного) значения величины. Синонимом термина

«погрешность» является термин «ошибка». По способу выражения

погрешности делятся на абсолютные и относительные.

Абсолютной погрешностью измерения называется разность между

результатом измерения и истинным значением измеряемой величины,

выраженная в единицах измеряемой физической величины. Обозначается

либо буквой Δ (дельта), либо буквами Δх и определяется как разница между

результатом измерения и значением измеряемой величины.

Абсолютная погрешность недостаточно характеризует качество

измерений, она позволяет только указать границы, в которых заключено

точное значение числа а: x − Δx ≤ a ≤ x + Δx .

В связи с этим вводится понятие предельной относительной

погрешности, которую называют просто относительной погрешностью.

Относительная погрешность измерения – это отношение абсолютной

погрешности к результату измерений (или действительному значению)

измеряемой величины. Определяется либо в относительных единицах, либо в

процентах.

Точность результатов измерений определяет их качество. Точность

тем выше, чем ближе к нулю погрешности результата измерения.

Термин «точность» применим лишь для сравнения результатов или

относительной характеристики методов измерений, например точность

измерения длины с помощью микрометра выше, чем при измерении с

помощью линейки.

Помимо точности, а также правильности, сходимости и

воспроизводимости измерений, еще одним показателем качества является

достоверность измерения. Она показывает вероятность отклонений

измерения от действительных значений и часто называется доверительной

вероятностью.

Чтобы точность и достоверность измерений увеличились, необходимо

уменьшить их погрешности. Погрешности при измерениях возникают

вследствие разных причин: несовершенства методов и измерительных

приборов, недостаточно тщательного проведения эксперимента, влияния

внешних факторов, субъективных особенностей экспериментатора и др.

Погрешности классифицируют на систематические, случайные и грубые

(промахи).

Систематические погрешности – это погрешности измерений, которые

при повторных измерениях остаются неизменными или изменяются по

известному закону. Если численные значения этих погрешностей известны,

их можно учесть во время повторных измерений. Например, к таковым

относятся инструментальные (приборные) погрешности. Если пользоваться

одним и тем же прибором, то инструментальная ошибка будет одна и та же.

Случайные погрешности – это погрешности, которые при повторных

измерениях одной и той же величины изменяются по значению и знаку

случайным образом. Они обусловлены совокупностью причин, трудно

поддающихся анализу, а также состоянием экспериментатора. Присутствие

случайных погрешностей обнаруживается при повторных измерениях в виде

некоторого разброса получаемых результатов. Оценку случайных

погрешностей производят на основе специальных статистических методов

обработки результатов измерений, разработанных на основе законов теории

вероятностей и математической статистики.

Грубые погрешности, или промахи, – это разновидность случайных

погрешностей. Они значительно выше систематических или случайных

погрешностей. Обычно промахи вызваны грубыми ошибками

экспериментатора, в расчет они не принимаются.

Основные принципы и методы устранения систематических и

случайных погрешностей.

Систематические погрешности можно разделить на пять основных групп:

I группа – инструментальные погрешности, связанные с нарушениями

средств измерений, неточностями шкал, износом приборов и отдельных

деталей.

II группа – погрешности, возникающие при неправильной установке

приборов.

III группа – погрешности, возникающие под воздействием внешней среды.

Например, высокая температура и влажность воздуха могут привести к

деформации шкалы прибора. Также могут сказаться влияние магнитных и

электрических полей, изменения атмосферного давления, вибрации от

движущегося транспорта и др.

IV группа – субъективные погрешности, возникающие вследствие

индивидуальных психических и физиологических свойств человека.

V группа – погрешности метода. Они появляются в результате

необоснованного метода измерений (например, при различных упрощениях

схем и методов, пренебрежении некоторыми внешними факторами).

Систематические погрешности нужно по возможности устранять, так

как они могут повлечь даже получение неправильных научных выводов из

полученных результатов. Для этого еще до начала эксперимента необходимо

провести ремонт оборудования, проверку всех элементов установки,

устранить нежелательные воздействия внешней среды. Должна быть

внимательно проработана теория и методика выполнения эксперимента.

Иногда устранить погрешности 1–3 групп можно, увеличив количество

измерений.

Для исключения систематических погрешностей применяют также

метод замещения – метод сравнения с мерой, в котором измеряемую

величину замещают мерой (эталоном) с известным значением величины.

Разница в измерениях определяет погрешность используемого прибора.

Если нельзя найти точное значение систематических погрешностей, то

ограничиваются их приблизительной оценкой. Кроме систематических при

измерениях неизбежно возникают случайные погрешности. Сюда же относят

промахи.

Наиболее типичными причинами промахов являются: неправильное

использование приборов, описки при записи полученных результатов, не

регламентируемые манипуляции с приборами (перестановка, замена

отдельных элементов и др.). Грубые погрешности могут возникать

вследствие неисправности приборов, а также внезапно изменившихся

условий эксперимента.

Теория вероятностей и математическая статистика дают возможность с

требуемой точностью вычислить истинное значение определяемой в

эксперименте величины и оценить возможные погрешности.

В основе теории вероятности лежат предположения о том, что

– при большом количестве измерений случайные отклонения величины в

большую и меньшую сторону встречаются с одинаковой частотой;

– большие отклонения встречаются реже, чем малые;

– при бесконечно большом количестве измерений истинное значение

измеряемой величины стремится к среднеарифметическому значению всех

результатов измерений.

Математические критерии оценки результатов эксперимента

Случайные погрешности обычно подчиняются закону нормального

распределения с математическим ожиданием, равным нулю. Графически

нормальное распределение представляется в виде кривой Гаусса.

Еще один показатель, позволяющий оценить точность проведенных

измерений, – доверительный интервал, т. е. интервал, в котором находится

истинное значение определяемой величины с заданной доверительной

вероятностью.

Вероятность того, что доверительный интервал заключает в себе

действительное значение величины, называется надежностью

доверительного интервала.

Статистическая обработка результатов исследования.

Приступая к статистической обработке полученных в ходе

исследования данных, мы столкнемся с 2 основными видами задач:

1.Как сжато описать данные?

2.И как подтвердить свои результаты?

Но перед тем как приступить к обработке большого количества

данных, полученных в ходе исследования, попытаемся структурировать

полученные данные.

Для этого познакомимся с понятием вариационного ряда.

Вариационный ряд - это однородная в качественном отношении

статистическая совокупность, отдельные единицы которой характеризуют

количественные различия изучаемого признака или явления.

Цифровое значение каждого отдельного признака или явления,

входящего в вариационный ряд, называется вариантой и обозначается буквой

V

Число наблюдений – n (выборочная совокупность)

N – количество единиц генеральной совокупности.

Число повторений каждой варианты – p

Пример 1. В кабинете сидят 14 студентов, измерим у них рост. Получим

следующие данные, отраженные в Таблице 1.

Таблица 1.

Измерение роста у 14 студентов

№ Рост, см

156

180

176

168

176

166

176

166

176

180

180

180

150

176

В таблице 1 представлены сводные данные, полученные в ходе

исследования. Так как студентов было всего 14 человек, то данные хорошо

структурированы, представим себе ситуацию, когда нужно измерить рост не

у одной группы студентов, а допустим курса (300 человек) или факультета

(1800 человек). Таблицы будут громоздкими, неудобными в чтении и

трудными в обработкой.

Для структурирования данных используем построение вариационного

ряда и данные будут представлены более компактно, появится возможность

их дальнейшего изучения.

Таблица 2. Вариационный ряд (Пример 1)

V p

156 1

176 5

180 4

166 2

168 1

150 1

n= 14

Теперь данные представлены более структурированно, но при n = 14, а

при n = 300 или 1800, даже вариационный ряд станет не читабельным.

Коснемся вопросов описательной статистики и попробуем научиться

сжато описать данные.

Если значения интересующего нас признака у большинства объектов

близки к их среднему и с равной вероятностью отклоняются от него в

большую или меньшую сторону, лучшими характеристиками совокупности

будут само среднее значение и стандартное отклонение.

Забудьте описанный выше пример с измерением роста у 14 студентов,

они нам не интересны. Поначалу займемся, каким-нибудь количественным

признаком, например, так же ростом. Чтобы попусту не фантазировать

слетаем на Марс и измерим всех марсиан благо их всего две сотни.

Результаты приведены на рис. 1.1 (мы округлили рост до целого числа

сантиметров). Каждому марсианину соответствует кружок так, что,

например, два кружка над числом 30 означают, что имеются два марсианина

ростом 30 см. Рис 1.1 это распределение марсиан по росту. Мы видим, что

рост большинства марсиан — от 35 до 45 см. Коротышек (ниже 30 см) совсем

немного — всего трое, и столько же великанов (выше 50 см).

Рис. 1.1 Распределение марсиан по росту.

Окрыленные успехом марсианского проекта мы решаем измерить

венерианцев. Легко находим деньги на путешествие, выиграв

исследовательский грант, и, вооружившись ростомерами, измеряем всех 150

обитателей Венеры. Научный отчет об экспедиции будет звучать так: «Редко

встретишь венерианца ниже 10 см или выше 20 см, а чаше попадаются 15-

сантиметровые, см. рис. 1.2».

Рис. 1.2 Распределение венерианцев по росту.

Сравним рис. 1.1 и 1.2. Мы видим, что венерианцы ниже марсиан и

что интервал, в который умещается рост всех марсиан шире, чем

соответствующий интервал для венерианцев. Ширина интервала, в который

попадают почти все марсиане (194 из 200) — 20 см (от 30 до 50 см). Рост

большинства венерианцев (144 из 150) умещается в интервал от 10 до 20 см,

то есть имеет ширину всего лишь 10 см. Несмотря на эти различия между

двумя совокупностями инопланетян имеется и существенное сходство. В

обоих рост любого члена скорее близок к середине распределения, нежели

заметно от нее удален и одинаково вероятно может быть, как выше, так и

ниже середины. Распределения на рис. 1.1 и 1.2 имеют схожую форму и

приближенно определяются одной и той же формулой и называются

нормальным (Гаусовым) распределением.

Раз существует множество похожих распределений, значит, для

характеристики одного из них достаточно указать чем оно отличается от

других ему подобных, то есть всю собранную информацию мы можем свести

к нескольким числам, которые называются параметрами распределения. Это

среднее значение, стандартное отклонение и коэффициент рассеяния.

Средняя значение – общая количественная характеристика

определенного признака изучаемых явлений, составляющих качественно

однородную статистическую совокупность.

Существует много различных обозначений для средней, так же

несколько формул для расчетов, приводить их мы не будем, а лишь покажем

самую простую математическую формулу, так как никогда вручную этот

показатель мы считать не будем.

Итак, М для марисиан и для венерианциев 40 см и 15 см

соответственно.

Еще на Венере мы заметили, что жители более однородны по росту,

нежели марсиане. Хотелось бы и это впечатление оформить количественно,

то есть иметь показатель разброса значений относительно среднего. В этом

нам помогут стандартное отклонение и коэффициент вариации.

Средние – это величины, вокруг которых рассеяны различные

варианты, поэтому чем ближе друг к другу отдельные варианты по своей

количественной характеристике, тем меньше рассеяние, колеблемость ряда,

тем типичнее его средняя. Ясно, что для характеристики разброса все равно,

в какую сторону отклоняется значение — в большую или меньшую. Иными

словами, отрицательные и положительные отклонения должны вносить

равный вклад в характеристику разброса. Воспользуемся тем, что квадраты

двух равных по абсолютной величине чисел равны между собой, и вычислим

средний квадрат отклонения от среднего. Этот показатель носит название

дисперсии и обозначается Чем больше разброс значений, тем больше

дисперсия. Дисперсия измеряется в единицах, равных квадрату единицы

измерения соответствующей величины. Например, дисперсия измеряемого в

сантиметрах роста сама измеряется в квадратных сантиметрах. Это довольно

неудобно. Поэтому чаще используют квадратный корень из дисперсии —

стандартное отклонение σ, которая вычисляется по формуле:

Итак, нахождение стандартного отклонения позволяет судить о

характере однородности исследуемой группы наблюдений. Если величина

небольшая, то это свидетельствует о достаточно высокой однородности

изучаемого явления. В таком случае ее следует принять вполне характерной

для данного вариационного ряда. Слишком малая величина σ заставляет

думать об искусственном подборе наблюдений. При очень большой σ, М в

меньшей степени характеризует вариационный ряд, что говорит о

значительной вариабельности изучаемого признака или явления, или о

неоднородности исследуемой группы.

Стандартное отклонение измеряется в тех же единицах, что исходные

данные. Например, стандартное отклонение роста марсиан составляет 5 см, а

венерианцев — 2,5 см.

Оценка степени рассеяния вариант около средней может быть

произведена с помощью коэффициента вариации.

Значение С <10% - малое рассеяние, от 10 до 20 – среднее,> 20% -

сильное рассеяние вариант вокруг средней арифметической.

Коэффициент вариации часто используется при оценке, колеблемости

рядов различных признаков, например веса и роста. Непосредственное

сравнение σ в данном случае невозможно, т.к. σ величина, выраженная

абсолютным числом.

Для марсиан и венерианцев С = 12,5% и 16,7 %.

После того как мы посчитали все вышеназванные параметры, вполне

можем сжато описать все наши данные, полученные в ходе исследования.

Таблица 3. Параметры распределения марсиан и венецианцев по росту

N M σ C, %

Марсиане 200 40 5 12.5

Венерианцы 150 15 2,5 16,7

Таблица 3 сжато представляет то, что мы узнали о марсианах и

венерианцах. Таблица очень информативна, из нее можно узнать об объеме

совокупности, о среднем росте и о том, насколько велик разброс

относительно среднего.

До сих пор нам удавалось получить данные обо всех объектах

совокупности, поэтому мы могли точно рассчитать значения среднего,

дисперсии и стандартного отклонения. На самом деле обследовать все

объекты совокупности удается редко: обычно довольствуются изучением

выборки, полагая, что эта выборка отражает свойства совокупности.

Выборку, отражающую свойства совокупности, называют

репрезентативной. Имея дело с выборкой, мы, конечно, не узнаем точных

значений среднего и стандартного отклонения, но можем оценить их. Опенка

среднего, вычисленная по выборке, называется выборочным средним, а

стандартное отклонение по выборке – выборочным стандартным

отклонением. На практике, разницу между данными понятиями не вносят, во

избежание путаницы и обозначают так же M и σ соответственно. Чтобы

определить степень точности выборочного наблюдения, необходимо оценить

величину ошибки, которая может случайно произойти в процессе выборки.

Такие ошибки носят название случайных ошибок репрезентативности или

средней ошибки средней арифметической. Ошибка репрезентативности

вытекает из самой сущности выборочного исследования. С помощью ошибок

репрезентативности числовые характеристики выборочной совокупности

распространяются на всю генеральную совокупность. Чем больше число

наблюдений, тем меньше ошибка, чем больше изменчив признак, тем больше

величина статистической ошибки.

Определение величины ошибки репрезентативности необходимо для

нахождения возможных значений генеральных параметров. Оценка

генеральных параметров приводится в виде 2 значений – минимального и

максимального. Это крайние значения возможных отклонений, в пределах

которых может колебаться искомая средняя величина генерального

параметра, называются доверительным коэффициентом.

68,3% - M ±1m

95.5% - M ±2m

99.7% - M ±3m

При малой выборке (менее 30) величину доверительного

коэффициента необходимо определить каждый раз в зависимости о числа

наблюдений по таблице Стьюдента.

Не путать доверительный коэффициент и доверительный интервал!

Доверительный коэффициент отражает с определенной вероятностью (для

медико-биологических исследований p> 0.05, то есть в 95 %) в каких

границах будет находится средняя по совокупности, исходя из тех данных,

корыте есть в выборочной совокупности.

Доказательная статистика.

Существует такое понятие, как дисперсионный анализ. Он позволяет

проверить значимость различий нескольких групп. Поговорим об этом

немного позже, а пока рассмотрим такие случаи, когда необходимо сравнить

только 2 группы между собой. В этом случае можно применить критерий

Стьюдента. Сейчас мы изложим его сущность и покажем, что критерий

Стьюдента — это частный случаи дисперсионного анализа. Критерий

Стьюдента чрезвычайно популярен, он используется более чем в половине

медицинских публикаций. Однако следует помнить, что этот критерий

предназначен для сравнения именно двух групп, а не нескольких групп

попарно.

Предположим, что мы хотим испытать диуретическое действие

нового препарата. Мы набираем десять добровольцев, случайным образом

разделяем их на две группы — контрольную, которая получает плацебо и

экспериментальную, которая получает препарат, а затем определяем

суточный диурез. Результаты представлены на рис. 3 Средний диурез в

экспериментальной группе на 240 мл больше чем в контрольной. Впрочем,

подобными данными мы вряд ли кого-нибудь убедим, что препарат

диуретик. Группы слишком малы.

Рис. 3 Изучение нового диуретика.

Повторим эксперимент, увеличив число участников. Теперь в обеих

группах по 20 человек. Результаты представлены на рис. 4. Средние и

стандартные отклонения примерно те же, что и в эксперименте с меньшим

числом участников. Кажется, однако, что результаты второго эксперимента

заслуживают большего доверия. Почему?

Вспомним, что точность выборочной оценки среднего

характеризуется стандартной ошибкой среднего или ошибкой

репрезентативности m. С увеличением объема выборки стандартная ошибка

среднего уменьшается, следовательно, уменьшается и неопределенность в

оценке выборочных средних. Поэтому уменьшается и неопределенность в

оценке их разности. Применительно к нашему эксперименту, мы более

уверены в диуретическом действии препарата.

Рис. 4 Изучение нового диуретика.

В научно-исследовательской практике часто бывает необходимо

сравнение двух средних величин, например, при сравнении результатов в

контрольной и экспериментальной группах, или сравнении показателей

здоровья населения в различных местностях за различные года.

Применяемый метод оценки достоверности средних величин

позволяет установить насколько выявленные различия существенны, то есть

носят ли они достоверный характер или являются результатом действия

случайных причин. В основе метода лежит определение критерия Стьюдента

t (коэффициент достоверности).

Критерии достоверности указывает, во сколько раз разность

сравниваемых средних превышает их ошибку. При различных значениях

критерия существует определенная мера надежности, которая говорит о

существенности, достоверности выявленных различий между

сравниваемыми средними.

В медико-биологических исследованиях достаточно иметь значение t

≥ 2, тогда выявленные различия не случайны, достоверны, статистически

подтверждены (с вероятностью более 95%). Если значение критерия <2, то

разница не доказана, носит случайный характер, статистически не

подтверждается (вероятность менее 95%).

Разберемся подробнее. Если значение t меньше 2, то при уровне

значимости 0,05 (т.е. в 95% случаев) мы сочтем различия статистически

значимыми. Это означает, что если бы наши группы представляли собой две

случайные выборки из одной и той же совокупности, то вероятность

получить наблюдаемые различия (или более сильные) равна 0,05 (или 5%).

Следовательно, ошибочный вывод о существовании различии мы будем

делать в 5% случаев. Чтобы застраховаться от подобных ошибок, можно

принять уровень значимости не 0,05, а скажем 0,01, то есть не 95 %, а 99%

Тогда отвергать нулевую гипотезу мы должны при t < 2,88. Во-первых,

ошибочные выводы о существовании различий все же не исключены просто

их вероятность снизилась до 1% и во-вторых, вероятность не найти различии

там, где они есть теперь повысилась.

Рассмотрим некоторые ошибки в использовании критерия

Стьюдента.

Критерий Стьюдента предназначен для сравнения двух групп. Однако

на практике он широко используется для оценки различии большего числа

групп посредством попарного их сравнения. При этом вступает в силу

эффект множественных сравнений. Рассмотрим пример. Исследуют влияние

препаратов А и Б на уровень глюкозы плазмы. Исследование проводят на

трех группах — получавших препарат А, получавших препарат Б и

получавших плацебо В. С помощью критерия Стьюдента проводят 3 парных

сравнения: группу А сравнивают с группой В, группу Б — с группой В и

наконец А с Б. Получив достаточно высокое значение t в каком либо из трех

сравнении сообщают что «P <0,05». Это означает, что вероятность

ошибочного заключения о существовании различии не превышает 5%. Но это

неверно: вероятность ошибки значительно превышает 5%. Разберемся

подробнее. В исследовании был принят 5% уровень значимости. Значит

вероятность ошибиться при сравнении групп А и В — 5%. Казалось бы, все

правильно. Но точно также мы ошибемся в 5% случаев при сравнении групп

Б и В. И наконец при сравнении групп А и Б ошибка возможна также в 5%

случаев. Следовательно, вероятность ошибиться хотя бы в одном из трех

сравнении составит не 5%, а значительно больше. В общем случае эта

вероятность равна

0,05 * число сравнений, то есть вероятность ошибиться хотя бы в одном из

сравнений примерно равна вероятности ошибиться в одном, помноженной на

число сравнений. Итак, в нашем исследовании вероятность ошибиться хотя

бы в одном из сравнений составляет примерно 15%. При сравнении четырех

групп число пар и соответственно возможных попарных сравнений равно 6.

Поэтому при уровне значимости в каждом из сравнения 0,05 вероятность

ошибочно обнаружить различие хотя бы в одном равна уже не 0,05, а

примерно 6 × 0,05 = 0,30. И когда исследователь, выявив таким способом

«эффективный» препарат будет говорить про 5% вероятность ошибки, на

самом деле эта вероятность равна 30%.

В заключение приведем три правила:

- Критерий Стьюдента может быть использован для проверки гипотезы о

различии средних только для двух групп;

- Если схема эксперимента предполагает большее число групп,

воспользуйтесь дисперсионным анализом F или другими критериями.

- Если критерии Стьюдента был использован для проверки различий между

несколькими группами, то истинный уровень значимости можно получить,

умножив уровень значимости, приводимый авторами на число возможных

сравнений.

Как определить есть ли связь или её нет?

Далее мы познакомимся с понятием корреляции, то есть научимся

определять наличие связи между явлениями и их силу и направление.

Нас часто интересует такой параметр как характеристика тесноты

(силы) связи между явлениями, при этом выраженная одним числом. Эта

характеристика называется коэффициентом корреляции, обычно ее

обозначают буквой r. Коэффициент корреляции может принимать значения

от –1 до +1. Знак коэффициента корреляции показывает направление связи

(прямая или обратная), а абсолютная величина — тесноту связи.

Коэффициент, равный –1, определяет столь же жесткую связь, что и равный

1. В отсутствие связи коэффициент корреляции равен нулю.

На рис.5 приведены примеры зависимостей и соответствующие им

значения r. Мы рассмотрим только один вид коэффициента корреляции -

коэффициент корреляции Пирсона, предназначеенный для описания

линейной связи количественных признаков, он требует нормальности

распределения.

Когда говорят просто о «коэффициенте корреляции», почти всегда

имеют в виду коэффициент корреляции Пирсона, именно так мы и будем

поступать. Чем теснее связь, тем больше абсолютная величина коэффициента

корреляции. Знак показывает направление связи. При r> 0 говорят о прямой

корреляции (с увеличением одной переменной другая также возрастает), при

r < 0 — об обратной (с увеличением одной переменной другая уменьшается).

Сила связи (от 0 до 1): 0- связь отсутствует; 0-0,3 – слабая связь; 0,3-0,7 –

связь средняя; 0,7-1,0 – связь сильная.

Соседние файлы в предмете Организация научных исследований