- •1(Часть 1) Разделы дисциплины.
- •1.1Биометрия
- •1.2Этапы истории
- •2Предмет и основные понятия биометрии
- •2.1Группировка первичных данных
- •2.2Признаки и их свойства.
- •2.3Классификация признаков
- •2.4Причины варьирования результатов наблюдений
- •2.5Точность измерений и действия над приближенными числами
- •2.6Способы группировки первичных данных
- •2.7Статистические ряды.
- •2.8Графики вариационных рядов
- •2.9Особенности биообъекта и экспериментальных данных о его свойствах и состоянии. Основные источники медико-биологических данных.
- •3Общая характеристика биологических сигналов и медико-биологических данных
- •3.1Случайный сигнал и случайная величина
- •3.2Одномерные случайные сигналы. Функция распределения и плотность вероятности
- •3.3Усреднение. Моменты случайной величины
- •3.4Равномерное распределение случайной величины
- •3.5Гауссово (нормальное) распределение
- •3.6Статистические характеристики систем случайной величины (Многомерные сигналы)
- •3.7Функция распределения и плотность вероятности.
- •3.8Вычисление моментов
- •3.9Корреляция
- •3.10Статистическая независимость случайных величин.
- •3.11Многомерное Гауссово распределение.
- •3.12Случайные процессы.
- •3.12.1Предварительная обработка сигналов.
- •3.12.2Моментальные функции случайных процессов.
- •3.12.3Взаимная функция корреляции двух случайных процессов.
- •3.13Помехи и их математические модели.
- •3.13.1Виды аддитивных помех.
- •3.13.2Законы распределения помех.
- •3.13.3Отношение сигнала помехи на прмере гауссовских помех.
- •4Основные понятия теории обнаружения сигнала
- •4.1Проверка статистических гипотез.
- •4.2Критерий Неймана-Пирсона.
- •4.3Алгоритмы обнаружения.
- •5Фильтрация сигналов
- •5.1Временная фильтрация.
- •5.2Частотная фильтрация.
- •5.3Связь между фильтрацией и сверткой.
- •5.4Физически реализуемые линейные фильтры частоты.
- •5.5Идеальный фильтр.
- •5.6Реализуемые непрерывные аналоговые фильтры.
- •5.7Узкополосные фильтры.
- •5.8Оптимальная фильтрация.
- •6(Часть 2) Корреляционный анализ
- •6.1Функциональная зависимость и корреляция
- •6.2Параметрические показатели связи. Коэффициент корреляции
- •6.3Вычисление коэффициента корреляции при малых выборках
- •6.4Минимальный объем выборки для точной оценки коэффициента корреляции
- •6.5Вычисление коэффициента корреляции при больших выборках
- •6.6Оценка разности между коэффициентами корреляции
- •7Качественное описание задач распознавания
- •7.1Основные задачи построения системы распознавания
- •7.2Параметрические и непараметрические методы и критерии
- •7.3Параметрические критерии
- •7.4Непараметрические критерии
- •7.5Статистические методы классификации многомерных наблюдений
- •7.6Минимаксный критерий
- •8Вопросы планирования исследований
- •8.1Приближенные оценки основных статистических показателей
- •8.2Определение необходимого объема выборки
- •9Типы медицинских изображений. Способы их обработки
- •9.1Иднтификация пространственных объектов. Схема этапов распознавания
- •9.2Обработка точечных изображений
- •9.3Моделирование процесса идентификации точечных изображений на эвм
- •9.4Основные принципы цифровых операций над изображениями
- •9.5Операции над изображениями. Хранение и представление изображений.
- •9.6Цветные изображения
- •9.7Окружающие и примыкающие пиксели
- •9.8Основные требования к аппаратуре
- •9.9Устройства ввода изображений
- •9.9.1Видеокамеры
- •9.9.2Насадки
- •9.9.3Другие устройства ввода изображений
- •9.10Устройства вывода изображений на дисплей
- •9.11Процессоры
- •9.12Критерий полезности признаков при распознавании объектов
- •9.13Геометрическая модель биологических данных. Система геометрических признаков при распознавании объектов
- •9.14Простые методы обработки изображений
7.2Параметрические и непараметрические методы и критерии
В области биометрии широкое применение получила «нулевая гипотеза». Сущность ее – предположение о том, что разница между генеральными параметрами сравниваемых групп равна нулю, различие между выборочными характеристиками носит не систематический, а случайный характер. Если одна выборка извлечена из нормальной распределительной совокупности с параметрами μх и σх , а другая из совокупности с параметрами μу и σу, то нулевая гипотеза исходит из того, что μх=μу, σх=σу, или μх-μу=0 и σх-σу=0.
Противоположной нулевой гипотезе является альтернативная гипотеза, которая исходит из того, что μх-μу≠0 и σх-σу≠0.
Для проверки принятой гипотезы и достоверной оценки генеральных параметров по выборочным данным используют величины, функции распределения которых известны. Эти величины называют критериями достоверности.
Функции распределения указанных величин табулированы, т.е. сведены в специальную таблицу, где содержатся значения функций для разных чисел степеней свободы k, объема выборки n и уровней значимости α.
Уровень значимости, или вероятность ошибки, допускаемой при оценке принятой гипотезы может различаться. Обычно при проверке статистических гипотез принимают три уровня значимости: 5%, т.е. вероятность ошибочной оценки p=0.05, 1% - p=0.01 и 0.1% - p=0.001.
В биологических исследованиях считают достаточным 5% уровень значимости, при этом нулевую гипотезу не отвергают, если в результате исследований окажется, что вероятность ошибочной оценки превышает пять процентов, т.е. p>0.05. Если же p<0.05, то принятую гипотезу следует отвергнуть на принятом уровне значимости α. Ошибка при этом возможна лишь в пяти процентах случаев.
Трем вышеупомянутым уровням значимости отвечают (при нормальности распределения используемого критерия) нормированное отклонение t и пороги доверительной вероятности Р
α, % |
t |
Р=1- α |
5 |
1,96 |
0.95 |
1 |
2,58 |
0,99 |
0.1 |
3,29 |
0,999 |
В области биометрии применяют два вида статистических критериев
параметрические, построенные на основе параметров данной совокупности (среднее арифметическое, дисперсионное)
непараметрические, - функции, зависящие непосредственно от вариант данной совокупности с их частотами.
Первые служат для проверки рабочих гипотез о параметрах совокупности, распределенных по нормальному закону.
Вторые – для проверки рабочих гипотез независимо от формы распределения совокупностей, из которых взяты сравниваемые выборки.
Из параметрических в биометрии обычно применяют t-критерий Стьюдента и F-критерий Фишера.
t используют для сравнительной оценки средних величин, F – для оценки дисперсий.
7.3Параметрические критерии
t-критерий Стьюдента. Английский математик Госсет (Стьюдент) в 1908 году нашел закон распределения величины, в которой генеральный параметр σ заменен на его выборочную характеристику Sх..
отношение разности между выборочной и генеральной средними к ошибке выборочной средней, непрерывно распределяется согласно следующей формуле:
где С – константа, зависящая от числа степеней свободы k=n-1.
Открытый Стьюдентом и теоретически обоснованный Фишером закон t-распределения служит основой теории малой выборки.
t-распределение зависит только от числа степеней свободы k=n-1 , причем с возрастанием n t-распределение быстро приближается к нормальному с параметрами μ=0 и σ=1 и уже при n≥30 не отличается от него.
Более наглядное представление о характере t-распределения дает следующий рисунок.
к ривая t-распределения 1 при n=3 на фоне нормальной кривой 2.
t-распределение симметрично и отражает специфику распределения среднего арифметического в случае малой выборки и в зависимости от ее объема n. Для выборок, объем которых превышает 30 единиц t-распределение распределяется по нормальному закону и не зависит от числа наблюдений. Если объем меньше 30, то характер t-критерия зависит от n.
F-критерий Фишера. Для проверки нулевой гипотезы о равенстве генеральных дисперсий (σ12=σ22) нормально распределяющихся генеральных совокупностей t-критерий оказывается недостаточно точным, особенно при оценке разности дисперсий малочисленных выборок. Вместо выборочной разности S1-S2 удобней использовать разность между ln этих величин, т.е.
z=ln(s1)–ln(s2) , где S1>S2
эта разность обозначается z и распределяется нормально при наличии как больших, так и средних статистических совокупностей.
Снедекор предложил вместо логарифма отношений (разности) использовать отношение выборочных дисперсий Sx и обозначать этот показатель F.
при
т.к. принято брать отношение большей дисперсии к меньшей, то F-критерий больше единицы ( ).
Чем значительнее неравенство между выборочными дисперсиями, тем больше будет и величина F-критерия и наоборот.
Величина F имеет непрерывный функцию распределения и зависит от чисел степеней свободы:
Величина F полностью определяется выборочными дисперсиями и не зависит от генеральных параметров. Функция F-распределения табулирована для 5%-го и 1%-го уровня значимости и чисел степеней свободы k1 для большей дисперсии и k2 – для меньшей.
Если сравниваемые выборки извлечены из одной и той же генеральной совокупности или из разных совокупностей с равными дисперсиями ( ), то величина F-критерия не превышает критической точки (Fst). Для k1и k2 на принятом уровне значимости α эти величины будут отражать следующее:
если выборки взяты из разных генеральных совокупностей и , то и нулевая гипотеза отвергается.