- •В.М. Еськов
- •Часть 2
- •Лабораторная работа № 8. Функция распределения. Гистограмма
- •Практическое значение выполняемых исследований.
- •Литература
- •Блок информации
- •Лабораторная работа № 9. Расчет доверительного интервала на эвм
- •Практическое значение выполняемых исследований
- •Литература
- •Бюджет времени
- •Блок информации
- •Блок информации
- •Лабораторная работа № 11
- •Статистическая проверка гипотез в экологии
- •Практическое значение выполняемых исследований
- •Литература
- •Бюджет времени
- •Блок информации
- •Лабораторная работа №13 Элементы дисперсионного анализа (да)
- •Практическое значение выполняемых исследований
- •Бюджет времени
- •Блок информации
- •1. Общие задачи идентификации параметров порядка и русел биосистем, находящихся в некоторых аттракторах состояний.
- •2. Нейрокомпьютерные технологии в идентификации пп для всоч.
- •3. Системный синтез в рамках компартментно – кластерного подхода.
- •Практическое значение выполняемых исследований
- •Бюджет времени
- •Литература
Лабораторная работа № 9. Расчет доверительного интервала на эвм
Цель работы.
Студент должен знать: смысл первичной статистической обработки результатов исследований до доверительного интервала с погрешностью измерений, правило 3-х сигм для случайных величин.
Студент должен уметь: произвести первичную статистическую обработку результатов экологических экспериментов до x±dx, произвести определение величины (размеров) конкретного биообъекта (среднее значение, выше среднего, высокий).
Практическое значение выполняемых исследований
С использованием методов математической статистики можно давать оценку любого биообъекта. Может быть выполнен анализ основных погрешностей в различных измерениях с использованием критерия Стьюдента. Использование программ в языках программирования (например, BASIC) для нахождения доверительного интервала и обработки результатов позволяет резко облегчить механические многократно повторяемые операции в расчетах и повысить их точность.
Литература
В.М. Еськов, О.Е. Филатова, В.А. Рачковская Статистическая обработка результатов измерений в практикуме по экологии и естествознанию.- Сургут: Изд. СурГУ, 1999.- 43 с.
М. Дж. Кендалл, А. Стьюарт. Теория распределений.
В. В. Гмурман. Теория вероятностей и математическая статистика.
Бюджет времени
На изучение темы отводится 6 часов, из них 2 часа лекций, 2 часа лабораторные занятия и 2 часа на самоподготовку.
МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО I ЭТАПУ
"Самоподготовка"
Для подготовки к лабораторной работе Вам следует повторить математику и математические методы за 1-2 курс, изучить лекции и ответить на следующие вопросы:
Каков смысл доверительного интервала?
Сформулируйте метод нахождения дисперсии и средне квадратического отклонения.
Для чего используется коэффициент Стьюдента?
Что такое дисперсия результата в экологическом смысле?
В чем смысл "правила трех сигм"?
Как перейти от доверительного интервала к стандартной форме записи результатов эксперимента?
МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО II ЭТАПУ:
“Выполнение лабораторной работы”
Для выполнения этапа наберите описанную в блоке информации программу, реализующую алгоритм нахождения доверительного интервала. Оцените результат по критериям поиска грубых ошибок (промахов) эксперимента. Если таковые присутствуют, удалите их из выборки и проведите расчет заново. Выборку используйте по данным роста и массы студентов свей группы (студенты однокурсники) или из литературы разных пород рыб, одного года (например, двухлетний язь или карп и т.д.)
Блок информации
Рассмотрим первичную обработку результатов измерений до доверительного интервала. Определив в предыдущей работе №8 круг основных задач СОРЭИ и исходную информацию в области математической статистики, рассмотрим теперь конкретное применение указанного подхода при выполнении эколого-технических измерений, понимая под этим любые измерения в биологии, экологии, медицине, физике, химии, т.е. в естествознании вообще.
Прежде всего отметим, что вместо вероятности события P(x) мы будем пользоваться частотой P*(x)=m/N (см. л.р. №8) и тогда все формулы ТВ можно применить с некоторой точностью, заменив P(x) на P*(x). При малом числе измерений (n<30) вместо распределения Гаусса используем распределение Стьюдента, которое внесет некоторые коррективы в формулы, приведенные ниже. Сразу отметим, что в экологии (как и в физике, технике и др. науках) могут быть прямые измерения и косвенные. Начнем рассмотрение с 1-го блока, как наиболее распространенного.
I Прямые измерения. Расчет доверительного интервала.
Прежде всего отметим, что общая схема (алгоритм) первичной статистической обработки результатов измерений примет следующий вид для случая прямых измерений:
1. Нахождение выборочного математического ожидания (или среднего арифметического):
(9.1)
2. Нахождение статистической (выборочной) дисперсии (или центрального момента 2-го порядка):
(9.2)
3. Определение статистического (выборочного) среднего квадратического отклонения СВ:
(9.3)
Если n велико, то величины , D*(x), могут хорошо характеризовать истинные значения математического ожидания, дисперсии и среднего квадратического отклонения СВ (измеряемой величины). Иная ситуация возникает при небольших n (n<30, например). Вообще говоря тоже является случайной величиной, как и каждая xi, поэтому оно тоже может характеризоваться средним квадратическим отклонением, которое, как показывают расчеты для распределения Стьюдента, определяется по формуле:
.
Легко видеть, что с увеличением n средняя квадратическая ошибка среднего арифметического (выборочного математического ожидания) 0. Так как нас интересует истинное значение, x0 для СВ, к которому стремится , то представляет интерес оценка точности наших измерений и ответ на вопрос, как близко подходит к xo.
4. В первом случае используем правило трех сигм и определяем наиболее возможную ошибку отдельного измерения
. (9.4)
Как известно (см. выше), вероятность непопадания СВ в интервал чрезвычайно мала (1-0.9972=0.0028), поэтому те значения СВ, которые не попали в этот интервал, мы должны отбросить (промахи!), а вычисления повторить заново. Тогда схема вычисления (алгоритм) примет вид:
123456 (9.5)
5. Далее, точность прямого измерения x, т.е. разность между xo (истинным значением СВ) и ее можно определить по формуле:
(9.6)
где tk, - параметр, при малых n задается таблицей 1 (для критерия Стьюдента ). Этот параметр можно определить из распределения Стьюдента. Он зависит от числа степеней свободы k, которое на единицу меньше числа измерений, т.е. и доверительной вероятности .
k=n-1 (9.7)
6. Для ответа на второй вопрос мы должны записать доверительный интервал ( ), внутрь которого с доверительной вероятностью попадает неизвестное нам истинное значение xo СВ. Выбор определяется требованиями практики. В биологических исследованиях можно брать =0.9, т.е. из 100 случаев, в среднем, 90 раз вычисленный нами доверительный интервал накроет истинное значение СВ, а в 10 случаях - нет. Иногда предъявляют более жесткие требования (в авиации, медицине =0.999, в космонавтике – 0,99999).
Важно отметить, что истинные значение СВ мы так и не определим, но получаем определенную оценку xo. Этим объясняется невозможность исключить случайные ошибки. Иногда молодые исследователи говорят, что провели несколько измерений, а результат одинаковый, вывод "нет ошибки". Это утверждение неверное, т.к. фактически такая ситуация означает, что x СВ меньше абсолютной погрешности прибора xnp, тогда нужно просто приравнять эти две величины без дополнительных расчетов, т.е. сразу 16.
II. Косвенные измерения.
Приведенные выше методы расчета применимы при работе с любым измерительным прибором в экологии и при любых прямых измерениях. Однако, во многих случаях необходимая ЭТВ получается при расчете с использованием известных функциональных зависимостей между искомой величиной и непосредственно измеряемыми x1, x2,...,xn , т.е. y=y(x1...xn). В этом случае для каждой xi, используя алгоритм 1-6, находят xi и xi, а затем находят среднюю квадратическую погрешность косвенного измерения y по формуле:
(9.8)
где y/xi - частная производная от у по хi.
Приведем простейший пример, если определяют объем цилиндра (часть ствола дерева, червь и т.д.) V=R2h, то сначала по схеме 1-6 находят , а затем, используя (9.8)
.
Расчет средней квадратической ошибки среднего арифметического
,
точности измерения и доверительного интервала ( ) ничем не отличается от общей схемы 1-6.
В общем случае естествоиспытатель (биоэколог) должен сам уметь составлять алгоритм расчета доверительного интервала. Конкретный пример такого алгоритма (программы) представлен в приложении 1. В данной работе Вам придется измерить параметры (масса и рост) каждого студента группы и для этих двух СВ (m и n) рассчитать доверительные интервалы. Если бы выборка была побольше, например, юношей n1>10 и девушек n2>10, то можно было бы определить доверительные интервалы для юношей и девушек и сделать вывод о наличии (или отсутствии) гендерных различий среди населения Югры.
Наконец, отметим еще одно важное замечание. Если для данной выборки мы получим и , то любой объект попавший в интервал ( , ) характеризуется как объект со средними значениями (массы, роста и т.д.). Если же его данные попали в интервал ( ) или в интервал ( ), то мы говорим, что рост (например, h) человека ниже среднего или выше среднего. Наконец, если параметры объекта лежат за границей , то это или низкий (рост) или высокий (рост) показатель объекта. Так в экологии мы можем говорить о загрязненности (воды, атмосферы, почвы, крови или лимфы человека) в пределах нормы, выше (ниже) нормы (среднее) или о высоких (низких) показателях внешней для человека (или внутренней) среды.
Доверительные интервалы можно сравнивать, но для этого лучше применять статистическую проверку гипотез (см. Лаб.р. №12, №13).
Приложение 1
ПРОГРАММА РАСЧЕТА ДОВЕРИТЕЛЬНОГО ИНТЕРВАЛА
REM *******************************************************
CLS
j = 0: Dsp = 0:
INPUT "Tkb (критерий Стьюдента) = ", Tkb
INPUT "количество n = ", n
DIM x(n)
REM *********** заполнение массива **************************
FOR i = 1 TO n
PRINT "x ("; i; ") = "; : INPUT "", x(i)
NEXT i
REM *******************************************************
REM ************** среднее значение x ***********************
FOR i = 1 TO n
j = j + x(i)
NEXT i
j = j / n
PRINT "Среднее арифметическое значения <x> = "; j
REM *******************************************************
REM *********** Статистическая дисперсия ********************
FOR i = 1 TO n
Dsp = Dsp + (j - x(i)) * (j - x(i))
NEXT i
Dsp = Dsp / n
PRINT "Статистическая дисперсия, D = "; Dsp
REM ******** Cреднее квадратичное отклонение ****************
Sc = SQR(Dsp)
PRINT "Среднее квадратичное отклонение x = "; Sc
REM *Среднее квадратичное отклонение среднего арифметического *
k = n - 1
Sxc = Sc / (SQR(k))
PRINT "Среднее квадратичное отклонение среднего арифметического ="; Sxc
REM ************ доверительный интервал ********************
dx = Tkb * Sxc
PRINT "доверительный интервал = ("; j - dx; ","; j + dx; ")"
Лабораторная работа №10
Метод наименьших квадратов (МНК) в расчете уравнения регрессии
Цель работы.
Студент должен знать: смысл регрессии x по y (регрессионных зависимостей), способы определения параметров регрессии (для линейной и квадратичной регрессии), метод наименьших квадратов.
Студент должен уметь: произвести расчет уравнения регрессии по результатам экспериментов произвести анализ программ ЭВМ для реализации метода регрессионного анализа.
Практическое значение выполняемых исследований
Различные величины, наблюдаемые в эксперименте, могут явно или неявно зависеть друг от друга. В последнем случае мы говорим о регрессии y по x Использование программ в языках программирования (например, BASIC) для нахождения параметров уравнения регрессии и обработки результатов экологических исследований. Данная работа позволяет обучаемому получить необходимые навыки в этой области.
Литература
В.М. Еськов, О.Е. Филатова, В.А. Рачковская Статистическая обработка результатов измерений в практикуме по экологии и естествознанию.- Сургут: Изд. СурГУ, 1999.- 43 с.
М. Дж. Кендалл, А. Стьюарт. Теория распределений.
В. В. Гмурман. Теория вероятностей и математическая статистика. – М.:
Ю. В. Линник. Метод наименьших квадратов. – М. – 2001. – 196 с.
Бюджет времени
На изучение темы отводится 6 часов, из них 2 часа лекций, 2 часа лабораторные занятия и 2 часа на самоподготовку.
МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО I ЭТАПУ
"Самоподготовка"
Для подготовки к лабораторной работе Вам следует повторить пройденный материал и изучить лекции. Ответьте на следующие вопросы:
1. Что такое регрессионное уравнение? Для чего его используют?
2 . Как проверяется соответствие гипотезы эксперименту методом наименьших квадратов?
3. Приведите алгоритм нахождения линейной регрессии.
МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО II ЭТАПУ:
“Выполнение лабораторной работы”
Для выполнения этапа наберите описанную в блоке информации программу, реализующую алгоритм нахождения регрессионных уравнений. Оцените полученные параметры уравнения регрессии и сделайте выводы.