Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
LR 2 CHAST SE.doc
Скачиваний:
10
Добавлен:
27.11.2019
Размер:
945.15 Кб
Скачать

Лабораторная работа № 9. Расчет доверительного интервала на эвм

Цель работы.

Студент должен знать: смысл первичной статистической обработки результатов исследований до доверительного интервала с погрешностью измерений, правило 3-х сигм для случайных величин.

Студент должен уметь: произвести первичную статистическую обработку результатов экологических экспериментов до x±dx, произвести определение величины (размеров) конкретного биообъекта (среднее значение, выше среднего, высокий).

Практическое значение выполняемых исследований

С использованием методов математической статистики можно давать оценку любого биообъекта. Может быть выполнен анализ основных погрешностей в различных измерениях с использованием критерия Стьюдента. Использование программ в языках программирования (например, BASIC) для нахождения доверительного интервала и обработки результатов позволяет резко облегчить механические многократно повторяемые операции в расчетах и повысить их точность.

Литература

  1. В.М. Еськов, О.Е. Филатова, В.А. Рачковская Статистическая обработка результатов измерений в практикуме по экологии и естествознанию.- Сургут: Изд. СурГУ, 1999.- 43 с.

  2. М. Дж. Кендалл, А. Стьюарт. Теория распределений.

  3. В. В. Гмурман. Теория вероятностей и математическая статистика.

Бюджет времени

На изучение темы отводится 6 часов, из них 2 часа лекций, 2 часа лабораторные занятия и 2 часа на самоподготовку.

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО I ЭТАПУ

"Самоподготовка"

Для подготовки к лабораторной работе Вам следует повторить математику и математические методы за 1-2 курс, изучить лекции и ответить на следующие вопросы:

  1. Каков смысл доверительного интервала?

  2. Сформулируйте метод нахождения дисперсии и средне квадратического отклонения.

  3. Для чего используется коэффициент Стьюдента?

  4. Что такое дисперсия результата в экологическом смысле?

  5. В чем смысл "правила трех сигм"?

  6. Как перейти от доверительного интервала к стандартной форме записи результатов эксперимента?

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО II ЭТАПУ:

“Выполнение лабораторной работы”

Для выполнения этапа наберите описанную в блоке информации программу, реализующую алгоритм нахождения доверительного интервала. Оцените результат по критериям поиска грубых ошибок (промахов) эксперимента. Если таковые присутствуют, удалите их из выборки и проведите расчет заново. Выборку используйте по данным роста и массы студентов свей группы (студенты однокурсники) или из литературы разных пород рыб, одного года (например, двухлетний язь или карп и т.д.)

Блок информации

Рассмотрим первичную обработку результатов измерений до доверительного интервала. Определив в предыдущей работе №8 круг основных задач СОРЭИ и исходную информацию в области математической статистики, рассмотрим теперь конкретное применение указанного подхода при выполнении эколого-технических измерений, понимая под этим любые измерения в биологии, экологии, медицине, физике, химии, т.е. в естествознании вообще.

Прежде всего отметим, что вместо вероятности события P(x) мы будем пользоваться частотой P*(x)=m/N (см. л.р. №8) и тогда все формулы ТВ можно применить с некоторой точностью, заменив P(x) на P*(x). При малом числе измерений (n<30) вместо распределения Гаусса используем распределение Стьюдента, которое внесет некоторые коррективы в формулы, приведенные ниже. Сразу отметим, что в экологии (как и в физике, технике и др. науках) могут быть прямые измерения и косвенные. Начнем рассмотрение с 1-го блока, как наиболее распространенного.

I Прямые измерения. Расчет доверительного интервала.

Прежде всего отметим, что общая схема (алгоритм) первичной статистической обработки результатов измерений примет следующий вид для случая прямых измерений:

1. Нахождение выборочного математического ожидания (или среднего арифметического):

(9.1)

2. Нахождение статистической (выборочной) дисперсии (или центрального момента 2-го порядка):

(9.2)

3. Определение статистического (выборочного) среднего квадратического отклонения СВ:

(9.3)

Если n велико, то величины , D*(x), могут хорошо характеризовать истинные значения математического ожидания, дисперсии и среднего квадратического отклонения СВ (измеряемой величины). Иная ситуация возникает при небольших n (n<30, например). Вообще говоря тоже является случайной величиной, как и каждая xi, поэтому оно тоже может характеризоваться средним квадратическим отклонением, которое, как показывают расчеты для распределения Стьюдента, определяется по формуле:

.

Легко видеть, что с увеличением n средняя квадратическая ошибка среднего арифметического (выборочного математического ожидания) 0. Так как нас интересует истинное значение, x0 для СВ, к которому стремится , то представляет интерес оценка точности наших измерений и ответ на вопрос, как близко подходит к xo.

4. В первом случае используем правило трех сигм и определяем наиболее возможную ошибку отдельного измерения

. (9.4)

Как известно (см. выше), вероятность непопадания СВ в интервал чрезвычайно мала (1-0.9972=0.0028), поэтому те значения СВ, которые не попали в этот интервал, мы должны отбросить (промахи!), а вычисления повторить заново. Тогда схема вычисления (алгоритм) примет вид:

123456 (9.5)

5. Далее, точность прямого измерения x, т.е. разность между xo (истинным значением СВ) и ее можно определить по формуле:

(9.6)

где tk, - параметр, при малых n задается таблицей 1 (для критерия Стьюдента ). Этот параметр можно определить из распределения Стьюдента. Он зависит от числа степеней свободы k, которое на единицу меньше числа измерений, т.е. и доверительной вероятности .

k=n-1 (9.7)

6. Для ответа на второй вопрос мы должны записать доверительный интервал ( ), внутрь которого с доверительной вероятностью  попадает неизвестное нам истинное значение xo СВ. Выбор  определяется требованиями практики. В биологических исследованиях можно брать =0.9, т.е. из 100 случаев, в среднем, 90 раз вычисленный нами доверительный интервал накроет истинное значение СВ, а в 10 случаях - нет. Иногда предъявляют более жесткие требования (в авиации, медицине =0.999, в космонавтике – 0,99999).

Важно отметить, что истинные значение СВ мы так и не определим, но получаем определенную оценку xo. Этим объясняется невозможность исключить случайные ошибки. Иногда молодые исследователи говорят, что провели несколько измерений, а результат одинаковый, вывод "нет ошибки". Это утверждение неверное, т.к. фактически такая ситуация означает, что x СВ меньше абсолютной погрешности прибора xnp, тогда нужно просто приравнять эти две величины без дополнительных расчетов, т.е. сразу 16.

II. Косвенные измерения.

Приведенные выше методы расчета применимы при работе с любым измерительным прибором в экологии и при любых прямых измерениях. Однако, во многих случаях необходимая ЭТВ получается при расчете с использованием известных функциональных зависимостей между искомой величиной и непосредственно измеряемыми x1, x2,...,xn , т.е. y=y(x1...xn). В этом случае для каждой xi, используя алгоритм 1-6, находят xi и xi, а затем находят среднюю квадратическую погрешность косвенного измерения y по формуле:

(9.8)

где y/xi - частная производная от у по хi.

Приведем простейший пример, если определяют объем цилиндра (часть ствола дерева, червь и т.д.) V=R2h, то сначала по схеме 1-6 находят , а затем, используя (9.8)

.

Расчет средней квадратической ошибки среднего арифметического

,

точности измерения и доверительного интервала ( ) ничем не отличается от общей схемы 1-6.

В общем случае естествоиспытатель (биоэколог) должен сам уметь составлять алгоритм расчета доверительного интервала. Конкретный пример такого алгоритма (программы) представлен в приложении 1. В данной работе Вам придется измерить параметры (масса и рост) каждого студента группы и для этих двух СВ (m и n) рассчитать доверительные интервалы. Если бы выборка была побольше, например, юношей n1>10 и девушек n2>10, то можно было бы определить доверительные интервалы для юношей и девушек и сделать вывод о наличии (или отсутствии) гендерных различий среди населения Югры.

Наконец, отметим еще одно важное замечание. Если для данной выборки мы получим и , то любой объект попавший в интервал ( , ) характеризуется как объект со средними значениями (массы, роста и т.д.). Если же его данные попали в интервал ( ) или в интервал ( ), то мы говорим, что рост (например, h) человека ниже среднего или выше среднего. Наконец, если параметры объекта лежат за границей , то это или низкий (рост) или высокий (рост) показатель объекта. Так в экологии мы можем говорить о загрязненности (воды, атмосферы, почвы, крови или лимфы человека) в пределах нормы, выше (ниже) нормы (среднее) или о высоких (низких) показателях внешней для человека (или внутренней) среды.

Доверительные интервалы можно сравнивать, но для этого лучше применять статистическую проверку гипотез (см. Лаб.р. №12, №13).

Приложение 1

ПРОГРАММА РАСЧЕТА ДОВЕРИТЕЛЬНОГО ИНТЕРВАЛА

REM *******************************************************

CLS

j = 0: Dsp = 0:

INPUT "Tkb (критерий Стьюдента) = ", Tkb

INPUT "количество n = ", n

DIM x(n)

REM *********** заполнение массива **************************

FOR i = 1 TO n

PRINT "x ("; i; ") = "; : INPUT "", x(i)

NEXT i

REM *******************************************************

REM ************** среднее значение x ***********************

FOR i = 1 TO n

j = j + x(i)

NEXT i

j = j / n

PRINT "Среднее арифметическое значения <x> = "; j

REM *******************************************************

REM *********** Статистическая дисперсия ********************

FOR i = 1 TO n

Dsp = Dsp + (j - x(i)) * (j - x(i))

NEXT i

Dsp = Dsp / n

PRINT "Статистическая дисперсия, D = "; Dsp

REM ******** Cреднее квадратичное отклонение ****************

Sc = SQR(Dsp)

PRINT "Среднее квадратичное отклонение x = "; Sc

REM *Среднее квадратичное отклонение среднего арифметического *

k = n - 1

Sxc = Sc / (SQR(k))

PRINT "Среднее квадратичное отклонение среднего арифметического ="; Sxc

REM ************ доверительный интервал ********************

dx = Tkb * Sxc

PRINT "доверительный интервал = ("; j - dx; ","; j + dx; ")"

Лабораторная работа №10

Метод наименьших квадратов (МНК) в расчете уравнения регрессии

Цель работы.

Студент должен знать: смысл регрессии x по y (регрессионных зависимостей), способы определения параметров регрессии (для линейной и квадратичной регрессии), метод наименьших квадратов.

Студент должен уметь: произвести расчет уравнения регрессии по результатам экспериментов произвести анализ программ ЭВМ для реализации метода регрессионного анализа.

Практическое значение выполняемых исследований

Различные величины, наблюдаемые в эксперименте, могут явно или неявно зависеть друг от друга. В последнем случае мы говорим о регрессии y по x Использование программ в языках программирования (например, BASIC) для нахождения параметров уравнения регрессии и обработки результатов экологических исследований. Данная работа позволяет обучаемому получить необходимые навыки в этой области.

Литература

  1. В.М. Еськов, О.Е. Филатова, В.А. Рачковская Статистическая обработка результатов измерений в практикуме по экологии и естествознанию.- Сургут: Изд. СурГУ, 1999.- 43 с.

  2. М. Дж. Кендалл, А. Стьюарт. Теория распределений.

  3. В. В. Гмурман. Теория вероятностей и математическая статистика. – М.:

  4. Ю. В. Линник. Метод наименьших квадратов. – М. – 2001. – 196 с.

Бюджет времени

На изучение темы отводится 6 часов, из них 2 часа лекций, 2 часа лабораторные занятия и 2 часа на самоподготовку.

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО I ЭТАПУ

"Самоподготовка"

Для подготовки к лабораторной работе Вам следует повторить пройденный материал и изучить лекции. Ответьте на следующие вопросы:

1. Что такое регрессионное уравнение? Для чего его используют?

2 . Как проверяется соответствие гипотезы эксперименту методом наименьших квадратов?

3. Приведите алгоритм нахождения линейной регрессии.

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО II ЭТАПУ:

“Выполнение лабораторной работы”

Для выполнения этапа наберите описанную в блоке информации программу, реализующую алгоритм нахождения регрессионных уравнений. Оцените полученные параметры уравнения регрессии и сделайте выводы.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]