Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эл. мат. статистики_Ремизов.doc
Скачиваний:
4
Добавлен:
15.11.2019
Размер:
174.08 Кб
Скачать

Глава 3 элементы математической статистики

Математическая статистика – раздел математики, посвященный математическим методам обработки, систематизации и использования статистических данных для научных и практических выводов.

§ 3.1. Основные понятия математической статистики

В медико-биологических задачах часто приходится исследовать распределение того или иного признака для очень большого числа индивидуумов. У разных индивидуумов этот признак имеет различное значение, поэтому он является случайной величиной. Например, любой лечебный препарата имеет различную эффективность при его применении к различным пациентам. Однако для того, чтобы составить представление об эффективности данного препарата, нет необходимости применять его ко всем больным. Можно проследить результаты применения препарата к сравнительно небольшой группе больных и на основании полученных данных выявить существенные черты (эффективность, противопоказания) процесса лечения. В связи с этим вводятся два понятия – генеральная совокупность и выборка.

Генеральная совокупность – подлежащая изучению совокупность однородных элементов, характеризуемых некоторым признаком.

Этот признак может быть как непрерывной, так и дискретной случайной величиной.

Состав генеральной совокупности определяется целями исследования. Например, если нас интересует распространенность какого-либо заболевания в некотором регионе, то генеральная совокупность – все население региона. Если же мы хотим выяснить подверженность этому заболеванию мужчин и женщин по отдельности, то следует рассматривать две генеральные совокупности.

Для изучения свойств генеральной совокупности отбирают некоторую часть ее элементов.

Выборка – часть генеральной совокупности, выбираемая для обследования (лечения).

Если это не вызывает недоразумений, то выборкой называют как совокупность объектов, отобранных для обследования, так и совокупность значений исследуемого признака, полученных при обследовании. Эти значения могут быть представлены несколькими способами.

Простой статистический ряд – значения исследуемого признака, записанные в том порядке, в котором они были получены.

Пример простого статистического ряда, полученного при измерении скорости поверхностной волны (м/с) в коже лба у 20 пациентов, приведен в табл. 3.1.

Простой статистический ряд

Таблица 3.1

n

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Х

35

32

38

34

42

36

39

33

28

47

39

33

39

41

40

46

28

37

36

38

Просто статистический – основной и самый полный способ записи результатов обследования. Он может содержать сотни элементов. Окинуть такую совокупность одним взглядом весьма затруднительно. Поэтому большие выборки обычно подвергают разбиению на группы. Для этого область изменения признака разбивают на несколько (N) интервалов равной ширины и подсчитывают относительные частоты (ni/n) попадания признака в эти интервалы. Ширина каждого интервала равна:

d = (xmax – xmin)/N.

Границы интервалов имеют следующие значения:

xmin; xmin + d; xmin + 2d; ….. xmax

Если какой-то элемент выборки является границей между двумя соседними интервалами, то его относят к левому интервалу. Сгруппированные таким образом данные называют интервальным статистическим рядом.

Интервальный статистический ряд – это таблица, в которой приведены интервалы значений признака и относительные частоты попадания признака в эти интервалы.

В нашем случае можно образовать, например, такой интервальный статистический ряд (N = 5, х = 4), табл. 3.2:

Интервальный статистический ряд

Таблица 3.2

х, х+х

28–32

32–36

36–40

40–44

44–48

Р*= ni/n

0,10

0,25

0,40

0,15

0,10

Здесь к интервалу 28–32 отнесены два значения равные 28 (табл. 2), а к интервалу 32–36 – значения 32, 33, 34 и 35.

Интервальный статистический ряд можно изобразить графически. Для этого по оси абсцисс откладывают интервалы значений признака и на каждом из них, как на основании, строят прямоугольник с высотой, равной относительной частоте. Полученная столбчатая диаграмма называется гистограммой.

Рис. 3.1. Гистограмма.

На гистограмме статистические закономерности распределения признака просматриваются достаточно отчетливо. При большом объеме выборки (несколько тысячь) и малой ширине столбцов форма гистограммы близка к форме графика плотности распределения признака.

Число столбцов гистограммы можно выбрать по следующей формуле:

N = 1 + 3,3lg n. (3.1)

Построение гистограммы вручную – процесс долгий и нудный. Поэтому разработаны компьютерные программы для автоматического построения.