Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Малинин_1.doc
Скачиваний:
10
Добавлен:
06.11.2018
Размер:
152.58 Кб
Скачать

Часть 1. Первичный анализ данных

Глава 1. Основные понятия случайной величины

1.1. Классификация случайных величин

В статистике понятие случайной величины является одним из центральных. Вообще говоря, под случайной величиной понимают такую переменную величину, которая в результате испытания (измерения) в одинаковых условиях может принимать то или иное заранее неизвестное значение. Случайные величины обычно обозначаются прописными буквами латинского алфавита, т.е. X, Y, Z, а их конкретные значения, называемые вариантами, обозначаются строчными буквами с индексом. Например, если случайная величина Х имеет n возможных значений, то они будут обозначены как: x1,x2,...,xn.

Рассмотрим классификацию случайных величин (рис. 1.1). Если в результате измерения (испытания, наблюдения) регистрируется только одно число, то такую случайную величину принято называть одномерной. Она всегда является скалярной. Если же результатом измерения (испытания) является регистрация целого набора характеристик, то случайную величину называют многомерной, которая всегда уже является векторной. Например, многомерной величиной является вертикальное распределение температуры в океане или в атмосфере. Действительно, температура, измеренная на стандартных горизонтах в период выполнения многосуточной гидрологической станции, имеет две шкалы измерения: глубина и время и, следовательно, уже не может быть отнесена к одномерной случайной величине.

Различают два типа одномерных случайных величин: непрерывные и дискретные (прерывные). Случайная величина называется непрерывной, если она может принять любое значение из некоторого определенного диапазона числовой оси, который, в частности, может быть и бесконечным. Примером могут служить многие гидрофизические (температура воды, плотность, скорость течения и т.д.), гидрохимические (соленость, содержание кислорода, углекислого газа и т.д.) и иные характеристики.

Случайная величина называется дискретной, если она принимает не любые значения, а только их конечное или счетное множество. В качестве примера дискретной случайной величины можно привести шкалы облачности, ледовитости, степень волнения в баллах и т.п. Например, ледовитость измеряется в пределах от 0 до 10 баллов. Поэтому ряд наблюдений ледовитости может состоять только из целых цифр этого диапазона. Заметим, что на практике непрерывные случайные величины за счет точности измерений и округлений или за счет дискретности измерений непосредственно приборами заменяются дискретными случайными величинами. Например, температура воздуха измеряется с точностью до десятых градуса Цельсия, а уровень моря – до сантиметров. Поэтому в дальнейшем будем рассматривать только дискретные случайные величины.

Кроме того, в зависимости от своей природы и способов описания одномерные дискретные случайные величины подразделяются на количественные, ординальные (порядковые) и номинальные (классификационные). В основе каждой из указанных случайных величин находится та или иная шкала наблюдения (измерения). Так, количественная случайная величина характеризуется метрической шкалой, в которой традиционно принятыми единицами измерения являются системы СИ или СГС. Информация в метрической шкале представляется в виде вещественных чисел.

Ординальная случайная величина соответствует порядковой (ординальной) шкале, которая выражает оценку интенсивности явления или процесса в квантованном (дискретном) виде. Например, в таком виде задается состояние на поверхности моря: от 0 баллов при полном штиле до 12 баллов при урагане. Информация при использовании порядковой шкалы выражается целыми числами баллов в принятых интервалах.

Номинальная случайная величина, соответствующая номинальной шкале, характеризует класс или тип явления, принадлежность к которому определяется по совокупности признаков. Так, вертикальные градиенты температуры, солености и плотности воды задают тип вертикальной стратификации в океане: устойчивый, неустойчивый и безразличный, а форма волнения и его зависимость от ветра позволяют подразделить волны на свободные и вынужденные. Следует отметить, что в номинальной шкале, как правило, фиксируется наличие или отсутствие явления, но не его интенсивность. Поэтому при проведении массовых расчетов на ЭВМ значения элементов в номинальной шкале кодируются как признак качества да (1), нет (0) либо посредством логических или символьных переменных.

Если исследователю наряду с анализируемым свойством известны все возможные его градации вместе с правилом отнесения обследованного в ходе случайного эксперимента объекта к одной из этих градаций, то соответствующую номинальную величину называют категоризованной. В противном случае, она называется некатегоризованной.

Описание текущего состояния океана имеет ту особенность, что исчерпывающая характеристика какого-либо его процесса может быть дана набором нескольких переменных, выражаемых в различных шкалах. Например, полная характеристика волнения содержит информацию в номинальной шкале (вынужденная или свободная волна), порядковой шкале (балл состояния поверхности моря), метрических шкалах (направление распространения волны в градусах, длина волны и ее высота в метрах, период волны в секундах). Естественно, это существенно затрудняет процедуру статистической обработки и последующего анализа океанологических процессов и явлений.