Добавил:
nastia.sokolowa2017@yandex.ru Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Общая_климатологияКн1

.pdf
Скачиваний:
5
Добавлен:
20.02.2024
Размер:
10.41 Mб
Скачать

параметр λ тогда может быть интерпретирован как среднее число новых покупателей за единицу времени.

Широкое распространение получило и логарифмически нормальное распределение, которое формируется из нормального распределения путем функционального преобразования случайной величины: x = ey, где x – случайная величина логнормального распределения, y – случайная величина нормального распределения. Поэтому, если случайная величина имеет логнормальное распределение, то ее логарифм имеет нормальное распределение. Случайная величина x при этом является непрерывной и принимает только положительные значения. Иначе логнормальное распределение называют усеченным нормальным распределением по нулевому значению. Графики плотности вероятности логнормального распределения при различных значениях µ и дисперсия σ2 приведены на рис. 3.8.

В отличие от симметричного нормального распределения, логнормальное распределение не является симметричным и имеет скошенность или асимметрию, что связано с наличием нулевого предельного значения. Логнормальное распределение удовлетворительно описывает распределение частот частиц по их размерам при случайном дроблении, например, размеров градин в граде. В климатологии скошенность распределений среднемесячных температур воздуха может иметь место из-за предела тепла или холода. Так, например, распределение температур января в г. Якутске несимметрично в связи с наличием предела самых низких температур (ниже практически некуда), тогда как относительно теплые температуры могут быть различными отдельными затоками тепла, что создает длинный правый «хвост» частотного распределения.

Наибольшее распространение в гидрометеорологии получило гамма-распределение или распределение Пирсона III типа. По определению гамма распределение – это двухпараметрическое семейство абсолютно непрерывных распределений, приведенное на рис. 3.8, где ν – параметр формы, λ – параметр масштаба. Коэффициент скошенности (асимметрии или сдвига) в нем жестко связан со стандартным отклонением (коэффициент асимметрии равен удвоенному коэффициенту вариации Cs = 2Cv), но часто использу-

160

ют и трехпараметрическое представление этого распределения. Плотность трехпараметрического гамма-распределения имеет вид:

 

1

 

a 1

 

a

 

x c

 

f (x, a,b, c)

 

(x c)

 

b

 

exp

 

 

, x≥c,

 

 

 

 

 

Г (a)

 

 

 

 

 

b

 

f (x, a,b, c) 0 ,

x<c,

 

 

 

 

 

(3.11)

где: a – параметр формы , b – параметр масштаба, и с – параметр сдвига, a > 0, b > 0.

Множитель 1/Γ(а) является нормировочным, он введен, что-

бы:

 

 

f (x, a,b,c)dx 1 ,

(3.12)

 

 

здесь Γ(а) – гамма-функция:

 

 

 

Г (a) xa 1е x dx

(3.13)

0

 

Частным случаем гамма-распределений при а =1 является экспоненциальные распределения (с λ=1/b). При натуральном а и с = 0 гамма-распределения называются распределениями Эрланга. Если случайная величина X имеет гамма-распределение с параметром формы а таким, что d = 2a – целое число, b = 1 и с = 0, то 2Х имеет распределение хи-квадрат с d степенями свободы. Случайная величина X с гамма-распределением имеет следующие характеристики: математическое ожидание М(Х) = ab + c, дисперсию

D(X) = σ2 = ab2, асимметрию равную 2 / a . Нормальное распределение также предельный случай гамма-распределения.

Из наиболее сложных видов аналитических распределений, учитывающих не только центр распределения, разброс относи-

161

тельно центра, асимметрию, но также и пределы изменения случайной величины в каком-либо интервале является бетараспределение (рис. 3.8). Бета-распределение на самом деле больше соответствует природе климатических характеристик, которые должны иметь пределы в существующих на планете квазиоднородных условиях. Так, минимальная зарегистрированная температура на Земле — –89,2°С на антарктической станции “Восток”, и это является практическим нижним пределом, притом для зимних специфических условий изолированного холодного континента. Максимальная же температура на Земле, зарегистрированная в тени, составляет +58°С.

Плотность бета-распределения выражается формулой:

f (x, , , A, B)

1 Г ( )

(

x A

)

1

(

B х

)

1

, (3.14)

 

 

 

 

 

 

 

B A Г ( )Г ( )

B A

 

В А

 

 

 

 

 

 

 

 

 

где: α > 0 – коэффициент формы, β > 0 – коэффициент масштаба, A, B – пределы изменения случайной величины x.

Бета-распределение не нашло широкого применения в гидрометеорологии и климатологии из-за того, что для надежного вычисления всех четырех параметров требуются ряды продолжительностью многие сотни лет, которые отсутствуют.

Все рассмотренные распределения являются аналитическими, т. к. получены теоретически с помощью математических выкладок вне привязанности к конкретному объекту исследований. Известным примером физического распределения является распределение молекул по скоростям Джеймса Максвелла, полученное в 1860 г. при помощи статистической механики. Оно лежит в основании кинетической теории газов, которая объясняет многие фундаментальные свойства газов, включая давление и диффузию. Распределение Максвелла также применимо для электронных процессов переноса и других явлений и к множеству свойств индивидуальных молекул в газе.

В распределении рассматривается общее число n молекул, находящихся в состоянии беспорядочного теплового движения при определенной температуре. После каждого акта столкновения

162

между молекулами, их скорости меняются случайным образом. В результате невообразимо большого числа столкновений устанавливается стационарное равновесное состояние, когда число молекул в заданном интервале скоростей сохраняется постоянным. Найдем в этих условиях, каково число частиц dn из общего числа n имеет скорость в интервале от ν до ν + Δν. Плотность распределения Максвелла имеет вид:

 

dn

 

4

 

 

m

)3 / 2 2e

m 2

 

 

f ( )

 

 

(

2kT ,

(3.15)

nd

 

 

 

2kT

 

 

 

 

 

 

 

 

 

где: m – масса, характеризующая вид газа; Т – температура как параметр состояния.

Как следует из (3.15), в этом распределении статистические показатели связаны с физическими характеристиками. В показателе степени е стоит отношение кинетической энергии, соответствующей данной скорости ν (2), к средней энергии теплового движения молекул (2kT). При этом давление Р и объем газа V на распределение молекул не влияют. Поэтому распределение Максвелла характеризует распределение молекул по значениям кинетической энергии, то есть показывает, какова вероятность при данной температуре иметь именно такое значение кинетической энергии.

Известный математик Карл Пирсон (1857–1936) объединил большинство известных аналитических распределений, представленных первыми четырьмя моментами, в виде семейства распределений общего вида (табл. 3.1):

dp(x)

 

 

x a

 

( p(x))

,

(3.16)

dx

b

b x b x2

 

 

 

 

 

0

1

2

 

 

 

где: a, b0, b1, b2 – параметры.

163

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 3.1

 

 

 

 

Основные виды семейства распределений Пирсона

Тип

 

 

 

 

 

Плотность распределения

 

 

Название

1

p(x) k (1

 

x

)

m1

(1

 

 

x

)

m2

, a x a

, m 1, m

 

1

бета-распределение 1-ого

 

 

 

a1

 

 

 

 

 

 

 

 

 

 

 

 

 

a2

 

 

 

 

1

2

1

 

 

 

 

2

 

рода

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

x

2

 

 

)m , a x a, m 1

 

равномерное распределение

 

p(x) k(1

 

 

 

 

 

 

 

 

a2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

p(x) k(1

 

x

) a e x , a x , 0, a 0

гамма-распределение и хи-

 

 

 

 

 

 

 

 

 

квадрат распределение

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

x

2

 

 

 

 

m

 

 

 

arctg ( x )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p(x) k (1

 

 

 

 

 

 

)

 

 

 

 

e

 

 

 

 

 

 

 

a

, x

, a

0, 0

 

 

a

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

p(x) kx q e

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

сводится преобразованиями

 

x

,0 x , a 0, q 1

 

к типу III

6

I (x)

 

 

 

1

 

 

 

 

 

 

 

 

( v1 )

2

2 1 x(1 v1 x)

 

2 , x 0

бета-распределение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

v1 v 2

 

 

 

 

v1 v 2

 

 

 

 

1 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2-го рода и Фишера-

 

 

 

 

v1

 

 

v2

) v2

 

 

 

 

v2

 

 

 

 

 

 

 

 

B(

,

 

 

 

 

 

 

 

 

 

 

Снедекора распределение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(F-распределение)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

x

2

 

) m , x , m

 

1

 

 

 

 

t-распределение Стьюдента

 

p(x) k(1

 

 

 

 

 

 

 

 

 

 

a2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8p(x) k(1 ax ) m , a x 0,0 m 1

9p(x) k(1 ax )m , a x 0, m 1

10

p(x) ke

x m

 

 

 

 

 

показательное (экспоненци-

 

 

 

, m x , 0

альное) распределение

 

 

 

 

 

 

 

 

11

p(x) kx m ,b x , m 0

распределение Парето

12

1

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a1

)m , a x a

 

 

 

 

 

 

p(x) (

 

 

 

 

1

 

 

 

 

2

,

m

 

 

 

 

 

 

 

 

 

 

x

1

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

a2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Семейство распределений Пирсона и близкое к нему семейство Джонсона уже многие десятилетия используются в задачах аппроксимации эмпирических распределений, расчета и оценки вероятностных характеристик. Спектр его применений достаточно широк: в задачах анализа изображений, в моделировании радиоло-

164

кационных сигналов, в оценке рисков, в страховом деле, в регрессионном анализе, в оценке надежности, а также во многих других прикладных задачах теории вероятностей и математической статистики. Существуют также работы и по модификации семейств распределений. Семейства распределений Пирсона и Джонсона сравнимы по своим аппроксимирующим возможностям.

Параметры распределений и их оценка

Параметры распределения – это величины, полностью описывающие какое-либо распределение и входящие в функцию распределения в явном виде. Так, например, нормальное распределение полностью описывают два параметра: среднее значение и дисперсия, распределение Пирсона III типа – три параметра: среднее значение, дисперсия, асимметрия. Значения параметров могут быть определены из теоретических соображений или оценены по выборке, что и осуществляется на практике. По данным наблюдений рассчитываются не точные значения параметров, а приближенные, выборочные. Поэтому говорят, что осуществляется оценка параметров.

Параметры распределения по степени сложности вида распределения делятся на параметры центра распределения, параметр разброса данных относительно центра распределения, параметр скошенности (несимметричности распределения) и параметр плосковершинности распределения.

К параметрам центра распределения относятся: среднее значение, мода и медиана (рис. 3.9 слева). Среднее значение вычисляется как среднее арифметическое по ряду наблюдений. Модой распределения называется наиболее вероятное значение случайной величины: точка максимума плотности распределения. Медиана (по латыни «середина») – это такое число выборки, что ровно половина из элементов выборки больше него, а другая половина меньше него. В общем случае медиану можно найти, упорядочив элементы выборки по возрастанию или убыванию и взяв средний элемент.

165

Рис. 3.9. Параметры центра распределения (слева)

иотклонения от центра (справа)

Всимметричном, например, нормальном распределении, все три параметра центра распределения совпадают. Если же распределение несимметрично, как показано на рис. 3.9, то длинный правый «хвост» распределения определяет, что по горизонтальной оси вначале имеет место мода, затем медиана и уже после них – среднее значение. В таких случаях явно асимметричных распределений медиана является более обоснованным показателем центра распределения, чем среднее значение. Наглядным примером может служить распределение доходов населения, когда незначительная часть работающих имеет очень высокие доходы, что искусственно завышает и средний доход для всех остальных. Медиана же дает более правдоподобную картину и не зависит от экстремальных значений в выборке как среднее арифметическое. Часто при статистических обобщениях используется и модальное значение, которое соответствует наиболее часто встречающейся величине в выборке.

Параметр, который характеризует теоретически ожидаемое отклонение случайной величины от ее математического ожидания, называется дисперсией, а квадратный корень из дисперсии – средним квадратическим отклонением (СКО). Как уже отмечалось для нормального распределения, чем больше СКО, тем больше разброс случайной величины и тем меньше вероятность центра распределения (рис. 3.9 справа). Часто требуется сравнивать дисперсии выборок с разными средними, для чего вводится понятие нормированного СКО – коэффициента вариации (Cv), который равен СКО, деленное на среднее значение.

166

Два других параметра асимметрия и эксцесс характеризуют возможные отклонения от симметричного (нормального) распределения двух видов. В первом случае одна из спадающих ветвей распределения удлинена и распределение скошено или асимметрично. Если удлинена левая ветвь, то говорят об отрицательной или левосторонней асимметрии. Если же удлинена правая ветвь, то асимметрия является положительной и правосторонней (рис. 3.10 слева). Или, иначе: если основная часть распределения в левой стороне, то асимметрию называют положительной и наоборот. Подругому, асимметрия характеризует различие «хвостов» распределения и положительна при более тяжелом правом хвосте и отрицательна при более тяжелом левом хвосте. Для симметричных распределений асимметрия равна нулю.

Рис. 3.10. Параметры асимметрии (слева) и эксцесса (справа)

Второй вид отклонения от симметрии связан с тем, что максимум плотности вероятности расположен выше или ниже, чем у нормального распределения. Если максимум выше и кривая острее, то, эксцесс положительный, при отрицательном эксцессе максимум ниже и распределение более плоское, чем нормальное (рис. 3.10 справа). При эксцессе, равном –2, распределение распадается на два. Можно считать также, кто эксцесс характеризует тяжесть хвостов распределения: положительные значения эксцесса соответствуют распределениям с более тяжелыми хвостами, чем у нормального распределения.

Оценки параметров распределения, как и любые получаемые по выборке статистики, должны удовлетворять следующим четырем условиям.

167

1)Оценки параметров должны быть несмещенными (unbiased), т. е. при очень большом числе испытаний среднее значение оценок должно стремиться к истинному значению генеральной совокупности. Если этого нет, то оценка смещена и смещение (bias) может быть обусловлено ошибками измерений и другими причинами. Такие ошибки называются систематическими и приводят к завышению или занижению оценки.

2)Оценки должны быть состоятельными или согласованными, т. е. с ростом объема выборки они должны стремиться к соответствующему параметру генеральной совокупности.

3)Оценки должны быть эффективными (efficient), т. е. для выборок равного объема они должны иметь минимальное рассеяние и дисперсию.

4)Оценки должны быть достаточными (sufficient), т. е. не должна возникать необходимость в дополнительной информации об оцениваемом параметре и статистика должна содержать всю основную возможную информацию.

Три из этих условий (состоятельность, эффективность, достаточность) были введены Р.А. Фишером в 1925 г.

Для оценки параметров по выборочным данным разработаны многочисленные методы и среди них особое значение имеет метод максимального правдоподобия, предложенный Р. Фишером в 1912 г. Это универсальный метод оптимального оценивания неизвестных параметров, применяемый в случаях, когда вид функции распределения известен. В этом методе оценки неизвестных параметров равны значениям, при которых полученная выборка имеет максимальную вероятность появления, т. е. в качестве оценок отыскиваются значения, максимизирующие функцию максимального правдоподобия для параметров, в предположении, что эти параметры существуют. Этот метод построения точечных оценок параметров находится в тесной связи с методом наименьших квадратов. Оценки, полученные методом максимального правдоподобия, являются состоятельными, асимптотически эффективными, но их несмещенность требует проверки.

Так, например, для нормального закона распределения функция максимального (наибольшего) правдоподобия для выборки объемом n имеет следующий вид:

168

 

1

 

 

 

n

(x

i

)2

 

 

L( , )

 

 

 

 

exp

 

 

 

 

(3.17)

 

 

 

n

 

2

2

( 2 ))

 

 

 

 

i 1

 

 

 

 

Логарифм функции правдоподобия будет равен:

 

 

 

 

n

 

 

 

 

 

ln L( , ) n ln(

2 ) n ln (xi )2 / 2 2

 

(3.18)

 

 

i 1

 

 

и тогда система уравнений для нахождения оценок параметров будет следующая:

ln L( , ) / n

i 1

ln L( , ) / n / n

i 1

а сами оценки будут равны:

(xi ) /

2

 

0 ;

 

 

 

 

 

 

(xi ) /

3

 

0 ; (3.19)

 

 

 

 

 

 

 

n

 

xi / n ,

(3.20)

 

i 1

 

 

n

 

2

(xi )2 / n

(3.21)

i 1

Вместе с тем, проверка смещенности параметров показывает, что дисперсия, вычисленная по (3.21), является смещенной и следует учитывать соответствующую поправку, в результате чего формула для расчета несмещенной оценки дисперсии будет иметь вид:

 

n

 

2

(xi )2 / n 1

(3.22)

i 1

169

Соседние файлы в предмете Климатология и метеорология