Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

02_03_розділи

.doc
Скачиваний:
9
Добавлен:
19.03.2015
Размер:
264.19 Кб
Скачать

2 Поняття про закон розподілу

випадкової величини

У попередньому розділі ми визначились з поняттям випадкової величини, враховуючи, що вона може бути дискретною (дискретного типу) чи неперервною (неперервного типу), та із загальним поняттям про ймовірність випадкових і елементарних подій, функція від яких, чим власне і є випадкова величина, утворює числову множину, тобто набір значень певної випадкової величини. Більш детально визначимося із безпосереднім зв'язком останніх з відповідними їм ймовірностями.

Отже, уявимо, що, наприклад, дискретна випадкова величина X(ω)д може набирати значення x1, x2, x3, xn з відповідними їм ймовірностями p1, p2, p3, pn. Приклад останнього за вихідними даними р.1 наведений на рис.2.1, де ймовірності надписані над вершинами так званого полігона (многокутника) розподілу (див. р.4), а значення випадкової величини – в основі перпендикулярів з цих вершин до осі абсцис. При цьому для спрощення умовно прийнято, що ймовірність рі "змінюється як" наведена у прикладі емпірична ймовірність νі, чому і відповідає символ "~". Зрозуміло, що цілком визначити дискретну випадкову величину можна шляхом перерахунку (позначення) всіх значень цієї величини та задавання ймовірностей, з якими випадкова величина може набирати кожне з своїх значень.

Рис.2.1 – Полігон (многокутник) емпіричного розподілу кількості діб з заморозками на ґрунті у травні за 20-річний період спостережень на дослідній ділянці (див. р.1, рис.1.13)

У цілому співвідношення, що встановлює зв'язок між можливими значеннями довільної випадкової величини та відповідними їм ймовірностями, і зветься законом розподілу ймовірностей значень випадкової величини (або просто законом розподілу випадкової величини) у широкому розумінні. Увівши таке поняття, слід одразу, аналогічно до розглянутого у р.1 змісту емпіричної та теоретичної ймовірності, розрізнити і емпіричні та теоретичні розподіли випадкової величини.

Неминуча просторово-часова обмеженість випадкових експериментів, що здійснюються дослідниками географічних проблем з метою спостереження та фіксації явищ і створення баз даних щодо динамічних параметрів стану геосистем, і призводить до обмеженості фактографічної географічної інформації та наявності помилок, інколи вельми істотних, у конкретних значеннях згаданих параметрів. Отже, практично, провівши серію інструментальних спостережень за станом геосистем, хай навіть у багаторічному розрізі та з охопленням відносно значних за протяжністю структур чи складників цих систем, ми будемо мати справу з емпіричною вибіркою або рядом (чи просто далі "вибіркою") значень потрібних для оцінювання випадкових величин як параметрів геосистем (див. детальніше р.4). Зазначеній емпіричній вибірці (або емпіричному розподілу) можна загалом поставити у відповідність емпіричний закон розподілу. Він практично завжди у імовірнісних методах виражається через певну обумовлену графічну інтерпретацію отриманих емпіричних зв'язків між значеннями X(ω) та їхніми ймовірностями (наприклад, рис.2.1) без аналітичного запису та дослідження загальної схеми таких зв'язків, які у даному випадку є конкретними для обраного об'єкта (об'єктів) та того, що вивчається, природного явища, процесу тощо. Тобто емпіричні вибірки географічних даних є лише фрагментами їхньої генеральної сукупності (див. р.1), а емпіричні закони розподілу (точніше останні було б назвати графічною інтерпретацією емпіричних розподілів) – окремими, "спотвореними" помилками обмеженості спостережень, випадками теоретичних законів розподілу випадкової величини. А от теоретичний закон розподілу, по-перше, встановлює закономірності співвідношень генеральної (теоретично максимально можливої) сукупності значень випадкової величини та їхніх теоретичних ймовірностей. По-друге, такий закон базується на спеціально обумовленій теоретичній схемі формування та розподілу певної випадкової величини (схемі теоретичного розподілу), що відображає фізичні особливості динаміки цієї величини. По-третє, теоретичний закон описується аналітичним модельним рівнянням (або системою рівнянь) з однозначно визначеними таким рівнянням параметрами розподілу (див. р.4-6).

Визначивши принципову різницю між емпіричними та теоретичними законами розподілу, перейдемо до більш детального послідовного розгляду власне змісту поняття "закон розподілу" та його тлумачення у точному розумінні.

Для дискретної випадкової величини X(ω)д закон розподілу спрощено можна задати у вигляді таблиці, де в одному рядку будуть розміщені всі можливі значення цієї величини xi, а в іншому – відповідні їм ймовірності pi, тобто

{x1 x2 x3 xn}

(2.1)

{p1 p2 p3 pn}

При цьому число можливих значень дискретної випадкової величини може бути як скінченним (як у випадку з гральними костями щодо теоретичного розподілу наявних тільки шести їхніх граней, див. р.1, або стосовно емпіричного розподілу xn на рис.2.1), так і нескінченним (для теоретичних розподілів). Сума ж усіх ймовірностей другого рядка таблиці (2.1), як сума ймовірностей повної групи несполучних подій (див. р.1), дорівнює одиниці (для наочності можна підрахувати суму ймовірностей, надписаних над вершинами на рис.2.1), отже

pi = 1 , (2.2)

i

Власне набір (2.1) і розглядається як розподіл (ймовірностей) дискретної величини X(ω)д, який визначає ймовірність потрапляння значень такої величини у довільну, відповідну цим значенням, числову множину (діапазон) E на числовій осі 0x, у т.ч. у довільний інтервал з цього діапазону (див. р.1), тобто

P {X(ω)д E} = pi . (2.3)

xi E

Для випадкової величини неперервного типу X(ω) таблицю, аналогічну (2.1), скласти неможливо, позаяк неможливо перенумерувати значення такої величини, про що вже йшла мова у р.1. Більше того, як буде показано далі у цьому розділі, ймовірність того, що неперервна випадкова величина набере заданого конкретного значення, дорівнює нулю, хоч при цьому ймовірність того, що ця величина набере значення з довільного скільки завгодно малого інтервалу, що оточує таке значення, відрізняється від нуля. Тому, для принципового розуміння поданих далі міркувань зазначимо, що під розподілом довільної випадкової величини X(ω) (тобто, як для дискретного, так і неперервного розподілів) слід у загальному вигляді розуміти міру вигляду

P (E) = P {ω : X(ω) E} , (2.4)

при цьому запис у правій частині читається так само, як у формулі (1.25), і ця частина є визначеною, позаяк належить системі підмножин випадкових подій F, розглянутій у р.1.

Для безпосереднього задавання розподілу довільної випадкової величини, як універсальну її характеристику, застосовують закон розподілу випадкової величини у точному розумінні у двох формах: інтегральній та диференціальній (остання – для неперервних величин).

Інтегральний закон розподілу ймовірностей неперевищення значень довільної випадкової величини або просто інтегральний закон розподілу чи одновимірну функцію розподілу випадкової величини позначають F(x) і визначають як функцію ймовірності того, що довільна випадкова величина X(ω) набере значення, менше за певне число x, тобто

F(x) = P ((–∞ , x)) = P {X(ω) < x} , (2.5)

де P {X(ω) < x} і означає ймовірність того, що X(ω) < x.

Паралельно до функції (2.5) досить часто застосовують споріднену їй функцію розподілу, яка зветься інтегральним законом розподілу ймовірностей перевищення значень довільної випадкової величини (інколи, насамперед у гідрології та гідроекології, ймовірність перевищення називають забезпеченістю), яку позначають Pex(x) і визначають, що зрозуміло виходячи з її назви, як

Pex(x) = P ((x, ∞)) = P {X(ω) > x} . (2.6)

При цьому існує залежність

Pex(x) = 1 – F(x) , (2.7)

або

Pex(x) + F(x) = 1 . (2.8)

Якщо розглядати певне значення довільної випадкової величини X(ω) як положення точки на числовій осі абсцис, то значення функції розподілу F(x) на осі ординат позначає ймовірність того, що ця точка розташована лівіше точки x. Зрозуміло, що для функції Pex(x) згідно з (2.6)-(2.7) справедливим є обернене твердження, тобто значення Pex(x) позначає ймовірність розташування певного значення X(ω) правіше точки x.

Щойно зазначена геометрична інтерпретація робить очевидними такі властивості функцій розподілу F(x) і Pex(x).

Інтегральний закон розподілу довільної випадкової величини у вигляді функції її розподілу F(x) характерний тим, що:

  • F(x) є неспадною функцією свого аргументу, тобто при {x2 > x1} маємо {F(x2) F(x1)};

  • F(–) = 0 як ймовірність неможливої події;

  • F(+) = 1 як ймовірність достовірної події.

Інтегральному закону розподілу випадкової величини у вигляді функції її розподілу Pex(x) властиве те, що:

  • Pex(x) є незростаючою функцією свого аргументу, тобто при {x2 > x1} маємо {Pex(x2) Pex(x1)};

  • Pex(–) = 1 як ймовірність достовірної події;

  • Pex(+) = 0 як ймовірність неможливої події.

Примітка. Зрозуміло, що подані вище властивості функцій розподілу F(x) і Pex(x) стосуються загального діапазону значень довільної випадкової величини X(ω) (–∞ , ∞) або певних інтервалів такого діапазону. Він обраний і для всіх загальних залежностей і міркувань цього розділу, якщо інше спеціально не обумовлено. А проте, якщо замість зазначеного взяти діапазон [0, ∞), як найбільш доцільний для інтерпретації географічних даних (див. втуп) і який дотриманий на рисунках розділу, то очевидно, що вже тоді F(0) = 0 як ймовірність неможливої події {X(ω) < 0} і, відповідно, Pex(0) = 1 як ймовірність достовірної події {X(ω) > 0}. При цьому адекватно змінюються і всі розрахункові інтервали, що розглядаються у розділі, шляхом заміни (–∞) на (0).

З метою більш глибокого розуміння вихідних понять про інтегральний закон розподілу розглянемо ці поняття більш детальніше стосовно функцій розподілу F(x) {і, стисло, щодо споріднених їм Pex(x)} дискретної та неперервної випадкових величин.

Для дискретної випадкової величини X(ω)д значення функції розподілу F(x) є сумою ймовірностей pi усіх можливих значень xi, менших ніж х, тобто функція розподілу має вигляд

F(x) = P {X(ω)д = xi} = pi . (2.9)

xi < x xi < x

За змістом формули (2.9) можна зробити висновок, що графіком функції розподілу F(x) дискретної випадкової величини X(ω)д є "східчаста" лінія, що має розриви у точках xi, причім величина "стрибка" функції у цих точках дорівнює pi = P {X(ω)д = xi}. Пояснимо це на конкретному прикладі (рис.2.2), знову-таки для спрощення вважаючи, що F(x) адекватна емпіричній функції розподілу, наведеній у цьому прикладі.

На рис.2.2 за вихідними даними рис.2.1 побудований графік функції розподілу F(x) дискретної випадкової величини X(ω)д, яка являє собою кількість діб з заморозками на поверхні ґрунту у обраному місяці у багаторічному розрізі. За цим графіком кожному з можливих за період спостережень значень х {1, 2 … 6 діб} відповідає як власне значення ймовірності неперевищення за віссю F(x) {0,05; 0,15 … 1,00}, так і своя ймовірність pi {"стрибок" функції F(x)}, що тотожна набору ймовірностей, надписаних над вершинами полігона розподілу рис.2.1, тобто {pi} = {0,05; 0,10; 0,20; 0,30; 0,25; 0,10}.

Властивості спорідненої до F(x) функції розподілу Pex(x) випадкової дискретної величини очевидні, якщо у (2.9) у нижньому рядку змінити знак "<" на ">", і тому тут окремо не розглядаються. Особливості ж графічної побудови функції розподілу Pex(x) випадкової дискретної величини, у т.ч. у співвідношенні з функцією розподілу F(x), детально розглядаються у р.4 на прикладі їхніх емпіричних аналогів.

Графіком функції розподілу F(x) неперервної випадкової величини X(ω), значення якої цілковито заповнюють певний проміжок числової множини Е на числовій осі, зазвичай є неперервна лінія розподілу, що зростає від 0 до 1 {для функції розподілу Pex(x), відповідно, та, що спадає від 1 до 0}.

Приклад графіка функції розподілу F(x) наведений за вихідними даними р.1 на рис.2.3, знову-таки задаючись для спрощення адекватністю теоретичного та емпіричного розподілів. На наступному рис.2.4 лінія розподілу F(x) рис.2.3 зіставлена з графіком функції розподілу Pex(x), що є наочною ілюстрацією їхніх властивостей і співвідношення за формулами (2.5)-(2.8).

Рис.2.2 – Графік функції емпіричного дискретного розподілу F(x) кількості діб з заморозками на ґрунті у травні за 20-річний період спостережень на дослідній ділянці (див. р.1, рис.1.13 і рис.2.1)

Рис.2.3 – Графік функції емпіричного неперервного розподілу F(x) рівнів забрудненості ґрунту радіоцезієм (137Cs, у кБк/м2) за профілем досліджуваної басейнової геосистеми (див. р.1, рис.1.14)

Рис.2.4 – Зіставлення графіків функцій емпіричного неперервного розподілу F(x) {формула (2.5)} та Pex(x) {формула (2.6)} рівнів забрудненості ґрунту радіоцезієм (137Cs, у кБк/м2) за профілем досліджуваної басейнової геосистеми {див. формули (2.7)-(2.8) та р.1, рис.1.14}

На рис.2.3-2.4 неперервною випадковою величиною є рівень забрудненості ґрунту радіоцезієм (137Cs, поданий у кБк/м2), а початкові значення цієї величини (у Бк/кг сухої маси) отримано шляхом відбору проб і вимірювання їхньої радіоактивності через певні рівні відстані на обраному 5-кілометровому профілі геосистеми, що досліджувалась (див. детальніше р.1 і пояснення до рис.1.14, способи ж безпосередньої побудови наступних двох рисунків розкрито у р.4).

Зважаючи на приклади, наведені на рис.2.3-2.4, надалі випадковою величиною неперервного типу (або просто неперервною випадковою величиною) більш точно будемо називати таку випадкову величину, функція розподілу якої диференційовна, а отже і неперервна. Справедлива і теза про те, що якщо функція розподілу випадкової величини є неперервною функцією, то ця величина має неперервний розподіл.

Для розуміння подальших міркувань щодо неперервних розподілів попередньо визначимося з одним методично важливим аспектом. Він стосується того, що якщо відома функція розподілу, то можна визначити ймовірність того, що випадкова величина довільного типу набере значення із заданого інтервалу.

Отже, визначимо ймовірність P {a X(ω) < b} того, що довільна випадкова величина X(ω) набере значення, що є більшим чи дорівнює а та меншим за b. Ймовірність P {X(ω) < b}, тобто того, що випадкова величина набере значення, меншого за b, можна подати як суму ймовірностей двох несполучних (взаємовиключних) подій (див. р.1). Для цього розіб'ємо інтервал значень випадкової величини (–∞, b) на два інтервали (–∞, а) та [а, b) і, зважаючи на те, що одночасна належність значень X(ω) кожному інтервалу є неможливою, запишемо

P {–∞ < X(ω) < b} = P {–∞ < X(ω) < а} + P {a X(ω) < b} . (2.10)

Звідси, згадуючи (2.5),

P {a X(ω) < b} = P {–∞ < X(ω) < b} – P {–∞ < X(ω) < а} ≡

F(b) – F(a) . (2.11)

Згідно з останнім записом ймовірність того, що довільна випадкова величина набере значення із заданого інтервалу або, як кажуть, що випадкова величина потрапить у заданий інтервал, дорівнює приросту функції розподілу на цьому інтервалі. Для дискретних розподілів цей приріст – вже розглянуті раніше розірвані "стрибки" F(x) (див. рис.2.2), величина яких і дорівнює ймовірності конкретного значення x.

Для неперервних же розподілів зазначене у попередньому абзаці положення про приріст функції розподілу, як і її аргументу, потребує окремого дослідження.

Візьмемо неперервну випадкову величину X(ω) та будемо нескінченно звужувати інтервал за (2.11), спрямовуючи b до a, тобто зменшуючи приріст (інтервал) xx = b-a} як аргументу F(x). При цьому через неперервність функції розподілу F(x) її значення F(b) буде прямувати до F(а). Таким чином, у граничному випадку ліва частина рівності (2.11) перетвориться на ймовірність того, що випадкова величина X(ω) набере значення а, а права частина обернеться в нуль {як F(а) – F(a) = 0}. Це доводить тезу, висловлену на початку цього розділу, про те, що для неперервної випадкової величини ймовірність набирання нею будь-якого конкретного значення дорівнює нулю.

Розвинемо щойно подані міркування (як і відповідні положення р.1) і знайдемо ймовірність потрапляння неперервної випадкової величини у нескінченно малий інтервал (приріст) значень xx), позначивши його dx, тобто у інтервал {x X(ω) < x + dx}. Отже, зважаючи на міркування за (2.10)-(2.11), отримаємо

P {x X(ω) < x + dx} = P {–∞ < X(ω) < x + dx} – P {–∞ < X(ω) < x} ≡

F(x + dx) – F(x)dF(x) . (2.12)

У останній тотожності формули (2.12) використано визначення нескінченно малої зміни (приросту) вже функції розподілу F(x), тобто поняття диференціала цієї функції dF(x). З отриманого співвідношення (2.12) видно, що ймовірність потрапляння неперервної випадкової величини у нескінченно малий інтервал {x X(ω) < x + dx} є нескінченно малою та пропорційною величині цього інтервалу dx. Відношення цієї нескінченно малої ймовірності до нескінченно малої величини інтервалу {яке є похідною функції F(x)} набирає скінченних значень, характеризуючи щільність розподілу ймовірностей у певній точці x. Таке відношення у вигляді функції від усіх х використовується як ще одна універсальна характеристика (закон) розподілу ймовірностей значень випадкової величини. Отже, для випадкової величини неперервного типу, функція розподілу F(x) якої диференційовна, як ще одну форму закону розподілу використовують похідну від функції розподілу – F'(x), позначаючи її f(x), тобто

f(x) = F'(x) = lim {(F(x + Δx) – F(Δx)) / Δx} =

Δx → 0

= (F(x + dx) – F(dx)) / dxdF(x) / dx . (2.13)

Функцію f(x) за (2.13) називають диференціальним законом розподілу ймовірностей значень неперервної випадкової величини або просто диференціальним законом розподілу чи одновимірною щільністю розподілу випадкової величини X(ω) (приклад за даними рис.2.3 наведений на рис.2.5, принципи побудови якого – у р.4). Зрозуміло, що для дискретних розподілів поняття щільності розподілу, адекватне (2.13), відсутнє через те, що є можливість оперувати власне з розподілом (ймовірностей) дискретної величини за формулою (2.3), враховуючи (2.1)-(2.2) та всі викладені супутні міркування, а також через переривчастість графіка інтегрального закону дискретного розподілу {формула (2.9) і рис.2.2}. Крім того (див. р.1), для певного значення неперервної випадкової величини X(ω) можливим є застосування скороченого терміна "щільність ймовірності" такого значення.

Рис.2.5 – Графік щільності розподілу випадкової величини, функція розподілу якої наведена на рис.2.3

Щільність розподілу, як похідна неспадної функції розподілу F(x), є невід'ємною функцією, тобто {f(x) ≥ 0} при всіх {x}.

Функцію розподілу F(x) можна подати через щільність розподілу f(x) шляхом інтегрування (2.13) за межами (–∞, x), а отже

x

ƒ(x) dx = F(x) – F(–) . (2.14)

-∞

Позаяк F(–) = 0, то

x

F(x) = ƒ(x) dx . (2.15)

-∞

Аналогічно можна знайти співвідношення між спорідненим до функції F(x) інтегральним законом ймовірності але вже перевищення значень випадкової величини Pex(x) {формула (2.6)} та щільністю розподілу, змінивши межі інтегрування у (2.14) на (x, ∞) і отримавши таким чином, зважаючи на (2.7) і на те, що F(+) = 1, залежність

ƒ(x) dx = F() – F(x) = 1 – F(x) = Pex(x) . (2.16)

x

Згідно з формулами (2.13), (2.15), (2.16) зрозуміло, що функції розподілу F(x) або Pex(x) і щільність розподілу f(x) передаються одна через одну і тому для неперервної випадкової величини кожна з них є вичерпною характеристикою. До речі, якщо існує така функція f(x), що виконується співвідношення (2.15), то кажуть, що випадкова величина X(ω) має абсолютно неперервний розподіл.

Слід також коректно визначитись і з такими поняттями. У [5, 7] та й інших джерелах графік щільності розподілу f(x) досить часто називають також кривою розподілу або кривою розподілу ймовірностей. На наш погляд це не зовсім вірно. По-перше, зазначений графік стосується лише неперервних розподілів і тому спрощені неконкретні його назви створюють передумови до застосування згаданих термінів тими, що вивчають імовірнісні методи, інколи не за призначенням, у т.ч. стосовно дискретних розподілів. По-друге, ще більш важливим є те, що для деяких теоретичних розподілів (наприклад, для т.зв. рівномірного) графік і щільності, і функції розподілу – пряма. Тому у всіх випадках графічної інтерпретації різноманітно заданих і отриманих розподілів випадкової величини (у вигляді лінії, діаграми, точок тощо) доцільним є застосування терміна "графік", а саме:

  • графік інтегрального закону розподілу ймовірностей неперевищення або перевищення значень випадкової величини (або, скорочено, графік функції розподілу F(x) або Pex(x) з вказівкою, за необхідності, на дискретність чи неперервність випадкової величини та на те, яким є розподіл – теоретичним чи емпіричним) (див. рис.2.2-2.4);

  • графік диференціального закону розподілу ймовірностей значень випадкової величини (або, скорочено, графік щільності розподілу f(x) з вказівкою, за необхідності, на те, яким є розподіл – теоретичним чи емпіричним – і без обов'язкової вказівки на неперервність розподілу, оскільки графік щільності розподілу стосується лише неперервних величин) (див. рис.2.5);

  • графіки емпіричного чи теоретичного розподілу ймовірностей значень дискретної величини {або, скорочено, графіки розподілу (ймовірностей) дискретної випадкової величини чи семантичної назви цієї величини, що в принципі стосується будь-яких графіків}. Певні види таких графіків, по-перше, мають свої назви (наприклад, "полігон розподілу" рис.2.1), які ми детальніше розглянемо у р.4. Там же будуть показані способи застосування щойно згаданих у цьому абзаці видів графіків і при узагальненні та інтерпретації вибіркових (емпіричних) значень не тільки дискретних, а й неперервних випадкових величин.

А проте, наведені вище міркування не виключають можливості паралельного застосування і терміна "крива", але, по-перше, коли графік є дійсно кривою, а, по-друге, з обов'язковим змістовними доповненнями за сутністю графічних побудов: крива функції розподілу, крива щільності розподілу тощо та інші необхідні при цьому атрибути. Крім того (див. р.1 і попередній текст), інколи скорочено для визначеної точки графіка щільності розподілу ми застосовуємо термін "щільність ймовірності" цієї точки, тобто певного значення неперервної випадкової величини.

Перейдемо до підсумкового розгляду загальних закономірностей і особливостей розподілу неперервної випадкової величини, оскільки вже розглянуті розподіл дискретної величини та його функція є більш простими та зрозумілими за їхнім змістом.

Базуючись на (2.4) і наступних міркуваннях, загальний запис розподілу неперервної випадкової величини виглядає як

P (E) = P {ω : X(ω) E} = ƒ(x) dx , (2.17)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]