Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

01_розділ

.doc
Скачиваний:
11
Добавлен:
19.03.2015
Размер:
819.2 Кб
Скачать

Частина 1 Статистичні математичні методи:

теорія ймовірностей і математична статистика – випадкові величини

1 Імовірнісний простір і випадкова величина

зробити, де треба, подвійні підрядкові та надрядкові символи – показано червоним

У вступі до дисципліни ми розглянули основні причини застосування імовірнісних методів математичного аналізу в географії, пов'язані із імовірнісним характером фактографічної географічної інформації, який об'єктивно зумовлено передусім:

  • багатофакторністю та суперпозиційністю просторово-часової динаміки геопараметрів і множинністю, складністю та "нежорсткістю" внутрішніх і зовнішніх взаємозв'язків у геосистемі;

  • неможливістю виявлення при матаналізі всіх зазначених факторів і зв'язків у геосистемі, які до того ж мають випадкову природу;

  • обмеженістю наявних географічних даних у часі та просторі і способами їхнього вимірювання, що разом спричинює наявність істотних випадкових помилок визначення фактичних значень геопараметрів (у широкому розумінні, тобто як параметрів стану геосистеми, так і параметрів факторів цього стану).

Попередньо у вступі ми вже також визначились і з поняттям "випадкова величина", розуміючи під нею величину, значення якої при проведенні імовірнісного досліду або його серій в однакових умовах змінюються випадковим чином. А проте, це поняття, як і супутні йому поняття та твердження передусім стосовно т.зв. імовірнісного простору тощо, у аксіоматиці теорії ймовірностей і теорії множин ([4-7]) мають точне визначення. Основний зміст таких понять і тверджень у дещо спрощеному викладі ми і розглянемо у цьому розділі. При цьому слід одразу усвідомити, що всі наведені далі види просторів і множин, як і їхня інтерпретація (здійснена за вихідними принципами побудови т.зв. діаграм Венна [6]), є абстрактними поняттями математичного апарату і їх не слід плутати з географічним простором тощо.

Для загального визначення змісту терміну "імовірнісний простір" послідовно розглянемо три його основні складники стосовно, зрозуміло, результатів випадкових експериментів (див. вступ), а саме:

  • початковий простір (множина) елементарних подій;

  • клас підмножин простору елементарних подій – систему підмножин випадкових подій. Ця система (клас) з певними визначеними її властивостями ще зветься "σ-алгеброю" подій ("сигма" мала);

  • імовірнісну міру елементарних і випадкових подій.

У цілому згідно з аксіоматикою теорії ймовірностей, і що вже зазначалось у вступі, як елементарні події ω ("омега" мала) розглядаються такі можливі наслідки певного імовірнісного експерименту, хоча б один з яких відбудеться обов'язково і які є попарно несполучними у їхній послідовності в досліді. Отже надалі змінну ω будемо називати сукупністю (множиною) елементарних подій або елементарних наслідків (імовірнісного експерименту).

Наприклад, загальну сукупність результатів уявних оцінювань стану якихось 100 довільних ділянок, на які розподілена гіпотетична геосистема, за геопараметром "радіоактивна забрудненість ґрунту" та за принципом "забруднена – незабруднена", враховуючи і забруднені, і незабруднені ділянки, можна вважати загальною сукупністю (множиною) елементарних наслідків ω такого уявного імовірнісного експерименту (див. наступні приклади).

У працях В.М.Самойленка [1-3, 10] і у цьому підручнику, найчастіше у його другій частині, змінна ω також називається сукупністю елементарних результатів досліду, щоб підкреслити її фактичний зміст вже при моніторингу довкілля, за потреби безпосередньо враховуючи число (кількість) цих результатів досліду.

Множина всіх елементарних подій ω і утворює початковий простір елементарних подій Ω ("омега" велика), тобто (зі скінченним чи нескінченним n, див. далі)

{ω1, ω2, ω3, ω4 … ωn} Ω . (1.1)

Математичний оператор "" у (1.1), який буде досить часто використовуватися у цьому підручнику, означає "належить (до)", "є елементом", а інколи – "містить".

Загалом елементарною подією (наслідком) ωi з її множини за формулою (1.1) зветься та, що для всілякої випадкової події А у імовірнісному експерименті спричинює або А, або не А. Одразу зазначимо, що останнє визначення елементарної події зроблене у цілому для початкового його розуміння та варіанта, коли у імовірнісному експерименті тестується лише одна подія А. У інших різних експериментах, як буде показано далі, термін "не А" може стосуватися як події, "буквально" протилежної А, так і іншої події, наприклад, В, або для сукупності подій – "А2" як "не А1" і т.ін.

Імовірнісний експеримент зветься остаточним, якщо мається повна група усіх елементарних подій (що спричинюють або А, або не А і т.ін., див. більш точне пояснення далі). До того ж у теорії ймовірностей розглядають лише такий експеримент, у якому кожна випадкова подія є сумою усіх (і лише тих) його елементарних наслідків, що спричинюють таку подію. Саме такий експеримент і описується насамперед як множиною елементарних подій на просторі Ω за формулою (1.1), так і класом підмножин такого простору – випадковими подіями, що можуть відбутися в експерименті.

Отже, згідно з міркуваннями попереднього абзацу, кожну випадкову подію А можна розглядати як сукупність (суму або об'єднання) тих елементарних наслідків ω, що спричинюють цю подію А (призводять до її здійснення), тобто як певну підмножину початкового простору Ω (рис.1.1).

Тобто, якщо, наприклад, для 100 усіх ділянок ґрунту гіпотетичної геосистеми апріорно прийняти, що 40 довільних ділянок є радіоактивно забрудненими, то відповідна подія А – "радіоактивне забруднення" – і вирізнена на рис.1.1 штрихуванням на умовному овалі простору Ω як сума 40 із 100 елементарних подій, що спричинили випадкову подію А, вважаючи що 100 елементарних подій "обіймають" весь простір Ω як повна група таких подій (у даному випадку – тих, які характеризують стан довільних ділянок).

Примітка. Одразу зазначимо, що на рис.1.1, як і на наступних рисунках цього розділу, площі множин чи підмножин, що вирізняються, пропорційні відносній частоті (ймовірності) відповідних ситуацій з елементами Ω, які розглядаються. Такі аспекти детально будуть пояснені трохи далі за текстом при вивчанні імовірнісної міри.

Рис.1.1 – Простір елементарних подій з вирізненою на ньому випадкової подією А всі рис. цього розділу у більш зручному варіанті в окремому файлі Рис_розд_1,doc

Подія, яка розглядається як весь простір Ω, є достовірною, позаяк до її здійснення призводять усі елементарні наслідки експерименту, один з яких, за зазначеною вище умовою, відбудеться обов'язково. Іншими словами, Ω у цілому є достовірною подією, вона відбувається, яка б елементарна подія не відбулася (рис.1.2, оператор "≡" означає "тотожно дорівнює"), що частково нагадує результати детермінованого експерименту, отримані, правда, за дещо інших умов (див. вступ).

Зокрема, відповідно до умов рис.1.2 достовірною подією могла бути ситуація, коли всі 100 ділянок ґрунту геосистеми вважалися б радіоактивно забрудненими.

Рис.1.2 – Достовірна подія

Іншою спеціальною випадковою подією є неможлива подія, тобто та, що не може відбутися за жодної реалізації випадкового досліду. З випадковими подіями у цілому пов'язана можливість проведення ще декількох операцій, які мають методичне значення для розуміння положень цього розділу. При розгляді таких операцій не слід забувати, по-перше, що елементами Ω є вже як елементарні (ω), так і певні випадкові події як сукупності цих ω. По-друге, слід зважати на те, що зазначені операції можуть включати як утворення нових, відмінних від вихідних, подій за комбінаціями вихідних, так і розклад випадкових подій на їхні складники тощо.

Так з кожною випадковою подією А можна пов'язати протилежну подію Ā, яка полягає в тім, що А не відбулася. За змістом рис.1.1-1.2 подію Ā розглядають ще як доповнення підмножини А до множини Ω, тобто як сукупність всіх елементів множини Ω, що не є елементами підмножини А, отже (рис.1.3)

Ā = Ω – А . (1.2)

Ситуацію рис.1.3 можна інтерпретувати, взявши за основу приклад для рис.1.1, як ту, що відображає наявність не тільки 40 довільних забруднених ділянок ґрунту (подія А) із 100 у цілому, а й 60 інших довільних ділянок, що мають бути незабрудненими, а отже "формують" протилежну подію Ā.

Рис.1.3 – Подія Ā, протилежна випадковій події А

У абстрактному вираженні, доповненням множини (простору) Ω у цілому є так звана порожня підмножина Ø, що не містить жодного елемента ω і загалом інтерпретується як неможлива подія.

Подія, яка полягає у тому, що з двох подій А і В відбувається хоча б одна, зветься сумою (або об'єднанням) подій А і В та позначається як А + В, чи, через оператор об'єднання – т.зв. диз'юнкції ("" – "або"), як А В. У графічній інтерпретації зазначена сума є підмножиною всіх елементів, що належать хоча б одній з підмножин А і В (рис.1.4).

Рис.1.4 – Несполучні випадкові події А і В та їхня сума А В як подія

Інтерпретація рис.1.4 за обраними нами підходами може бути здійснена таким чином. Уявимо, що при оцінюванні радіоактивного забруднення 100 ділянок ґрунту гіпотетичної геосистеми ми апріорно задалися тим, що 40 довільних ділянок забруднено тільки радіоцезієм (подія А), 30 – тільки трансурановими елементами (подія В), а решта, відповідно 30 довільних ділянок, мають бути незабрудненими (доповнення подій А і В до загальної множини елементарних подій Ω). Тоді сумою подій А і В, підмножини яких, як видно з рис.1.4, неперетнуті, є подія "радіоактивне забруднення будь-яким з двох забрудників" (або радіоцезієм, або трансурановими елементами), яка полягає у тому, що для довільних 70 із 100 усіх ділянок ґрунту обов'язково буде зафіксована хоч одна з двох подій: або "забруднення радіоцезієм", або "забруднення трансурановими елементами".

Подія, яка полягає у тому, що відбуваються одночасно події А і В, зветься добутком (або перетином) подій А і В та позначається як А В, або, вже через оператор перетину – т.зв. кон'юнкції ("" – "і"), як А В. Отже добутком підмножин у графічній інтерпретації (рис.1.5) є підмножина всіх елементів, що належить одразу обом підмножинам А і В, які є вже сполучними подіями, на відміну від попередніх рисунків (рис.1.3-1.4), де були зображені співвідношення несполучних подій.

Рис.1.5 – Сполучні випадкові події А і В і подія їхнього добутку А В

Інформація рис.1.5 показує, що приклад, наведений до рис.1.4, має дещо змінитися за змістом. Тепер гіпотетично ми повинні уявити таку ситуацію. Із 100 ділянок 40 довільних ділянок забруднено радіоцезієм (подія А), 30 – трансурановими елементами (подія В), причім із щойно вирізнених 70 ділянок – 10 довільних забруднено обома забрудниками, і 30 ділянок є незабрудненими. Добутком двох подій А і В, які вже є сполучними, буде подія перетнутого сегмента АВ, яка і полягає у тому, що для 10 будь-яких ділянок з довільних 70 (40 з подією А плюс 30 з подією В) спостерігається одночасна реалізація обох подій А і В. Тобто ми будемо мати справу з подією добутку А і В, яка звучить як "радіоактивне забруднення і радіоцезієм, і трансурановими елементами".

Дамо більш точні визначення останнім термінам. Отже, дві події А і В є несполучними, якщо АВ є неможливою подією, тобто порожньою підмножиною. Звідси несполучними подіями можна також назвати ті події, підмножини простору Ω яких є неперетнутими. Зрозуміло, що сполучними подіями є події А і В, для яких можлива подія АВ, а отже події, підмножини Ω яких є перетнутими.

Для несполучних подій можливою є лише операція з утворення події, що є їхньою сумою (об'єднанням). Для сполучних подій можливими є операції з утворення таких нових подій, як сума (об'єднання), добуток і різниця вихідних сполучних подій. Так на рис.1.5 крім події добутку можна визначити і подію суми двох сполучних подій А і В з певними відмінностями від рис.1.4, де інтерпретувалась сума несполучних подій. Ці відмінності полягають у тому, що, за визначенням, сумою двох подій є подія, яка полягає у тому, що відбувається або подія А, або подія B. Тому для перетнутих підмножин А і В суму А + В можна подати у двох рівнозначних варіантах (див. рис.1.5): А  {В – (АВ)}, чи B  {A – (АВ)}, зважаючи на необхідність неповторення двічі підмножини АВ.

Інтерпретація останньої тези для гіпотетичної ситуації із 100 ділянками ґрунту, яку ми використовуємо для прикладу, може бути такою, базуючись на вихідних принципах пояснень події добутку на рис.1.5 (див. відповідний попередній текст до цього рисунка). Отже, подія суми А і В у випадку перетнутих їхніх підмножин, звучить так само, як і для рис.1.4, – "забруднення будь-яким з означених двох забрудників". Але позаяк 10 будь-яких ділянок з довільних 70 будуть одночасного забрудненими і радіоцезієм, і трансурановими елементами, то подія "забруднення або радіоцезієм, або трансурановими елементами" відбудеться вже лише для 60 довільних ділянок із 100, а не для 70, як це було у випадку з рис.1.4.

Як було зазначено, для сполучних подій можна також запровадити, зважаючи на вже розглянутий зміст операції "доповнення" {див. (1.2)}, і поняття різниці подій А і В. Цю різницю позначають як подію А – В, розглядаючи як доповнення підмножини В до підмножини А (рис.1.6). За змістом цього рисунка така різниця інтерпретується як A – (АВ) і її підмножину вирізнено на рисунку крапками.

За умовами попереднього прикладу подію різниці можна умовно уявити як "розширення" події АВ – одночасного забруднення ділянок обома забрудниками – на несполучний сегмент підмножини А, в результаті чого одночасне забруднення стане можливим ще для будь-яких 30 ділянок.

Рис.1.6 – Сполучні випадкові події А і В і подія їхньої різниці АВ

З'ясувавши точний зміст операцій у теорії множин, можна і більш точно математично інтерпретувати сутність наведених раніше вихідних понять про елементарні та випадкові події. Отже, по-перше, можна розглядати послідовність елементарних подій. При цьому вважається, що послідовність подій ω1, ω2, ω3, …, ωn, …, утворює повну групу елементарних подій, якщо вони попарно несполучні (тобто мають попарно неперетнуті їхні підмножини простору Ω, а інакше, неможливими одночасно є події "і ω1, і ω2", "і ω2, і ω3" тощо) та

ω1 ω2 ω3 ωn = ωi = Ω , (1.3)

i

тобто з цих подій відбувається хоча б одна. Важливим далі розглянутим наслідком запису (1.3) є те, що сума ймовірностей повної групи елементарних (як, до речі, і випадкових) подій дорівнює одиниці.

По-друге, тезу про те, що певна випадкова подія А є сумою тих елементарних наслідків ω, що спричинюють цю подію (або, як інколи кажуть, "елементарних подій з А" чи просто "подій з А"), можна символьно інтерпретувати за допомогою вже розглянутого оператора об'єднання (диз'юнкції зі змістом "або") у вигляді запису

А = ∑ ωi,А = ωi,А = ω1,А + ω2,А + ω3,А … + ωn,А =

i,A i,A

= ω1,А ω2 ω3,А ωn,А , (1.4)

де ωi,А означає всі елементарні події, що спричинюють випадкову подію А, тобто подія А настає завжди, коли настає хоч одна з подій ωi,А.

Закінчивши наведений вище розгляд положень стосовно елементарних і, попередньо, стосовно випадкових подій, розглянемо більш точно зміст другого складника імовірнісного простору. Отже, як було зазначено, на просторі елементарних подій Ω вирізняють його клас підмножин, який розглядають як систему підмножин випадкових подій, що можуть відбутися у певному експерименті. Цей клас (система) підмножин позначається як F і зветься "σ-алгеброю" випадкових подій або "σ-алгеброю (подій) F", якщо задовольняються такі умови.

  1. F містить весь простір (множину) елементарних подій Ω як власний елемент, тобто Ω F . При цьому Ω у цілому є достовірною подією.

  2. F містить порожню підмножину Ø, яка інтерпретується як неможлива подія.

  3. Якщо випадкова подія А належить до F (якщо А F), то доповнення цієї події до Ω, тобто Ω – А, або подія, протилежна до А (Ā), теж є елементом F, отже Ā = Ω – А F .

  4. Якщо випадкові події A і B належать до F (якщо А F, B F), то події, що є сумою і добутком A і B, теж є елементами F, отже А + В А В F, А ВА В F .

  5. Разом з кожною будь-якою послідовністю різних випадкових подій А1, А2, А3, … , Аn, … , які належать F, остання містить також і події Ai та Ai .

i i

Умови п.п.1-5 за їхнім змістом одночасно можна розглядати як основні принципи вимірності подій відносно їхньої σ-алгебри F, або, як інколи кажуть, F-вимірності подій.

До цих пір ми знайомилися з "індикаторними" ознаками елементарних і випадкових подій та операціями з ними ("А – не А", "відбудеться – не відбудеться", "ωi спричинює А" і т.ін.). А проте, вельми важливими для географії є імовірнісний експеримент, де чисельно вимірюється якась величина (геопараметр). Отже слід розглянути і "числову" ознаку подій (наслідків) такого експерименту.

Для цього позначимо певну величину, що вимірюється, як Х. При цьому за елементарні події можуть правити події виду {Х х}, де х – певні фіксовані значення величини Х на числовій осі. Тому множину елементарних подій ω природно ототожнити з множиною точок на прямій (осі 0х). Якщо апріорі відомо чи задано, що Х може набирати значень лише з певної числової множини Е, то цю множину, як діапазон всіх значень Х, і будемо розглядати як множину елементарних подій, тобто тотожно перетворену Ω. Отже, за таких умов кожне значення величини Х, тобто кожний х, буде числовим відбитком кожної елементарної події ω, тобто ωх (але у варіанті ωiхj чи ωjхi через "несинхронність" послідовностей ω і х, див. наступний рисунок), Ω ≡ Е, і звідси аналогічно до (1.1) можна записати, знову-таки вважаючи n скінченним чи нескінченним, що

{х1, х2, х3, х4 … хn} Е . (1.5)

У процесі вимірювання певної величини Х очевидною є можливість спостерігати події типу {a X < b}, де а і b – довільні числа. Саме такі події і можуть правити за окремі випадкові події типу А і ін. (див. попередній текст), а отже довільна випадкова подія А може бути тотожно перетворена у величину Х, задану на довільному числовому інтервалі [а, b) з діапазону Е (що може охоплювати хоч би і весь діапазон), тобто у загальному спрощеному вигляді АХ, що призводить до такої інтерпретації міркувань за формулою (1.4).

Величина Х, як числовий відбиток випадкової події А, є сумою (об'єднанням) всіх можливих з інтервалу [а, b) значень цієї величини х, які є числовим аналогом елементарних наслідків, що спричинюють цю подію {ωi,А у (1.4)}, а отже (рис.1.7)

Х = ∑ хi = хi = х1 + х2 + х3 … + хn = х1 х2 х3 хn , (1.6)

xi [а, b) xi [а, b)

тобто величина Х є об'єднанням попарно несполучних її значень х (що означає, що при кожному окремому вимірі ω неможливими одночасно є елементарні події "і х1, і х2", "і х2, і х3" тощо, у т.ч. пари значень х, відповідні послідовності ω, див. рис.1.7) і є заданою, коли задане (виміряне) хоч одне з її значень.

На рис.1.7 для більш повного розуміння змісту та послідовності елементарних наслідків імовірнісного експерименту, кожному з яких відповідає числовий відбиток події, що досліджується, над основною числовою віссю 0х {позначеною за змістом як (ωiхj)} зроблені копії цієї вісі у послідовності елементарних наслідків ω1, ω2, ω3, … ωn. При цьому остання послідовність, для наочності з'єднана умовною ламаною лінією, що разом відтворює "ланцюжок" елементарних наслідків (подій), а перпендикуляри, опущені з кожного такого наслідку експерименту і маркують на осі 0х числові відбитки х1 , х2 , х3, хn у інтервалі [а, b) величини Х. Причім, як видно з рис.1.7, вже зазначена "несинхронність" послідовностей ω і х і призводить до запису тотожності у вигляді ωiхj.

Рис.1.7 – Величина Х як числовий відбиток випадкової події А

Варіант пояснення останнього абзацу і рис.1.7 на нашому прикладі для радіоактивно забруднених ділянок ґрунту гіпотетичної геосистеми можна подати таким чином. Умовимося, що всі ділянки забруднено радіоцезієм (величина Х), питома активність якого вже вимірюється, наприклад, у Бк/кг сухої маси відібраного зразка з кожної ділянки, а числові значення цієї активності (х) належать діапазону від а до b, тобто, наприклад, від 10 до 200 Бк/кг. Послідовні вимірювання питомої радіоактивності ґрунту для усіх ділянок геосистеми і утворюють "ланцюжок" елементарних наслідків експерименту, числове значення яких "фіксують" перпендикуляри до основної осі 0х.

Використовуючи щойно наведені загальні підходи до розуміння "числових" ознак елементарних і випадкових подій, нескладно дати, аналогічно до рис.1.7, відповідне тлумачення і розглянутих раніше операцій з утворення подій суми для несполучних і сполучних випадкових подій та події добутку для сполучних подій, тотожно перетворивши довільні випадкові події А і B у величини X i Y тощо. Принциповим при цьому буде лише усвідомлення відмінності між несполучними та сполучними подіями.

У цьому аспекті, наприклад, для нашого поки постійного випадку з забрудненістю ґрунту геосистеми, зміст несполучності подій буде полягати у тому, що у зразку ґрунту, відібраному з будь-якої дослідної ділянки, в результаті лабораторного вимірювання буде зафіксований або лише радіоцезій, або лише трансуранові елементи. Для сполучних же подій крім останнього варіанта виникає можливість отримання також зразків ґрунту, що містять одночасно обидва забрудники.

Не вважаючи на все те, формула (1.6) та міркування, пов'язані з нею, є спрощеним схематичним поданням числового відбитку випадкової події. Насправді існує певна специфіка такого подання, викликана насамперед "інтервальністю" числового задавання і елементарних, і випадкових подій та видами числових змінних. Ця специфіка детально розглянута в кінці розділу вже безпосередньо при викладі змісту випадкової величини у точному розумінні та її інтерпретації для географічних даних.

Для розуміння сутності третього складника імовірнісного простору – імовірнісної міри елементарних і випадкових подій – слід попередньо визначитись з таким вихідним поняттям, як частота появи подій у імовірнісному експерименті (досліді) та його серіях.

Істотною загальною особливістю імовірнісного експерименту є можливість його багаторазового (в принципі – нескінченного) повторення. Отже, якщо Ω – означена нами множина елементарних подій (наслідків) випадкового досліду, то одноразове здійснення такого досліду є вибором певної точки з множини ω  Ω. Повторення ж цього досліду можна виконати подвійним чином:

  • вибором послідовності таких же за змістом точок ω1, ω2, ω3, ω4 … ωn в просторі Ω при одній серії досліду;

  • повторенням зазначених серій, зберігаючи однакові умови їхнього проведення (див. вступ).

Отже, якщо позначити кількість появи певної випадкової події А {елементарних подій з А або ωi,А за (1.4)} в кожній серії досліду через n(A), то ця величина зветься абсолютною частотою появи події А у серії (рис.1.8). Поділивши n(A) на кількість всіх у серії елементарних наслідків досліду ωn, отримаємо відносну частоту події А у серіїν(А) ("ню" мала).

Віднісши ж загальну кількість n(A) у N серіях (абсолютну частоту появи події А або абсолютну кількість подій з А у всіх серіях) – ns(A) – до загальної кількості наслідків у всіх серіях експерименту – nsотримаємо загальну відносну частоту (появи) події А у N серіях – νs(А) . Отже можна записати, що