5.2. Спектральні оцінки часового ряду. Періодограма
Нехай спостерігається - дійсний гільбертів слабо стаціонарний процес із заданим кінцевим математичним сподіванням . Передбачається, що для даного процесу існує невідома спектральна щільність потужності і виконується ергодична теорема відносно математичного сподівання і кореляційної функції (умова сильного перемішування).
Як і у попередньому випадку оцінювання кореляційної функції, тут також спостерігається послідовність – реалізація вихідного процесу . В якості оцінки можна взяти
, (5.12)
де .
Вираз (5.12) можна записати у вигляді
.
Якщо відліки взяти не через одиницю часу, а з довільним постійним кроком , то останній вираз можна записати так
.
Частота - найвища частота, яку можна виявити за даними відліку через секунд – частота Найквіста – Котельнікова.
Приведений вище вигляд оцінки спектральної щільності можна пояснити таким чином. Якщо вважати значення коефіцієнтами відрізку ряду Фур'є, то є періодичною функцією від , задану на періоді , яка в цей ряд розкладена. А оскільки – оцінка спектральної щільності потужності, то наведена вище сума в оцінці (5.12) береться в квадраті умножається на .
Функцію в статистичній теорії спектральних функцій називають періодограмою. Її вперше ввів і досліджував в своїх роботах Шастер в 1898 р. і 1906 р. Якщо вихідний процес – гаусів, то періодограма , і , розподілена, як – хі - квадрат з двома ступінями свободи.
Приведемо без доказу математичне сподівання оцінки (5.12) при , що прямує до нескінченності
Останнє співвідношення показує, що при оцінка є асимптотично незміщеною для
.
Обчислення дисперсії в загальному випадку зв'язане із складними викладеннями, які спрощуються в разі аналізу гаусових процесів . Приведемо без доказу асимптотичне значення дисперсії у гаусовому випадку
5.3. Визначення законів розподілів часових рядів по даних спостережень
Варіаційний ряд. В результаті проведення спостережень над деякою випадковою величиною або часовим ергодичним рядом отримуємо ряд чисел
,
який називається вибіркою. Число називається обсягом вибірки.
Водночас зауважимо, що часовий ряд являє собою стаціонарний процес з дискретним часом. Він є ергодичним відносно одновимірної функції розподілу , тому що
,
тоді і тільки тоді, якщо
.
Стаціонарний ряд з незалежними значеннями - ергодичний відразу, тобто
.
Якщо всі елементи вибірки розташувати в порядку збільшення їх значень, тобто , то отримаємо варіаційний ряд .
Кожний елемент варіаційного ряду називається порядковою статистикою. Величина - різниця найбільшого та найменшого значень, називається розмахом варіювання. Деякі порядкові статистики можуть служити статистичними оцінками параметрів, що характеризують випадкову величину . Наприклад, якщо , то і - називаються вибірковими секстилями і за оцінку средньоквадратичного відхилення випадкової величини можна взяти вираз
.
За оцінку її математичного сподівання (при непарному ) беруть .
Частотою деякої події називається відношення кількості наслідків , що сприяють цій події, до загального числа наслідків . Позначимо її через .
Вибіркова функція розподілу. В попередньому підрозділі були наведені вирази для обчислення вибіркових моментів. Вони будуть істотно використані далі.
ОЗНАЧЕННЯ 5.4. Вибірковою функцією розподілу для вибірки обсягом називається функція
,
де - кількість тих порядкових статистик, значення яких менші .
На рис. 5.4 наведено типовий графік вибіркової (емпіричної) функції розподілу.
Рис. 5.4
Побудова оцінки щільності розподілу. Спостерігаються значення випадкової величини , неперервна щільність розподілу якої невідома і її потрібно оцінити по вибірці з незалежних спостережень .
Розмах варіювання розіб'ємо на інтервалів довжиною . Емпірична щільність розподілу або “гістограма” вибірки визначається на кожному інтервалі довжиною рівністю
,
де - кількість спостережень, що належать до інтервалу . Очевидно, що частота - відображає площу прямокутника, побудованого на , як на основі з висотою, що дорівнює ординаті гістограми .
Таким чином, при великому площа прямокутника за теоремою Бернуллі буде наближатися до - ймовірності потрапити значенню випадкової величини до інтервалу :
.
Тому
,
де - деяка точка на інтервалі .
Дисперсія
D D ,
тобто при та гістограма буде незсуненою і слушною оцінкою для щільності розподілу. Крім того, із ймовірністю, близькою до 1, при великому гарантується рівномірне наближення до .
Гістограма. Якщо спостережень дуже багато, - велике, то незручно будувати графік вибіркової функції розподілу . В цьому випадку користуються групуванням результатів спостережень. А саме, весь інтервал спостережень ділять на підінтервалів і будують таблицю
Інтервали |
|
|
... |
|
Частоти |
|
|
... |
|
де - границі інтервалів, - частота, що відповідає - му інтервалу, , тобто кількість значень , що потрапили в - тий інтервал, віднесене до . Переважно . Довжини інтервалів не обов'язково однакові.
Наведена вище таблиця, оформлена у вигляді графіка називається гістограмою. Інакше кажучи, гістограма - це вибіркова щільність розподілу. Будується вона так. По осі абсцис відкладаються інтервали і на кожному з них, як на основі, будується прямокутник, площа якого дорівнює частоті цього інтервалу. Приклад гістограми наведений на рис. 5.5.
Рис. 5.5
Згладжування гістограм. Задача згладжування гістограм не має однозначного розв'язку, а тому результати її рішення істотно залежать як від використовуваної методики, так і від додаткових вимог, що використовуються в ході її рішення.
Класичним прикладом розв’язування задачі згладжування є згладжування по кривих К.Пірсона. При цьому використовується метод моментів, згідно якого спочатку обчислюються величини
.
Потім в залежності від значення параметра (“капа Пірсона”) вибирається тип основної згладжуючої кривої, а саме:
1-й тип при 4-й тип при 6-й тип при
Значення інших параметрів дають можливість вибирати проміжний тип кривої - згладжуючої гістограму згідно методики К.Пірсона [2,…,4]. Якість згладжування можна оцінити з допомогою статистичних критеріїв. Найбільш вживаний в цьому випадку - критерій, запропонований К.Пірсоном.