- •Реферат
- •Содержание
- •1 Введение
- •1. Характеристики случайных величин и статистические методы прогнозирования
- •1.1. Характеристики случайных величин
- •1.2 Статистические методы прогнозирования
- •2 Постановка задачи статистического моделирования работы нефтедобывающей скважины
- •3 Статистический анализ показателей работы нефтедобывающей скважины
- •3.1 Предварительный анализ статистических данных
- •3.2. Статистическое исследование пиковых нагрузок
- •3.2.1 Статистический анализ пиковых нагрузок на безаварийной скважине
- •3.2.1.1 Тестирование на случайность
- •3.2.1.2 Исследование моделей авторегрессии пиковой нагрузки
- •3.2.1.3. Толерантные пределы
- •3.2.2 Статистический анализ данных аварийной скважины.
- •3.3 Выводы и рекомендации по результатам статистического анализа
- •4 Разработка экспертной системы
- •4.1 Общие принципы построения экспертной системы
- •4.2 Описание пилотного экспертной системы
- •4.2 Программная реализация экспертной системы
- •4.2.1 Листинг серверной части обмена сокетами
- •4.2.2 Листинг клиентской части
- •5 Выводы
- •Корреляционная матрица параметров нефтедобычи по скв-13488(49600)
3.2.1.1 Тестирование на случайность
С целью выявления марковости случайной последовательности, траектории процесса сопоставляется бинарная последовательность
|
(2.1) |
Если исходный процесс является последовательностью независимых одинаково распределенных случайных величин, то {Zt} представляет наблюдения в схеме Бернулли с вероятностью 0,5 появления 0 или 1. где функция Если исходный процесс является последовательностью независимых одинаково распределенных случайных величин, то {Zt} представляет наблюдения в схеме Бернулли с вероятностью 0,5 появления 0 или 1.
|
Рисунок 3.6 – Временная траектория пиковой нагрузки на скважине 13499 за период с 1.06.2011 по 30.06.2011. Область I - предполагаемый участок стационарности процесса, область II – область разладки.
|
Последующее тестирование случайности осуществляется проверкой с помощью критерия хи-квадрат наборов из компонент процесса {Zt}. Анализируются частоты появления в последовательности 0 и 1, их пар и троек. Если процесс случайный, то частоты должны быть близки к теоретическим вероятностям:
0 1 – количество исходов r=2, вероятность появления каждой пары при справедливости гипотезы случайности равна 0,5.
00 01 10 11 – количество исходов r=4, вероятность появления каждой пары равна 0,25;
000 001 010 011 100 101 110 111 – количество исходов r=8, вероятность появления каждой тройки - 0.125.
Для каждого набора с r=2, 4 и 8 исходами, вычисляется статистика хи-квадрат
|
(3.1) |
где i, i=1,..,2k – частота появления соответствующей комбинации набора, n – объем выборки, k –количество разрядов в тестируемой конфигурации единиц и нулей.
Нулевая гипотеза состоит в том, что рассматриваемая последовательность 0 и 1 является случайной. Если эта гипотеза справедлива, то статистика результата наблюдения х2 имеет хи-квадрат распределение с степенями свободы. Нулевая гипотеза случайности отвергается , если для результата х2 наблюдения X2 критический уровень значимости (так называемое p - значение)
|
(3.2) |
Представим результаты проверки случайности для пиковой и минимальной нагрузок только за первый месяц, из которых будет видно, что эти и последующие данные не представляют случайную выборку.
Расчеты показали, что относительная частота нулей равнялась 0.491, а частота единиц 0.509. Согласно критерию хи-квадрат критический уровень значимости p=0.058. Так как неравенство (2.2) не выполняется, то гипотеза равновероятности подъемов и спусков значений пиковой нагрузки подтверждается.
Частота появления пар из 0 и 1 в бинарной последовательности, вычисленной для значений пиковой нагрузки представлена в табл. 3.3. Значение критерия χ2(2)=119.0. Критический уровень значимости р<10-3, следовательно гипотеза равновероятности появления каждой пары в бинарной последовательности отвергается.
Таблица 3.3
Частоты появления пар 0 и 1 в бинарной последовательности для пиковой нагрузки
Пара |
00 |
01 |
10 |
11 |
Частота |
0.175 |
0.316 |
0.316 |
0.192 |
Таким образом для показателя пиковой нагрузки наиболее вероятна смена «знака»: за каждым подъемом вероятнее всего следует падение нагрузки, и наоборот.
В табл. 3.4. представлены частоты появления троек из 0 и 1 в бинарной последовательности, вычисленной для значений пиковой нагрузки. Значение критерия χ2(3)=191.0. Критический уровень значимости р<10-3, следовательно гипотеза равновероятности появления каждой тройки в бинарной последовательности также отвергается.
Таблица 3.4
Частоты появления сочетаний троек в бинарной последовательности для пиковой нагрузки
Тройка |
000 |
001 |
010 |
011 |
100 |
101 |
110 |
111 |
Частота |
0.0574 |
0.117 |
0.194 |
0.122 |
0.117 |
0.199 |
0.122 |
0.0702 |
Таким образом, в рамках вариационной статистики стандартный статистический анализ невозможен, то есть анализ следует используя понятия и методы случайных процессов.