Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Управление запасами промысловых рыб и охрана природы сборка.doc
Скачиваний:
857
Добавлен:
15.03.2016
Размер:
8.58 Mб
Скачать

12.3. Характеристика прогнозирования с применением метода группового учета аргументов (мгуа)

12.3.1. Для получения точных и надежных прогнозов при исследовании сложных объектов других областях науки широко применяется теория эвристической самоорганизации и конкретная реализация теории - метод группового учета аргументов (МГУА). Сложный объект исследования в этой теории рассматривают как «черный ящик». Поэтому для получения прогноза строят математическую модель, не изучая механизма причинно-следственных связей в объекте исследований. Для прогнозирования необходим минимум априорной информации об объекте исследования в виде таблицы значений входных и выходных переменных за 10-20 лет, а также внешний критерий (критерий регулярности).

12.3.2. Методы теории эвристической самоорганизации, по А.Г. Ивахненко, представляют собой последовательное чередование математической обработки исходных данных и эвристической оценки. При помощи эвристических критериев оператор постоянно вмешивается в ход решения задачи и направляет его в нужную для себя сторону. По этой причине точность эвристических методов оказывается существенно выше точности самых совершенных и общих математических методов.

12.3.3. Для реализации МГУА необходимо

  • знать прогнозируемый показатель (выходную переменную) и влияющие на него факторы (входные переменные);

  • определить оптимальную длину временного интервала учитываемой предыстории;

  • создать массив исходных данных;

  • разделить среду моделирования на обучающую и проверочную часть, установив для этого оптимальное количество точек в проверочной части;

  • задать число лучших моделей-претендентов, отбираемых для использования на последующих шагах алгоритма;

  • определить порядок величины глубокого минимума критерия регулярности и указать число шагов алгоритма для его достижения;

  • построить прогнозную модель оптимальной сложности.

12.3.4. Работу начинают с образования среды моделирования-таблицы из значений прогнозируемого показателя (выходной переменной) и значений факторов, влияющих на него (входных переменных). Для получения прогноза рыболовства в среду моделирования включают промысловые, биологические, гидрологические и другие показатели. Все значения показателей получают раньше года, на который необходимо составлять прогноз. Первоначально включают возможно большее число переменных, входящих в среду моделирования. В дальнейшем среда моделирования может быть сокращена.

12.3.5. После образования среды моделирования полученную таблицу делят на обучающую и проверочную часть. Обучающую часть таблицы используют для вычисления коэффициентов моделей-претендентов (уравнений регрессии). Проверочная часть таблицы используют для оценки прогнозирующей способности полученных моделей и отбора лучших из них. Таблица служит для дальнейшего использования при построении прогнозной модели оптимальной сложности.

Существует несколько способов деления среды моделирования на обучающую и проверочную части. Соотношения количества точек в этих частях обычно колеблется от 1:1 до 4:1.

12.3.6. После образования среды моделирования и деления ее на обучающую и проверочную части получают множество моделей-претендентов. Они представляют собой уравнения связи выходной переменной с любыми двумя входными переменнымиив среде моделирования. По виду используемых уравнений регрессии выделяют несколько различных алгоритмов МГУА. Для получения прогнозов рыболовства целесообразно использовать полиномиальный алгоритм МГУА, в котором уравнения регрессии имеют вид:

; (12.1)

Коэффициенты уравнений регрессии аiнаходят на обучающей части среды моделирования. Для этого составляются системы нормальных уравнений и решают их методом Гаусса путем последовательного исключения неизвестных.

12.3.7. Чтобы из полученных на данном шаге алгоритма моделей-претендентов выбрать модели с лучшими прогнозирующими способностями, для каждой модели вычисляют значение критерия регулярности. Он служит для выбора модели, наиболее точной на будущих точках, которыми в это время не располагают. Такими являются точки проверочной части среды моделирования, не участвовавшие в вычислении коэффициентов моделей-претендентов. Наиболее точными на будущих точках являются модели-претенденты с меньшими значениями критерия регулярности. Эти модели пропускают на следующий шаг алгоритма.

Если среди отобранных моделей-претендентов нет модели с минимумом критерия регулярности, то в эти модели подставляют значения входящих в них переменных. Таким образом, получают новые промежуточные переменные, и среда моделирования будет состоять из этих промежуточных переменных.

12.3.8. На последующих шагах алгоритма повторяют действия с определением коэффициентов новых моделей-претендентов до тех пор, пока не обнаружат минимум критерия регулярности.

Если найдена модель с минимумом критерия регулярности, то алгоритм МГУА прекращает работу. Такую модель считают прогнозной моделью оптимальной сложности. Подставляя величины входящих в нее переменных, получают значение прогнозируемого показателя.

12.3.9. Основной особенностью рыбохозяйственных прогнозов с помощью МГУА является косвенное измерение существенных переменных. Оно применяется в автоматике и носит название «способ дифференциальной вилки». Допустим, данный объект лова содержит входных переменных, на которые может быть наложеносвязей. Тогда для построения промысловой прогнозной модели этого объекта достаточно использовать всего-входных переменных. Остальные входные переменные можно исключить. Зная состав и число входных переменных, а также число связей между ними, легко определить минимальное число переменных для введения в прогнозную модель. Обычно входных переменных выбирают больше их минимального числа. Однако при этом следят, чтобы среди них не было линейно зависимых. Это упрощает получение исходных данных, так как позволяет использовать легко измеряемые величины. Соответственно, из промысловых прогнозных моделей, полученных методом МГУА, иногда исключают, на первый взгляд, очень важные переменные.

12.3.10. При использовании МГУА оптимальную модель ищут среди постоянно усложняющихся моделей-претендентов (уравнений регрессии). Число моделей увеличивают, пока повышается точность моделирования.

Обычно построенные прогнозные модели используют для прогнозирования с единичным интервалом упреждения (на один год вперед). Для получения прогнозов на следующий год процесс построения модели повторяют сначала.

12.3.11. Рассмотрим особенности прогнозирования при различных показателях входных и выходных переменных, которые реализованы на примере промысла каспийской кильки.

12.3.12. Опишем сначала прогнозирование уловов по данным промысловой статистики и условий внешней среды с применением общих правил прогнозирования МГУА, рассмотренных в начале параграфа.

Массив исходных данных составляют из значений прогнозируемого показателя (выходной переменной) и значений факторов, влияющих на него (входных переменных). Выходной переменной считают величину улова для рассматриваемого типа судна или улова на судосутки лова.

Входными переменными могут служить любые показатели из промысловой статистики и динамика температуры воды. Обычно для получения прогноза улова с заблаговременностью в один год входными промысловыми переменными служат промысловое усилие, время на промысле, с некоторым запаздыванием величину улова, урожайность поколений. Среди выбранных факторов не должно быть коллинеарных, для которых коэффициент парной корреляции близок к единице.

Для образования массива исходных данных выходную переменную представляют величиной улова на судосутки лова за ряд лет промысла. Входными переменными считают также величину улова на судосутки лова, но с запаздыванием на несколько лет. Так, если при разработке прогноза величины улова за судосутки лова на 2006 год выходные переменные представлены значениями улова на судосутки лова за 1995-2005 годы, то входные переменные - значениями улова за 1994 - 2004 годы.

Массив исходных данных по общим правилам делят на обучающую и проверочную части.

Оптимальное количество точек в проверочной части массива исходных данных находят путем сравнения возможных вариантов. Для этого с помощью МГУА при различном количестве точек в проверочной части и постоянных значениях других параметров метода, строят серии моделей для получения ретроспективных прогнозов улова за прошлые годы, для которых величина улова известна.

Сравнивая прогнозы с фактическими значениями улова, выбирают серию лучших прогнозов. Количество точек в проверочной части массива исходных данных, соответствующее этим прогнозам, будет оптимальным.

Число моделей-претендентов, отбираемых для использования на последующих шагах алгоритма, должно примерно совпадать с количеством входных переменных в массиве исходных данных и составляет в этом случае 10-20 моделей.

Порядок величины глубокого минимума критерия регулярности определяют в зависимости от дисперсии значений входной переменной. При получении прогнозов улова (улова за судосутки лова) и выбранном виде критерия регулярности прогнозная модель достигает глубокого минимума, если значение этого критерия на проверочной части меньше 0.01. Для достижения глубокого минимума критерия регулярности обычно шагов алгоритма не должно быть больше, чем количество точек в проверочной части массива исходных данных.

Если глубокий минимум критерия регулярности не достигнут, следует увеличить число шагов алгоритма и расширить массив исходных данных, введя туда дополнительные факторы. Если и это не приводит к достижению глубокого минимума, то для получения прогноза используют построенные модели. При этом снижается степень доверия к полученным результатам.

После определения значений основных параметров алгоритма исходные данные вводят в ЭВМ, и по программе полиномиального алгоритма МГУА получают прогнозную модель оптимальной сложности. По модели вычисляют будущее значение улова в зависимости от величины промыслового усилия, которое задается количеством судосуток лов.

12.3.13. Следующий случай предусматривает прогноз будущей численности размерных групп рыб по предшествующей численности основных размерных групп, а иногда и улова.

В размерную группу объединяют рыб близких размеров, между которыми существует тесная связь в течение нескольких лет. Тесноту связей между переменными определяют коэффициентом парной корреляции. Значения коэффициентов корреляции вычисляют для каждой пары переменных как долю рыб определенного размера в популяции за годы наблюдений. Из вычисленных коэффициентов отбирают близкие к единице и по ним формируют размерные группы.

Для разработки прогноза будущей численности размерной группы образуют массив исходных данных. Выходная переменная в этом массиве представлена численностью за ряд лет выбранной размерной группы. Входные переменные включают численность основных размерных групп, взятых с единичным запаздыванием, например на один год, по отношению к значениям выходной переменной.

В образованном массиве выделяют обучающую и проверочную часть.

В проверочную часть попадает несколько последних точек (одна, если в массиве исходных данных 10-12 точек; две, если массив содержит не более 20 точек; три, если в массиве более 20 точек).

При количестве входных переменных в массиве исходных данных меньше 10 для использования на следующих шагах алгоритма отбирают 20 лучших по критерию минимума смещения моделей-претендентов. Если входных переменных 10-20, то отбирают 30 моделей, если входных переменных больше 20-50 моделей.

На каждом шаге значимость построенных моделей определяют по коэффициенту множественной корреляции (по критерию Фишера). Из моделей по значимым коэффициентам множественной корреляции и минимуму ошибки на экзаменационной части массива выбирают прогнозную модель оптимальной сложности. Как правило, для получения такой модели достаточно двух шагов.

В рассматриваемом случае возможны два варианта прогнозирования.

Первый из них основан на использовании многолетних данных о размерном составе популяции, второй - на применении многолетних данных о размерном составе и величине улова. По второму варианту, в отличие от первого, прогнозируют не только размерный состав улова, но и величину улова. Для прогнозирования во втором случае необходимы исходные данные об абсолютной величине улова рыб различных размерных групп за 10-20 лет и эвристический критерий.

Таблицу исходных данных делят на две части - обучающую, по которой находят коэффициенты моделей, и проверочную, на которой по величине эвристического критерия (среднеквадратичной ошибке) отбирают лучшие из них.

Процесс построения прогнозной модели оптимальной сложности является многошаговым. На каждом шаге процесса из полученных моделей-претендентов по величине критерия отбирают несколько лучших. Процесс отбора продолжают, пока величина среднеквадратичной ошибки не достигнет максимума.

Для уточнения результатов расчетов, кроме данных о размерном составе и величине улова, целесообразно использовать и другие данные. К ним относятся количество судосуток на промысле и вне эксплуатации; количество рейсов и судосуток лова; улов на судно; ежегодное пополнение промыслового стада; температура воды в районах нереста. Все эти данные должны влиять на улов и соотношение в уловах размерных и возрастных групп.

Число моделей выбирают, учитывая, что с увеличением их числа растет точность расчетов, но увеличиваются затраты машинного времени. При прогнозировании на каждом шаге отбирают 12-15 лучших моделей-претендентов.

Выбирая оптимальную длину интервала учитываемой предыстории и соотношение между обучающей и проверочной частью, рассматривают различные варианты. По результатам расчетов выбирают те, которые обеспечивают максимальную точность.

В прогнозных моделях в рассматриваемом примере обычно используют значения влияющих факторов за последние 2-4 года. Соотношение между обучающей и проверочной частью принимают от 1.25 до 2.0.

Рассмотренный способ прогнозирования можно использовать для прогноза улова и размерного состава улова различных видов рыб. Ошибка величины улова и соотношения между размерными группами в улове не превышает 6-8%, т.е. меньше ошибок прогнозирования другими методами.

12.3.14. Последний случай применения МГУА предусматривает прогнозирование величины улова каспийской кильки по данным промысловой статистики и урожайности поколений для различных типов добывающих судов с заблаговременностью в один год. При наличии соответствующей информации способ можно применять для прогнозирования возможных уловов и уловов на единицу промыслового усилия для других объектов и районов промысла, с другими интервалами упреждения.

Исходными данными для получения прогноза в соответствии с методикой служит промысловая статистика. К ней относятся улов, улов на судосутки лова по отдельным типам судов, время нахождения судов рассматриваемых типов на промысле, данные о показателе урожайности - относительной численности возрастной группы 0+ популяции анчоусовидной кильки.

Прогноз разрабатывают построением прогнозных моделей, связывающих величину улова на судосутки лова по отдельным типам судов и значениями показателя урожайности, косвенно характеризующих относительную численность отдельных поколений промыслового стада.

Правила и последовательность операций в этом случае примерно такая же, как и в двух рассмотренных ранее случаях применения МГУА.

В массиве исходных данных в качестве выходной переменной используют величину улова на судосутки лова по рассматриваемому типу добывающего судна. Входными переменными служат судосутки лова и показатель урожайности анчоусовидной кильки, взятый с некоторыми запаздываниями по отношению к прогнозируемому показателю.

Появление в массиве исходных данных «запаздывающих» переменных объясняется тем, что на величину прогноза улова кильки оказывают влияние не только значения показателя урожайности текущего года, но и его значения в прошлом.

Запаздывание соответствует числу лет, предшествующих году, на который осуществляется прогноз. Значения факторов в эти годы непосредственно могут быть использованы для вычисления прогноза по построенной прогнозной модели. Если в массиве исходных данных имеется первая описанная выше входная переменная (судосутки лова), то при прогнозе показатель урожайности имеет интервал равный одному году учитываемой предыстории. При наличии в массиве двух описанных входных переменных длина интервала учитываемой предыстории для показателя урожайности равна двум годам.

При больших величинах запаздывания количество входных переменных в массиве исходных данных больше, что увеличивает время построения прогнозной модели. Время запаздывания задают исходя из наличия исходной информации для исследований и тесноты связи прогнозируемого показателя с запаздывающими переменными. Запаздывание обычно принимают, чтобы количество входных переменных в массиве не превышало 100-200. Увеличение запаздывания каждого фактора целесообразно до тех пор, пока приводит к появлению входных переменных, тесно связанных с прогнозируемым показателем.

В промысловых уловах кильки встречаются особи возраста от 1+ до 6+ лет. Поэтому при прогнозе улова на судосутки лова длина интервала учитываемой предыстории для показателя урожайности равна 6 годам. Следовательно, в массив исходных данных вводят значения показателя урожайности с величинами запаздывания от 1 до 6 по отношению к прогнозируемому показателю.

Далее массив исходных данных делят по описанным выше правилам на обучающую и проверочную части.

Оптимальное количество точек в проверочной части массива исходных данных находят путем сравнения возможных вариантов. С помощью МГУА при различном количестве точек в проверочной части, но при постоянных значениях других параметров, строят серии моделей. Они служат для получения ретроспективных промысловых прогнозов на годы, для которых уже известны их значения. Сравнивая прогнозы по построенным моделям с фактическими значениями прогнозируемого показателя, выбирают серию лучших прогнозов. Количество точек в проверочной части массива исходных данных, соответствующих этим прогнозам, является оптимальным.

Число моделей-претендентов для использования на последующих шагах алгоритма задают примерно равным количеству входных переменных в массиве исходных данных и составляет примерно 10-50 моделей. Увеличение числа моделей приводит к росту затрат машинного времени, но не дает улучшения прогноза, а уменьшение - к потере некоторых важных моделей-претендентов, что существенно сказывается на качестве прогнозов.

Порядок величины глубокого минимума критерия регулярности, как обычно, определяют в зависимости от дисперсии значений выходной переменной.

Если критерий регулярности построенной прогнозной модели не достигает глубокого минимума, то увеличивают число моделей-претендентов для использования на последующих шагах алгоритма или для расширения массива исходных данных. Для увеличения числа моделей вводят дополнительные факторы. Если и это не приводит к достижению глубокого минимума, то для получения прогноза вынуждены использовать уже построенные модели. При этом снижается степень доверия к полученным результатам.

После определения значений основных параметров алгоритма исходные данные вводят в ЭВМ и по программе МГУА и получают прогнозную модель оптимальной сложности.