Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы моделирования в геологии

..pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
8.18 Mб
Скачать

b0 = y - b \ x - b 2x2 bmxm. Общий вклад всех независимых пе­ ременных в оценку у определяется значением квадрата множест­

венного

коэффициента корреляции R2. Значение R = 1 - 1/С",

где С' -

диагональный элемент матрицы [Л]"1, обратной корреляци­

онной матрице [/?]).

Для сравнительной оценки вклада каждой зависимой перемен­ ной коэффициент R2 сначала рассчитывается для пары у и х* с мак­ симальным коэффициентом корреляции, а затем - последовательно с тремя и более переменными (до т переменных).

Модели множественной регрессии используются для предска­ заний значений зависимой переменной (например, содержаний цен­ ного элемента, объемной массы руды и глубины формирования ми­ нерала и др.) по набору независимых переменных (например, со­ держаний породообразующих элементов, объемных масс тяжелых минералов в рудах, содержаний элементов-индикаторов в минера­ лах и др.).

Пример. Рассмотрим результаты статистического изучения особенностей распределения содержаний рубидия, цезия, лития

икалия в микроклинах крутого пегматитового тела. Многими ис­ следователями было отмечено, что калиевые полевые шпаты, взя­ тые из различных частей пегматитовых жил, характеризуются разным содержанием щелочей, причем, наблюдается закономерное уменьшение содержаний редких щелочей в калиевых полевых шпа­ тах от центра жилы к зальбандам и с глубиной. Однако эти выво­ ды основываются на ограниченных аналитических данных и носят скорее качественный, чем количественный характер. Пегматито­ вое тело в виде крутопадающей секущей жилы залегает среди пе­ реслаивающихся кварц-биотитовых и андалузит-биотитовых сланцев среднепротерозойского возраста. Оно обладает сложной неправильной формой (характерна изменчивость элементов зале­ гания как по простиранию, так и по падению: наличие раздувов, пережимов, изгибов и апофиз), отличается крупными размерами

идовольно ясно выраженным симметрично-зональным строением. Призальбандовую часть тела слагает эндоконтактовая мусковиткварцевая оторочка шириной от 10 до 40 см. Эта оторочка сменя­ ется зоной мелкозернистого существенно альбитового пегматита мощностью от 1 до 33 м. Центральная часть жилы сложена

неравномерно-зернистым, средне- и крупнозернистым, часто бло­ ковым, неравномерно альбитизированным сподумен-микроклин- кварцевым пегматитом директивной структуры, в котором встречаются гнезда и полосы существенно алъбитового состава и участки, сложенные кварц-сподуменовым агрегатом.

Из описанного пегматитового тела была отобрана серия проб микроклина (56 образцов), для которых количественным спек­ тральным методом были определены содержания рубидия, цезия, лития и калия.

Для выяснения зависимости между расположением микрокли­ на в пределах пегматитового тела и такими его характеристика­ ми, как содержание редких щелочей и калия, величина отношения калия к рубидию и рубидия к цезию, интенсивность окраски был проведен многомерный корреляционный анализ взаимосвязи пере­ численных выше параметров с координатами, определяющими по­ ложение пробы в пределах тела. В качестве координат были при­ няты: I—относительное расстояние места взятия пробы от кон­ такта; h - относительная высота места взятия. Содержания элементов (CRb, CCs, CLi, Ск) оценивались в тысячных долях процен­ та; относительные расстояния от контакта I - в процентах от мощности э/силы в данном сечении; относительные высоты h от­ считывались от условного нулевого уровня, совпадающего с ниж­ ней границей обнаженной части жилы; интенсивность окраски (оцениваемая субъективно) была обозначена следующими индексами: I —светло-серая; 2 - серая; 3 - темно-серая; 4 - очень темно-серая.

Для того чтобы исключить возможное влияние краевых зон, все варианты задач по определению множественной корреляции решались дважды: для всего набора проб (п = 56) и только для проб из центральной части жилы, то есть тех, у которых I < 25 % (п = 34). Для учета законов распределения случайных величин (со­ держания редких щелочей в микроклинах распределены логнормаль­ но, а калия - нормально) все вычисления производились дважды: для случайных величин и их логарифмов. Но так как проверка гипотезы о равенстве коэффициентов корреляции с помощью преобразова­ ния Фишера показала, что различия между оценками этих коэф­ фициентов для случайных величин и их логарифмов несущественны (при 5 %-ном уровне значимости), результаты вычислений для ло­ гарифмов не приводятся.

3.6. Задачи распознавания образов в геологии

Многие прогнозные и интерпретационные задачи решаются в практической геологии путем сопоставления комплекса признаков изучаемого объекта с комплексом тех же признаков эталонного объекта. Совокупность подобных методов, основанных на принци­ пе аналогии, получила название методов распознавания образов.

Проблема распознавания образов геологических объектов тес­ но связана с проблемой их классификации по совокупности извест­ ных признаков. С позиций многомерного математического анализа реальному геологическому объекту ставится в соответствие набор действительных чисел дгь лг2, ..., JCw, которые выражают значения его измеренных геологических, геохимических или геофизических его признаков. Каждая совокупность таких чисел интерпретируется как вектор или точка в многомерном пространстве, а множествам объ­ ектов одного класса в пространстве признаков соответствуют неко­ торые множества точек.

Области многомерного пространства, в которых сосредоточены точки одного класса, называются собственными областями классов. Если объекты тождественны друг другу, их собственные области совпадают. Собственные области объектов, резко отличающихся друг от друга, не пересекаются в пространстве. Для объектов, близ­ ких по некоторым признакам, характерно большее или меньшее пе­ ресечение их собственных областей.

Разделение непересекающихся собственных областей двух классов возможно с помощью гиперповерхностей (в трехмерном пространстве - плоскостей, в двухмерном - линий), а для разделе­ ния пересекающихся областей необходимо отыскать решающую функцию, минимизирующую возможность принятия ошибочного решения.

Статистический подход к классификации объектов основан на байесовской теории принятия решений. В терминах этой теории «состояние природы» А может быть охарактеризовано вероятно­ стью Р(А1) и условной вероятностью Р(Х/А,). Под условной вероят­ ностью подразумевается вероятность того, что совокупность при­ знаков объекта примет значение Х9когда состояние природы будет Aj (то есть объект будет относиться к классу Л,). Если удается оце­

нить априорную Р(А) и условную Р(Х/А) вероятность, можно пред­ сказать свойственное объекту состояние природы в зависимости от того, какое значение X примут характеризующие его признаки:

Р(А/)Р(Х / А/)

P(Ai / X ) = т

^ Р ( А ,) Р ( Х / А,)

где т - число возможных состоянии природы (то есть классов).

Для совокупностей многомерных

статистических признаков

геологических объектов заранее не известно, пересекаются их соб­ ственные области или нет, в связи с чем допускается возможность их пересечения. В качестве меры пересечения Ф используется про­ изведение условных вероятностей Ф = Р ( XI А,) Р (XI Aj), где Р (XI А/) - вероятность попадания точки X в область пересечения при ус­ ловии, что она относится к классу А -,; P(X/Aj) - то же при условии, что она относится к классу Aj.

Правило, в соответствии с которым производится разграниче­ ние объектов на классы, называется решающим правилом. Для его реализации в общем случае подыскивается система разделяющих функций gi(A'), &(Х), ..., gm(X). Если g,(X) > gj(X), точка X принадле­ жит к Aj и наоборот. Если g,(X) = g/X), то области Л, и Aj соприка­ саются. Если при подстановке признаков Хтокажется, что для всех / Ф j соблюдается неравенство g/(X) > g,(X), то можно утверждать принадлежность объекта к классу /.

Для нормального распределения признака / g,{X) = - (х - Зс,)2 /

12а2 Задача обучения распознаванию образов сводится к подбору математической модели алгоритма аппроксимации и построению в пространстве признаков некоторой поверхности (в общем случае - гиперплоскости), разделяющей множества точек, которые соответ­ ствуют различным классам объектов, или к отысканию решающей функции.

Модели распознавания образов геологических объектов весьма разнообразны. При решении конкретных геологических задач их выбор зависит от природы геологических объектов, числа, полноты описания эталонных объектов, типов и информативности их при­

знаков. В зависимости от типов исходных признаков выделяют две группы моделей: дискретные и непрерывные. Дискретные модели применяются в тех случаях, когда измеряемые признаки рассматри­ ваются как независимые или частично зависимые детерминирован­ ные величины. Непрерывные модели используются для распознава­ ния образов таких объектов, измеряемые признаки которых могут рассматриваться как случайные величины и поддаются статистиче­ скому описанию многомерными функциями плотностей вероятности.

В качестве критериев оптимальности распознавания использу­ ются решающие правила, определяющие пороговые значения ре­ шающих функций. Они могут определяться статистическими, логи­ ческими или эвристическими методами.

Для целей эффективного использования математических мето­ дов распознавания образов необходимо последовательно решить несколько взаимосвязанных задач: выбрать эталонные объекты, признаки и методы распознавания; построить решающее правило и провести классификацию контрольных объектов. Лишь после по­ лучения удовлетворительных результатов такой классификации можно приступать к распознаванию образов новых объектов.

При выборе эталонных объектов (формировании выборки обу­ чения) следует помнить: использование статистических алгоритмов распознавания требует, чтобы число объектов в выборке обучения было в несколько раз больше числа признаков. Чем больше неиз­ вестных параметров (например, средних значений и дисперсий при­ знаков), которые требуют определения в процессе обучения, тем больше должна быть выборка обучения. Поэтому на практике обычно возникает проблема сокращения числа признаков и повы­ шения их информативности. При использовании алгоритмов, в ко­ торых измеренные признаки рассматриваются как детерминирован­ ные величины, число объектов в выборке обучения может быть со­ измеримым или даже меньше числа измеряемых признаков.

При выборке признаков, характеризующих особенности оцени­ ваемых геологических объектов (формировании признакового про­ странства объектов), решающее значение имеют знания и аналити­ ческие способности исследователей, от эрудиции которых зависит правильная отбраковка заведомо неинформативных и малоинфор­ мативных признаков и предельно возможное ограничение размер­ ности признакового пространства.

Эвристическими называют такие методы, когда пороговые зна­ чения решающих функций оцениваются эмпирически или с пози­ ций «здравого смысла».

Выбор метода распознавания основывается на априорных зна­ чениях специалистов-геологов и результатах предварительного ана­ лиза выборок объектов по их признаковым описаниям. В односвяз­ ных объектах классы распознаваемых объектов характеризуются многими особенностями, члены одного и того же класса располага­ ются близко, а члены различных классов - далеко друг от друга. В таких случаях применяются простые и быстродействующие ли­ нейные методы распознавания образов (разделение гиперплоско­ стью или кусочно-линейной гиперповерхностью). Если же классы состоят из подклассов, один из которых находится в окружении то­ чек другого класса {многосвязные объекты), для их распознавания используются более сложные и емкие по времени нелинейные ме­ тоды, например, полиномиальные разделяющие функции. При ис­ пользовании любых алгоритмов распознавания следует стремиться к построениям решающих функций как можно более простых ви­ дов, поскольку они легче поддаются реализации и обеспечивают более устойчивые решения, особенно при малых выборках обучения.

3.7. Статистическая оценка перспектив

рудоносности территорий

Для прогнозирования перспектив рудоносности территорий, вероятных масштабов оруденения и ожидаемых геолого-промыш­ ленных типов месторождений используются совокупности (наборы) геологических, геофизических и минералого-геохимических при­ знаков, для которых изначально установлены пространственные или временные связи с прогнозируемыми геологическими объ­ ектами.

В простейших случаях удается различить сравниваемые объек­ ты по суммам кодируемых признаков. В таких схемах различающая способность (информативность) каждого из признаков изучается и оценивается раздельно с помощью условных балльных оценок, коэффициентов парной линейной или ранговой корреляции и дру­ гими способами. Однако, оценивая информативность каждого при-

знака изолированно, нельзя получить характеристики их суммарной эффективности, поскольку месторождения полезных ископаемых представляют собой сложные геологические системы, сформиро­ ванные под совокупным влиянием многих рудообразующих факто­ ров. Для оценок их важнейших пространственно-временных связей необходимо выявление суммарного эффекта доминирующих рудо­ образующих факторов. Используя более совершенные схемы распо­ знавания перспективных площадей или крупномасштабных рудных объектов с применением человскомашинных методов предвари­ тельного преобразования признаков, принятия оптимальных реше­ ний и оценки их надежности, можно заметно повысить информа­ тивность используемых исходных данных. При этом, однако, во­ просы выбора объектов и территорий прогноза, элементарных участков прогнозирования, совокупностей исходных признаков и систем их описания основываются прежде всего на существующем опыте человекомашинного прогнозирования и геологической эру­ диции исполнителей.

Обычно за элементарные участки прогноза принимаются квад­ ратные и прямоугольные ячейки, размеры которых определяются средними размерами прогнозируемых объектов, целями и масшта­ бами проводимых исследований. Как правило, площади элементар­ ных ячеек измеряются на картах любых масштабов квадратными сантиметрами или их долями. Для описания элементарных участков выбираются признаки, наиболее тесно связанные с проявлениями процесса оруденения и масштабами рудных образований. Это могут быть наборы детерминированных признаков, характеризующих ли­ тологический, гранулометрический, петрографический или мине­ ральный состав полезных ископаемых и вмещающих их пород, их стратиграфическое положение или формационную принадлежность, пространственные связи с тектоническими или вулкано тектониче­ скими структурами линейного или центрального типов, метасоматитами или гидротермалитами соответствующих масштабов прояв­ ления или стохастических характеристик различных свойств полез­ ных ископаемых и вмещающих их пород.

Полученный массив описаний разбивается на несколько сово­ купностей: эталонная выборка перспективных объектов (месторож­ дений, рудных полей и др.); эталонная выборка неперспективных

территорий; выборка объектов экзамена, включающая как перспек­ тивные, так и неперспективные объекты; массив описания диагно­ стируемых территорий (если необходимых сведений нет, выборки «2 », а иногда и «1» могут отсутствовать; в таких случаях возможна процедура распознавания образов только в самообучающемся ре­ жиме «автоматической классификации»).

Дальнейшая обработка данных зависит от видов описываемых признаков, качества и объема эталонных выборок.

При большом числе дискретных детерминированных неметри­ зованных признаков и ограниченном числе эталонных выборок ис­ ходных данных, что характерно для подавляющего большинства задач подобного рода, массив исходных векторных переменных преобразуется в альтернативную форму (есть - 1, нет - 0). С целью минимизации размерности признакового пространства определяет­ ся информативность каждого признака, отбрасываются наименее информативные из них и выбирается оптимальный алгоритм распо­ знавания.

В случаях отсутствия нулевых вероятностей признаков (невы­ рожденные распределения) возможно применение алгоритмов рас­ познавания типа ШОУ-1, ШОУ-2, Образ-3 и других с использова­ нием статистического дискретного или эвристического решающего правила.

При наличии выборочных частот вероятностей признаков рав­ ных нулю (вырожденные распределения) применяются детермини­ стские алгоритмы распознавания образов типа «Тупиковые тесты», Кора-1, Кора-2, Кора-3, «Перебор», «Гиперпласт» и других с ис­ пользованием логических и эвристических решающих правил. Де­ терминистский алгоритм распознавания «Гиперпласт» использован в человекомашинной информационно-прогнозирующей системе «Регион-ОС», принятой к внедрению в геологоразведочной службе нашей страны.

3.8. Оценка информативности геологических признаков

При решении задач распознавания образов часто возникает проблема сокращения размерности признакового пространства пу­ тем исключения наименее информативных признаков. Сокращение

числа признаков не только упрощает используемые алгоритмы рас­ познавания, но и способствует улучшению качества классификации объектов, удаляя случайные помехи («шумы»), искажающие и за­ тушевывающие полезную информацию. Оценка информативности признаков полезна, поскольку она способствует выявлению рудо­ формирующих факторов и их ранжированию по степени значи­ мости.

Строгих математических методов оценок оптимальных мер от­ носительной информативности признаков пока что не разработано. С этой целью в геологической практике используются различные эвристические, детерминистские и статистические подходы, обес­ печивающие формирование признакового пространства меньшей размерности по отношению к исходному. Формирование простран­ ства меньшей размерности достигается либо путем отбора из т ис­ ходных признаков некоторого (меньшего) числа наиболее информа­ тивных признаков, либо конструированием новой системы призна­ ков с определенными свойствами, либо одновременно двумя этими методами. Сложность решения этой задачи связана с тем, что оцен­ ка индивидуальной информативности любого признака в отдельно­ сти от других признаков часто не обеспечивает достоверных ре­ зультатов вследствие наличия статистических связей между ними. Даже относительно независимые признаки, весьма информативные по результатам индивидуальных оценок, могут обеспечить в сово­ купности с другими признаками лишь весьма незначительную до­ полнительную информацию, и наоборот, относительно малоинфор­ мативные признаки могут значительно увеличивать суммарную ин­ формативность системы признаков.

К числу эвристических методов оценки информативности и ранжирования признаков относятся сбор и обработка сведений об изучаемых объектах, получаемых в результате опроса экспер- тов-специалистов. Поскольку мнения специалистов об информа­ тивности конкретных признаков, как правило, расходятся, резуль­ таты опроса подвергаются систематизации и математической об­ работке методами ранговой корреляции или дифференциального ранжирования. Использование информации, обобщающей коллек­ тивный опыт специалистов, повышает достоверность исходных данных.

Детерминистские и статистические методы оценки информа­ тивности признаков основаны на их ранжировании по данным вы­ борки обучения, то есть по фактическим данным, характеризующим изучаемые классы объектов. Ранжирование признаков по выборке обучения можно проводить в предположении о их статистической независимости либо о наличии взаимозависимости между ними.

При детерминированном подходе информативность независи­ мого признака определяется тем, насколько сильно отличаются его значения в разных распознаваемых классах. Так, например, при ис­ пользовании алгоритмов «Тупиковые тесты» информационный вес признака г определяется числом Rr = Мг/ М (где М - общее число всех тупиковых тестов, Мг - число тех тупиковых тестов, в которые входит столбец с номером г).

Статистический подход к оценке информативности независи­ мых признаков опирается на разность или отношение вероятностей признака в разных классах. Так, например, информативность при­ знака оценивается по нормированной разности средних его арифме­ тических значений в выборках обоих классов: J ~{ххх2) 2 / S 2, где S1 - средневзвешенное стандартное отклонение по обеим выборкам.

Для целей ранжирования условно независимых признаков по их информативности могут быть использованы и оценки парных коэффициентов корреляции их значений в выборках обоих классов.

В практических задачах при ограниченном числе признаков требуется оценка информативности не каждого признака, а их соче­ таний. Для сочетаний независимых признаков их информативность может быть определена суммированием информативностей отдель­ ных признаков, выраженных в долях единицы. Однако при решении большинства геологических задач условие взаимозависимости при­ знаков не соблюдается, вследствие чего такой способ неправомерен.

Для оценок информативности и ранжирования взаимозависи­ мых признаков разработаны специфические методы выделения их наиболее информативных сочетаний, однако многие из них мало­ эффективны из-за необходимости перебора огромного числа ком­ бинаций. В практике решения задач по распознаванию образов для оценок информативности признаков и их ранжирования использу­ ются методы дискриминантного анализа и метод главных компо­ нент.

Соседние файлы в папке книги