книги / Математические методы моделирования в геологии
..pdfb0 = y - b \ x - b 2x2 bmxm. Общий вклад всех независимых пе ременных в оценку у определяется значением квадрата множест
венного |
коэффициента корреляции R2. Значение R = 1 - 1/С", |
где С' - |
диагональный элемент матрицы [Л]"1, обратной корреляци |
онной матрице [/?]).
Для сравнительной оценки вклада каждой зависимой перемен ной коэффициент R2 сначала рассчитывается для пары у и х* с мак симальным коэффициентом корреляции, а затем - последовательно с тремя и более переменными (до т переменных).
Модели множественной регрессии используются для предска заний значений зависимой переменной (например, содержаний цен ного элемента, объемной массы руды и глубины формирования ми нерала и др.) по набору независимых переменных (например, со держаний породообразующих элементов, объемных масс тяжелых минералов в рудах, содержаний элементов-индикаторов в минера лах и др.).
Пример. Рассмотрим результаты статистического изучения особенностей распределения содержаний рубидия, цезия, лития
икалия в микроклинах крутого пегматитового тела. Многими ис следователями было отмечено, что калиевые полевые шпаты, взя тые из различных частей пегматитовых жил, характеризуются разным содержанием щелочей, причем, наблюдается закономерное уменьшение содержаний редких щелочей в калиевых полевых шпа тах от центра жилы к зальбандам и с глубиной. Однако эти выво ды основываются на ограниченных аналитических данных и носят скорее качественный, чем количественный характер. Пегматито вое тело в виде крутопадающей секущей жилы залегает среди пе реслаивающихся кварц-биотитовых и андалузит-биотитовых сланцев среднепротерозойского возраста. Оно обладает сложной неправильной формой (характерна изменчивость элементов зале гания как по простиранию, так и по падению: наличие раздувов, пережимов, изгибов и апофиз), отличается крупными размерами
идовольно ясно выраженным симметрично-зональным строением. Призальбандовую часть тела слагает эндоконтактовая мусковиткварцевая оторочка шириной от 10 до 40 см. Эта оторочка сменя ется зоной мелкозернистого существенно альбитового пегматита мощностью от 1 до 33 м. Центральная часть жилы сложена
неравномерно-зернистым, средне- и крупнозернистым, часто бло ковым, неравномерно альбитизированным сподумен-микроклин- кварцевым пегматитом директивной структуры, в котором встречаются гнезда и полосы существенно алъбитового состава и участки, сложенные кварц-сподуменовым агрегатом.
Из описанного пегматитового тела была отобрана серия проб микроклина (56 образцов), для которых количественным спек тральным методом были определены содержания рубидия, цезия, лития и калия.
Для выяснения зависимости между расположением микрокли на в пределах пегматитового тела и такими его характеристика ми, как содержание редких щелочей и калия, величина отношения калия к рубидию и рубидия к цезию, интенсивность окраски был проведен многомерный корреляционный анализ взаимосвязи пере численных выше параметров с координатами, определяющими по ложение пробы в пределах тела. В качестве координат были при няты: I—относительное расстояние места взятия пробы от кон такта; h - относительная высота места взятия. Содержания элементов (CRb, CCs, CLi, Ск) оценивались в тысячных долях процен та; относительные расстояния от контакта I - в процентах от мощности э/силы в данном сечении; относительные высоты h от считывались от условного нулевого уровня, совпадающего с ниж ней границей обнаженной части жилы; интенсивность окраски (оцениваемая субъективно) была обозначена следующими индексами: I —светло-серая; 2 - серая; 3 - темно-серая; 4 - очень темно-серая.
Для того чтобы исключить возможное влияние краевых зон, все варианты задач по определению множественной корреляции решались дважды: для всего набора проб (п = 56) и только для проб из центральной части жилы, то есть тех, у которых I < 25 % (п = 34). Для учета законов распределения случайных величин (со держания редких щелочей в микроклинах распределены логнормаль но, а калия - нормально) все вычисления производились дважды: для случайных величин и их логарифмов. Но так как проверка гипотезы о равенстве коэффициентов корреляции с помощью преобразова ния Фишера показала, что различия между оценками этих коэф фициентов для случайных величин и их логарифмов несущественны (при 5 %-ном уровне значимости), результаты вычислений для ло гарифмов не приводятся.
3.6. Задачи распознавания образов в геологии
Многие прогнозные и интерпретационные задачи решаются в практической геологии путем сопоставления комплекса признаков изучаемого объекта с комплексом тех же признаков эталонного объекта. Совокупность подобных методов, основанных на принци пе аналогии, получила название методов распознавания образов.
Проблема распознавания образов геологических объектов тес но связана с проблемой их классификации по совокупности извест ных признаков. С позиций многомерного математического анализа реальному геологическому объекту ставится в соответствие набор действительных чисел дгь лг2, ..., JCw, которые выражают значения его измеренных геологических, геохимических или геофизических его признаков. Каждая совокупность таких чисел интерпретируется как вектор или точка в многомерном пространстве, а множествам объ ектов одного класса в пространстве признаков соответствуют неко торые множества точек.
Области многомерного пространства, в которых сосредоточены точки одного класса, называются собственными областями классов. Если объекты тождественны друг другу, их собственные области совпадают. Собственные области объектов, резко отличающихся друг от друга, не пересекаются в пространстве. Для объектов, близ ких по некоторым признакам, характерно большее или меньшее пе ресечение их собственных областей.
Разделение непересекающихся собственных областей двух классов возможно с помощью гиперповерхностей (в трехмерном пространстве - плоскостей, в двухмерном - линий), а для разделе ния пересекающихся областей необходимо отыскать решающую функцию, минимизирующую возможность принятия ошибочного решения.
Статистический подход к классификации объектов основан на байесовской теории принятия решений. В терминах этой теории «состояние природы» А может быть охарактеризовано вероятно стью Р(А1) и условной вероятностью Р(Х/А,). Под условной вероят ностью подразумевается вероятность того, что совокупность при знаков объекта примет значение Х9когда состояние природы будет Aj (то есть объект будет относиться к классу Л,). Если удается оце
нить априорную Р(А) и условную Р(Х/А) вероятность, можно пред сказать свойственное объекту состояние природы в зависимости от того, какое значение X примут характеризующие его признаки:
Р(А/)Р(Х / А/) |
|
P(Ai / X ) = т |
’ |
^ Р ( А ,) Р ( Х / А,) |
|
где т - число возможных состоянии природы (то есть классов). |
|
Для совокупностей многомерных |
статистических признаков |
геологических объектов заранее не известно, пересекаются их соб ственные области или нет, в связи с чем допускается возможность их пересечения. В качестве меры пересечения Ф используется про изведение условных вероятностей Ф = Р ( XI А,) Р (XI Aj), где Р (XI А/) - вероятность попадания точки X в область пересечения при ус ловии, что она относится к классу А -,; P(X/Aj) - то же при условии, что она относится к классу Aj.
Правило, в соответствии с которым производится разграниче ние объектов на классы, называется решающим правилом. Для его реализации в общем случае подыскивается система разделяющих функций gi(A'), &(Х), ..., gm(X). Если g,(X) > gj(X), точка X принадле жит к Aj и наоборот. Если g,(X) = g/X), то области Л, и Aj соприка саются. Если при подстановке признаков Хтокажется, что для всех / Ф j соблюдается неравенство g/(X) > g,(X), то можно утверждать принадлежность объекта к классу /.
Для нормального распределения признака / g,{X) = - (х - Зс,)2 /
12а2 Задача обучения распознаванию образов сводится к подбору математической модели алгоритма аппроксимации и построению в пространстве признаков некоторой поверхности (в общем случае - гиперплоскости), разделяющей множества точек, которые соответ ствуют различным классам объектов, или к отысканию решающей функции.
Модели распознавания образов геологических объектов весьма разнообразны. При решении конкретных геологических задач их выбор зависит от природы геологических объектов, числа, полноты описания эталонных объектов, типов и информативности их при
знаков. В зависимости от типов исходных признаков выделяют две группы моделей: дискретные и непрерывные. Дискретные модели применяются в тех случаях, когда измеряемые признаки рассматри ваются как независимые или частично зависимые детерминирован ные величины. Непрерывные модели используются для распознава ния образов таких объектов, измеряемые признаки которых могут рассматриваться как случайные величины и поддаются статистиче скому описанию многомерными функциями плотностей вероятности.
В качестве критериев оптимальности распознавания использу ются решающие правила, определяющие пороговые значения ре шающих функций. Они могут определяться статистическими, логи ческими или эвристическими методами.
Для целей эффективного использования математических мето дов распознавания образов необходимо последовательно решить несколько взаимосвязанных задач: выбрать эталонные объекты, признаки и методы распознавания; построить решающее правило и провести классификацию контрольных объектов. Лишь после по лучения удовлетворительных результатов такой классификации можно приступать к распознаванию образов новых объектов.
При выборе эталонных объектов (формировании выборки обу чения) следует помнить: использование статистических алгоритмов распознавания требует, чтобы число объектов в выборке обучения было в несколько раз больше числа признаков. Чем больше неиз вестных параметров (например, средних значений и дисперсий при знаков), которые требуют определения в процессе обучения, тем больше должна быть выборка обучения. Поэтому на практике обычно возникает проблема сокращения числа признаков и повы шения их информативности. При использовании алгоритмов, в ко торых измеренные признаки рассматриваются как детерминирован ные величины, число объектов в выборке обучения может быть со измеримым или даже меньше числа измеряемых признаков.
При выборке признаков, характеризующих особенности оцени ваемых геологических объектов (формировании признакового про странства объектов), решающее значение имеют знания и аналити ческие способности исследователей, от эрудиции которых зависит правильная отбраковка заведомо неинформативных и малоинфор мативных признаков и предельно возможное ограничение размер ности признакового пространства.
Эвристическими называют такие методы, когда пороговые зна чения решающих функций оцениваются эмпирически или с пози ций «здравого смысла».
Выбор метода распознавания основывается на априорных зна чениях специалистов-геологов и результатах предварительного ана лиза выборок объектов по их признаковым описаниям. В односвяз ных объектах классы распознаваемых объектов характеризуются многими особенностями, члены одного и того же класса располага ются близко, а члены различных классов - далеко друг от друга. В таких случаях применяются простые и быстродействующие ли нейные методы распознавания образов (разделение гиперплоско стью или кусочно-линейной гиперповерхностью). Если же классы состоят из подклассов, один из которых находится в окружении то чек другого класса {многосвязные объекты), для их распознавания используются более сложные и емкие по времени нелинейные ме тоды, например, полиномиальные разделяющие функции. При ис пользовании любых алгоритмов распознавания следует стремиться к построениям решающих функций как можно более простых ви дов, поскольку они легче поддаются реализации и обеспечивают более устойчивые решения, особенно при малых выборках обучения.
3.7. Статистическая оценка перспектив
рудоносности территорий
Для прогнозирования перспектив рудоносности территорий, вероятных масштабов оруденения и ожидаемых геолого-промыш ленных типов месторождений используются совокупности (наборы) геологических, геофизических и минералого-геохимических при знаков, для которых изначально установлены пространственные или временные связи с прогнозируемыми геологическими объ ектами.
В простейших случаях удается различить сравниваемые объек ты по суммам кодируемых признаков. В таких схемах различающая способность (информативность) каждого из признаков изучается и оценивается раздельно с помощью условных балльных оценок, коэффициентов парной линейной или ранговой корреляции и дру гими способами. Однако, оценивая информативность каждого при-
знака изолированно, нельзя получить характеристики их суммарной эффективности, поскольку месторождения полезных ископаемых представляют собой сложные геологические системы, сформиро ванные под совокупным влиянием многих рудообразующих факто ров. Для оценок их важнейших пространственно-временных связей необходимо выявление суммарного эффекта доминирующих рудо образующих факторов. Используя более совершенные схемы распо знавания перспективных площадей или крупномасштабных рудных объектов с применением человскомашинных методов предвари тельного преобразования признаков, принятия оптимальных реше ний и оценки их надежности, можно заметно повысить информа тивность используемых исходных данных. При этом, однако, во просы выбора объектов и территорий прогноза, элементарных участков прогнозирования, совокупностей исходных признаков и систем их описания основываются прежде всего на существующем опыте человекомашинного прогнозирования и геологической эру диции исполнителей.
Обычно за элементарные участки прогноза принимаются квад ратные и прямоугольные ячейки, размеры которых определяются средними размерами прогнозируемых объектов, целями и масшта бами проводимых исследований. Как правило, площади элементар ных ячеек измеряются на картах любых масштабов квадратными сантиметрами или их долями. Для описания элементарных участков выбираются признаки, наиболее тесно связанные с проявлениями процесса оруденения и масштабами рудных образований. Это могут быть наборы детерминированных признаков, характеризующих ли тологический, гранулометрический, петрографический или мине ральный состав полезных ископаемых и вмещающих их пород, их стратиграфическое положение или формационную принадлежность, пространственные связи с тектоническими или вулкано тектониче скими структурами линейного или центрального типов, метасоматитами или гидротермалитами соответствующих масштабов прояв ления или стохастических характеристик различных свойств полез ных ископаемых и вмещающих их пород.
Полученный массив описаний разбивается на несколько сово купностей: эталонная выборка перспективных объектов (месторож дений, рудных полей и др.); эталонная выборка неперспективных
территорий; выборка объектов экзамена, включающая как перспек тивные, так и неперспективные объекты; массив описания диагно стируемых территорий (если необходимых сведений нет, выборки «2 », а иногда и «1» могут отсутствовать; в таких случаях возможна процедура распознавания образов только в самообучающемся ре жиме «автоматической классификации»).
Дальнейшая обработка данных зависит от видов описываемых признаков, качества и объема эталонных выборок.
При большом числе дискретных детерминированных неметри зованных признаков и ограниченном числе эталонных выборок ис ходных данных, что характерно для подавляющего большинства задач подобного рода, массив исходных векторных переменных преобразуется в альтернативную форму (есть - 1, нет - 0). С целью минимизации размерности признакового пространства определяет ся информативность каждого признака, отбрасываются наименее информативные из них и выбирается оптимальный алгоритм распо знавания.
В случаях отсутствия нулевых вероятностей признаков (невы рожденные распределения) возможно применение алгоритмов рас познавания типа ШОУ-1, ШОУ-2, Образ-3 и других с использова нием статистического дискретного или эвристического решающего правила.
При наличии выборочных частот вероятностей признаков рав ных нулю (вырожденные распределения) применяются детермини стские алгоритмы распознавания образов типа «Тупиковые тесты», Кора-1, Кора-2, Кора-3, «Перебор», «Гиперпласт» и других с ис пользованием логических и эвристических решающих правил. Де терминистский алгоритм распознавания «Гиперпласт» использован в человекомашинной информационно-прогнозирующей системе «Регион-ОС», принятой к внедрению в геологоразведочной службе нашей страны.
3.8. Оценка информативности геологических признаков
При решении задач распознавания образов часто возникает проблема сокращения размерности признакового пространства пу тем исключения наименее информативных признаков. Сокращение
числа признаков не только упрощает используемые алгоритмы рас познавания, но и способствует улучшению качества классификации объектов, удаляя случайные помехи («шумы»), искажающие и за тушевывающие полезную информацию. Оценка информативности признаков полезна, поскольку она способствует выявлению рудо формирующих факторов и их ранжированию по степени значи мости.
Строгих математических методов оценок оптимальных мер от носительной информативности признаков пока что не разработано. С этой целью в геологической практике используются различные эвристические, детерминистские и статистические подходы, обес печивающие формирование признакового пространства меньшей размерности по отношению к исходному. Формирование простран ства меньшей размерности достигается либо путем отбора из т ис ходных признаков некоторого (меньшего) числа наиболее информа тивных признаков, либо конструированием новой системы призна ков с определенными свойствами, либо одновременно двумя этими методами. Сложность решения этой задачи связана с тем, что оцен ка индивидуальной информативности любого признака в отдельно сти от других признаков часто не обеспечивает достоверных ре зультатов вследствие наличия статистических связей между ними. Даже относительно независимые признаки, весьма информативные по результатам индивидуальных оценок, могут обеспечить в сово купности с другими признаками лишь весьма незначительную до полнительную информацию, и наоборот, относительно малоинфор мативные признаки могут значительно увеличивать суммарную ин формативность системы признаков.
К числу эвристических методов оценки информативности и ранжирования признаков относятся сбор и обработка сведений об изучаемых объектах, получаемых в результате опроса экспер- тов-специалистов. Поскольку мнения специалистов об информа тивности конкретных признаков, как правило, расходятся, резуль таты опроса подвергаются систематизации и математической об работке методами ранговой корреляции или дифференциального ранжирования. Использование информации, обобщающей коллек тивный опыт специалистов, повышает достоверность исходных данных.
Детерминистские и статистические методы оценки информа тивности признаков основаны на их ранжировании по данным вы борки обучения, то есть по фактическим данным, характеризующим изучаемые классы объектов. Ранжирование признаков по выборке обучения можно проводить в предположении о их статистической независимости либо о наличии взаимозависимости между ними.
При детерминированном подходе информативность независи мого признака определяется тем, насколько сильно отличаются его значения в разных распознаваемых классах. Так, например, при ис пользовании алгоритмов «Тупиковые тесты» информационный вес признака г определяется числом Rr = Мг/ М (где М - общее число всех тупиковых тестов, Мг - число тех тупиковых тестов, в которые входит столбец с номером г).
Статистический подход к оценке информативности независи мых признаков опирается на разность или отношение вероятностей признака в разных классах. Так, например, информативность при знака оценивается по нормированной разности средних его арифме тических значений в выборках обоих классов: J ~{ххх2) 2 / S 2, где S1 - средневзвешенное стандартное отклонение по обеим выборкам.
Для целей ранжирования условно независимых признаков по их информативности могут быть использованы и оценки парных коэффициентов корреляции их значений в выборках обоих классов.
В практических задачах при ограниченном числе признаков требуется оценка информативности не каждого признака, а их соче таний. Для сочетаний независимых признаков их информативность может быть определена суммированием информативностей отдель ных признаков, выраженных в долях единицы. Однако при решении большинства геологических задач условие взаимозависимости при знаков не соблюдается, вследствие чего такой способ неправомерен.
Для оценок информативности и ранжирования взаимозависи мых признаков разработаны специфические методы выделения их наиболее информативных сочетаний, однако многие из них мало эффективны из-за необходимости перебора огромного числа ком бинаций. В практике решения задач по распознаванию образов для оценок информативности признаков и их ранжирования использу ются методы дискриминантного анализа и метод главных компо нент.