Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистический анализ данных в геологии. Кн. 1

.pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
14.63 Mб
Скачать

Дж. С. Дэвис

СТАТИСТИЧЕСКИЙ

АНАЛИЗ ДАННЫХ

В ГЕОЛОГИИ

Перевод с английского доктора

физико-математических наук

В.Л. Голубевой

Под редакцией доктора геолого-минералогических наук

Д.А. Родионова

В ДВУХ КНИГАХ

КНИГА 1

МОСКВА ’’НЕДРА” 1990

STATISTICS AND DATA ANALYSIS

IN GEOLOGY

Second edition

John C. Davis

Kansas Geological Survey

John Wiley and Sons

New York • Chichester • Brisbane

Toronto • Singapore

ББК 26.3 Д 94

УДК 550.8.053:519

Рекомендовано к изданию кандидатом геолого-минералогических наук

Р. И. Коганом.

Дэвис Дж. С.

Д94 Статистический анализ данных в геологии: Пер. с англ. В 2 кн./Пер. В. А. Голубевой; Под ред. Д. А. Родионова, Кн. 1. — М.: Недра, 1990. — 319 с.: ил.

ISBN 5-247-02122-3

Изложены методы математической статистики и матричной алгеб­ ры, применяемые в современных геологических исследованиях. Рассмот­ рены известные критерии проверки статистических гипотез: о нормаль­ ном распределении, критерии Стьюдента, Фишера, Манна-Уитни и др.

Большое внимание

уделено непараметр ивеским методам статистическо­

го анализа данных.

Описаны процедуры анализа последовательностей

данных: интерполяция, ортогональная полиномиальная регрессия, зони­ рование, классификация, спектральный анализ, вариограммы, фильтра­ ция и тренд.

Для. геологов всех специальностей, занимающихся обработкой коли­ чественных и качественных результатов наблюдений.

„1804010000—288

 

 

^ 043(01)—90

35—90

ББК 26.3

ISBN 0-471-08079-9

1973, 1986 by John Wiley and Sons,

ISBN

5-247-02121-5

Inc. All rights reserved. Published

ISBN

5-247-02122-3

semultaneousiy in Canada

Перевод на русский язык В. А. Го­ лубевой, 1990

ПР Е Д И С Л О В И Е

В1973 г,, когда вышло первое издание этой книги, исполь­ зование геологами вычислительных средств находилось на ка­ чественно ином уровне, чем сейчас. Это было время массивных ЭВМ, сосредоточенных в вычислительных центрах, доступ к которым осуществлялся через окошко в закрытых дверях. При этом результат исследователь получал в лучшем случае через несколько дней.

Теперь большинство геологов имеют непосредственный дос­ туп к ЭВМ через терминал пли к мнни-компыотеру, или имеют

даже персональный компьютер. Компьютер стал обыденной вещью в жизни геолога. К нему обращаются как новички, так и профессионалы в надежде повысить эффективность своей ра­ боты.

К сожалению, легкий доступ к компьютерам не обеспечива­ ет легкого получения знаний о том, что с ним делать. Для многих геологов анализ поверхностей тренда так же мало по­ нятен, как и 10 лет назад. То же можно сказать п о фактор­ ном анализе. Более того, появились еще более экзотические и трудно доступные методы. Необходимость в обучении геологов количественному анализу была очевидна уже в 1973 г., то же верно п сейчас. Вот почему написана эта книга.

В ответ на многие замечания, которые я получил после издания книги в 1973 г., а также, учитывая собственный опыт преподавания, я внимательно пересмотрел книгу для нового из­ дания. Расположение материала сохранено, оно начинается с основных понятий и заканчивается анализом последовательно­ стей, карт, многомерных наблюдений. Так как большинство студентов слушает один или более курсов по ФОРТРАНу, то глава о ФОРТРАНе в этом издании отсутствует.

Изложение начинается с основ теории вероятностей, очень важных в анализе данных. Добавлен новый раздел о непара­ метрических методах, которые представляются более пригод­ ными для геологических данных. Тема «Собственные значения п собственные векторы» остается трудной для геологов, и по­ этому она затрагивается дважды: в разделе «Матричная ал­ гебра» и в разделах, посвященных факторному анализу. Рас­ смотрена также связь процедур нахождения собственных зна­

чений и собственных

векторов с методом главных

компонент,

R- и Q-методами факторного анализа, анализа соответствия.

Некоторые темы

анализа данных в последние

несколько

лет приобретали все большее нзачение в науках о Земле. Тео­ рия регионализованных переменных привлекается сейчас для объяснения пространственных свойств геологических перемен­ ных многими исследователями. Центральную роль в этой тео-

5

рии играют полувариограммы и крайгинг. Эти методы пред­ ставлены в настоящем издании. Геофизики поняли важную роль спектрального анализа; очевидна полезность этих мето­ дов при решении многих других задач, начиная от предсказа­ ния землетрясений и кончая описанием формы ископаемых ос­ татков. Раздел о рядах Фурье излагается с учетом этих изме­ нений.

Ряд таблиц и рисунков в этой книге воспроизведены с раз­ решения авторов (владельцев авторских прав). Источник для каждой таблицы и рисунка указан в квадратных скобках, а полная ссылка приводится в списках литературы к каждой главе. Таблицы 2.10, 2.22, 2.25 н 2.26 являются собственностью

издательства Джон Уайли и Сыновья

Inc.,

таблицы 2.11, 2.14

и 2.18 — собственностью Пингвин-Бук

Ltd,

а таблицы 4.30 и

4.31— Американского химического общества. Все они воспро­ изведены с соответствующих разрешений. Часть таблиц 5.6 — собственность Американской статистической ассоциации и дру­

гая часть — Американского института

биологических

наук;

комбинирование таблиц сделано с их

разрешения. Таблицы

5.7 и 5.9

представляют собственность

Академик

Пресс Inc

(Лондон)

Ltd

и воспроизведены

с их

разрешения.

Рис.

5.24 —

собственность

Американской

статистической

ассоциации,

а рис. 5.25 — собственность Харкурт Брсйс Иованович,

Inc, оба

рисунка воспроизведены с соответствующих разрешений.

В тексте, в ответ на многочисленные пожелания

читателей,

сделано много изменений, исправлений, добавлений. Перечис­ лять тех, кто написал мне, нет смысла, Я их благодарю. В до­ полнение к тем, кто был назван в первом издании, приношу

мою благодарность

доктору

Паулю

Брокинстону,

доктору

Джиму Кемпбеллу

и доктору

Кейту

Тернеру

за их

помощь.

Мон рецензенты, доктор Дейв

Бест,

профессор

Франк

Этридж

и профессор Джи-эн Фэнг, сделали

много ценных исправлений

в окончательном тексте.

 

 

 

 

 

Многочисленные добавления были сделаны коллегами из Канзасской геологической службы, включая доктора Дэйвида Коллинза и доктора Калина Фергюсона и моего помощника по

первому изданию мистера Роберта Сэмпсона. Трое из

моих

коллег приняли активное участие в написании книги:

доктор

Рикардо Олеа — раздел

по регионалпзованным переменным,

доктор Зоу Дн — раздел

о собственных значениях и

доктор

Джон Доветон, который любезно предложил многие из упраж­ нений и примеров во всей книге и который помогал мне на всех стадиях работы. Наконец, я особенно признателен моему ассистенту, исследователю и компаньону миссис Джо Эин Де-Греффенрайд, без поддержки которой выход этой книги ока­ зался бы невозможным,

Джон С. Дэвис

6

Глава 1 ВВЕДЕНИЕ

«...если Вы можете измерить то, о чем говорите, и результат выразить чис­ лом, ото означает, ш-: Вы кое-что знаете о предмете разговора; но если Вы не можете охарактеризовать этот предмет числом, то из этого следует, что Ваши знания скудны и неудов­ летворительны, и они могут быть только отправной точкой процесса по­ знания».

Лорд Кельвин

Еще на заре становления геологии некоторые геологи поль­ зовались математическими методами. Например, горные инже­ неры н геологи сотни лет назад подсчитывали запасы по ре­ зультатам опробования и оценивали содержание в руде полез­ ных компонентов. Фишер [2J отмечал, что расчленение третич­ ного периода Лайелем на основе относительной распространен­ ности современных организмов было статистической процеду­ рой. Литологи еще в начале этого столетия изучали размер зе­ рен и их очертания, которые представляли собой важные ис­ точники геологической информации. Такие науки о Земле, как геохимия, геофизика и гидрология, требуют прочного математи­ ческого фундамента, хотя используемые ими приемы первона­ чально были разработаны не на основе геологии. Точно так же минералоги и кристаллографы используют математический ап­ парат физической и аналитической химии.

Хотя эти разделы имеют важное значение в специализиро­ ванных областях, они не являются предметом рассмотрения этой книги. Начиная с конца 50-х годов нашего века вычисли­ тельные машины стали широко применяться в университетах и корпорациях, в результате чего геологи значительно чаще ста­ ли прибегать к математическим методам анализа данных, ко­ торые они заимствовали из различных, особенно технических, наук и применяли к любому разделу наук о Земле, это более общие методики, чем используемые обычно. Геология сама по себе привела к некоторым успехам в вычислительных науках, особенно в области построения графиков, включая карты и оконтуривание. Однако наша наука выгадала больше, чем по­ жертвовала в обмен на количественные методы.

7

Нефтяные компании США, ведущие большие геологоразве­ дочные работы (не считая правительственных учреждений), широко используют вычислительные машины. Поэтому огромный интерес, который проявляют эти организации к геоматематическим методам, закономерен. Он выражается также в уве­ личении роли языков программирования н математической под­ готовки при обучении геологов. К сожалению, не существует широко распространенных традиций использования математи­ ческого анализа в геологии; более того, формирование соответ­ ствующих программ обучения происходило только в некоторых институтах благодаря усилиям отдельных ученых. Всего лишь несколько школ преуспело в этом направлении настолько, что­ бы иметь право считаться пионерами в количественной геоло­ гии. Обучение у них основано на прочном фундаменте геоло­ гии, .математики и статистики.

Многих геологов вычислительная революция застала врасп­ лох: воспитанные в традициях, которые требуют получения ка­ чества за счет количества, они оказались плохо подготовлен­ ными математически и незнакомыми со статистикой. Но даже они быстро оценили потенциальные возможности аналитичес­ ких методов, которые вычислительная техника сделала легко доступными. Многие организации, как коммерческие, так и го­ сударственные, создали обширные библиотеки программ для

ЭВМ, предназначенных

для

реализации

геоматематнческих

процедур. Искушение использовать эти программы

слишком

сильно, даже несмотря

на то

что их основа

не может быть

ясно осознана.

персональных компьютеров

привело к

Широкое внедрение

усилению этих тенденций. В настоящее время небольшие ком­ пании, группы консультантов и даже отдельные исследователигеологи получили доступ к вычислительной технике, примене­ ние которой всего лишь несколько лет назад было привилегией больших корпораций и университетов. Многих геологов сейчас можно увидеть за собственным компьютером, даже тех, о ко­ торых нельзя было подумать, что они будут нуждаться в нем или просто иметь повод его использовать. Многим из этих геологов, если они умеют применять их в своей профессиональ­ ной работе, кажется, что работа с компьютерами обещает нм больше, чем оперирование словами и финансовые подсчеты.

Эта книга частично предназначена для того, чтобы помочь геологам, которые сознают, что математические методы могли бы быть им полезны в исследованиях, но недостаточно подго­ товлены к этому. Конечно, они могли бы прослушать формаль­ ный курс теории вероятностей, статистики, численного анализа и программирования с последующей работой под руководством опытного геоматематнка. Однако на практике бывает иначе, и большинство исследователей выбирают свой путь наилучшим

возможным для них способом: читая, спрашивая, учась на сво­ их ошибках. Путь, которым эти люди следуют, не является методически прогрессивным из-за того, что при этом в стороне остаются многие важные вопросы. Обычно они возвращаются назад, обращая внимание на те методы, которые, по их мне­ нию, наиболее применимы в их исследованиях, разработках, оперативной работе. Затем они чувствуют пробелы в подготов­ ке и пытаются приспособить для этих же целей технические приемы обработки данных. Это неудовлетворительный и даже опасный метод обучения, возможно сравнимый с обучением врача в процессе работы. Однако он является одним из путей, по которому приходится идти многим геологам. Эта книга мо­ жет помочь организовать процесс самообучения, а именно да­ ет возможность сделать первые шаги к познанию описанных в ней алгоритмов. Читателю придется освоить внешне менее эффективные темы, составляющие фундамент, на котором по­ строены, например, основы теории поверхностей тренда п фак­ торного анализа.

Эта книга предназначена также для студентов, изучающих статистику и программирование. Такие курсы все чаще стано­ вятся обязательными в американских и европейских универси­ тетах. К несчастью, они обычно читаются лицами, мало зна­ комыми с геологией и проблемами наук о Земле. Связь этих предметов с основной тематикой обучения студентов остается неясной. Это чувство осложняется отсутствием математичес­ ких приложений во многих геологических курсах. В то время как студенты нуждаются в специалисте, их учителя зачастую' являются людьми, получившими образование до бурного раз­ вития количественных методов и, следовательно, не подготов­ ленными в этом направлении. В настоящей книге читатель найдет не только общий курс вычислительных методов, нс также многочисленные примеры их применения в геологии.. Конечно, мы надеемся, что и студенты, и преподаватели най­ дут в этой книге что-либо интересное, и она будет способство­ вать распространению тех основ знаний, которые мы называем: геоматематикой.

ОБ ЭТОЙ КНИГЕ

Читатель вправе знать с самого начала, куда и по какому пути ведет его автор, а также что от него требуется, так как автор делает определенные предположения о подготовке, инте­ ресах и возможностях своей аудитории. Эта книга посвящена

количественным

методам анализа геологических

данных,,

а именно разделу наук о Земле, который

в настоящее время

называется геоматематикой. Ориентация

книги — методологи­

ческая, т. е. «как

надо делать». Теории уделяется мало

внима­

9

ния по нескольким причинам. Дело в том что многие геологи стремятся быть прагматиками и поэтому интересуются резуль­ татами больше, чем теорией, а большинство полезных про­ цедур все еще не имеет соответствующего теоретического обос­ нования. Теоретически достаточно разработанные методы час­ то основаны на сильных статистических ограничениях, которые обычно не выполнимы при исследовании геологических данных. Хотя в книге и обсуждаются элементарные аспекты теории ве­ роятностен и описывается большинство статистических крите­ риев, все же подробное изложение геостатистической теории предоставляется другим авторам.

В связи с тем что самые сложные аналитические процедуры можно представить как последовательность относительно про­ стых математических действий, уделим особое внимание опе­ рациям. Эти операции зачастую выражаются в терминах мат­ ричной алгебры, что в свою очередь приведет к рассмотрению этого предмета.

Первая категория охватывает все классы задач, для кото­ рых данные собираются непрерывно по времени или по линии. К ней относятся задачи анализа временных рядов, стратигра­ фических разрезов и интерпретации графиков. Вторая катего­ рия объединяет задачи, учитывающие географические коорди­ наты наблюдений: картирование, анализ поверхностей тренда, крайгинг и др. Наконец, третья категория имеет дело с анали­ зом групп (кластер-анализом), классификацией и исследовани­ ем внутренних связей внутри наборов данных, в которых поло­ жение пробы на карте или профиле не рассматривается. Зада­ чи изучения палеонтологических, геохимических данных часто относятся к этой категории.

Материал в книге изложен по принципу от простого к слож­ ному, причем каждая последующая тема строится на основе предыдущих. Так, вопросы множественной регрессии, излагае­ мые в гл. 6, основаны на результатах, полученных в гл. 5 (см. кн. 2) применительно к тренд-анализу, которым в свою очередь предшествует описание нелинейной регрессии (см. гл. 4). Ос­ новная используемая при этом математическая процедура опи­ сана в гл. 3 при изложении методов решения систем уравне­ ний, а статистические основы регрессионного анализа впервые рассматривались в гл. 2. Другие методы изложены по анало­ гичной схеме.

Первая тема, рассмотренная в этой книге, — элементарное введение в статистику, а последняя — факторный анализ. Между этими темами пропасть, преодоление которой требует несколь­ ких лет изучения соответствующих курсов. Ясно, что в одной книге мы не можем осуществить переход от первой темы к по­ следней, не опуская при этом значительного материала. В связи с этим мы пожертвовали основами статистической теории, дета­

10

лями математических операций, сохраняя только совершенно не­ обходимые, и всеми усовершенствованиями и уточнениями, кото­ рыми обычно сопровождаются основные статистические про­ цедуры. Сохранены фундаментальные алгоритмы, входящие в каждый вид анализа, рассмотрение соотношений между раз­ личными количественными методами и простые примеры их применения в решении задач.

Тексты программ не приводятся в этом издании*, так как ими снабжены многие библиотеки программ, предназначенных для любых ЭВМ, начиная с суперкомпьютеров и кончая на­ стольными микрокалькуляторами. Эти библиотеки содержат программы, значительно более совершенные и более гибкие, чем любая из программ, которую мы могли бы привести в этой книге. Однако, чтобы помочь читателю в овладении персональ­ ным компьютером, к английскому изданию книги приложена дискета, на которой записаны программы элементарной ста­ тистики н матричной алгебры. Дискета предназначена для персонального компьютера фирмы IBM-PC и совместима с ма­ шинами, использующими популярную операционную систему

.MS — DOS. Полная библиотека программ большинства про­ цедур, обсужденных в этой книге, также доступна для боль­ шинства персональных компьютеров; информация по этому поводу приведена в Приложении.

Мы считаем, что методы количественного анализа в геоло­ гии могут быть весьма полезными в исследовательской работе: гни дают не столько доказательства или подтверждения геоло­ гических гипотез, выработанных интуицией, сколько критичес­ кое исследование явления и проникновение в его сущность.. Сбор данных соответствующего качества и в достаточном ко­ личестве для целей численного анализа приводит к более пол­ ноценному изучению объекта, чем другие способы исследова­ ния. Несомненно, что палентолог, тщательно измеряющий сот­ ни образцов некоторого организма, может лучше оценить гра­ ницы естественного изменения измеряемых характеристик, чем: человек, который просто исследует их. Точность и объектив­ ность, требуемая количественной методологией, может отчасти компенсировать интуицию и опыт, которые вырабатываются годами работы. В то же время дисциплина, необходимая для выполнения количественных исследований, ускоряет творческий пост п наступление зрелости ученого.

Измерения и анализ данных могут привести к выводам, не> вполне понятным или очевидным при использовании других:

* В русском переводе этой книги мы сочли целесообразным привести пол­ ные тексты программ на языке ФОРТРАН, любезно предоставленные нам ав,- тором (Примеч. пер.).

Соседние файлы в папке книги