Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция 1- простр. анализ.doc
Скачиваний:
175
Добавлен:
26.03.2016
Размер:
2.86 Mб
Скачать

Подходы к анализу пространственно распределенных данных

Существует несколько подходов к анализу пространственно распределенных данных, которые можно условно разделить на 4 группы:

  1. Детерминистические методы (интерполяторы).

  2. Геостатистика – модели, базирующие на статистической интерпретации данных.

  3. Алгоритмы искусственного интеллекта (искусственные нейронные сети, генетические алгоритмы).

  4. Модели, базирующиеся на статистической теории обучения.

Такое деление является крайне условным. Так, геостатистические модели можно изложить в детерминистической формулировке и наоборот, ряд детерминистических моделей имеют близкие статистические аналоги.

При использовании детерминистических методов предполагается, что анализируемые данные описываются некоторой детерминистической функцией V(x), определенной на исследуемой области (S), где – координата точки. Задача состоит в том, чтобы, базируясь на известных данных (Vi=V(xi) – значения измеренные в точках ) и на другой информации об исследуемом явлении, построить функциюV(x) для всей исследуемой области S. После этого значение в любой точке исследуемой области может быть просто вычислено по формуле. Для двумерного случая такую функцию можно представить как поверхность Z=f(x,y), рис.6.

Рисунок 6 – Построение поверхности

1.4. Детерминистские методы интерполяции

Детерминистские методы для интерполяции используют математические функции (зависимости) и строят поверхность по опорным точкам, основываясь либо на степени схожести то­чек выборки (как например, метод взвешенных расстояний), либо на степени сглаживания (как например, радиальные базисные функции).

Детерминистские методы интерполяции могут быть разделены на две группы: глобальные и локальные.

Глобальные методы вычисляют искомые значения с использованием всего набора данных.

Локальные методы используют для вы­числения искомых значений только опорные точки, расположенные в окрест­ностях искомой, и относятся только к небольшим участках изучаемой терри­тории.

Построение непрерывной поверхности для представления опре­деленных измерений - одно из ключевых требований, предъявля­емых к большинству ГИС-приложений.

Возможно, наиболее час­то используемый тип поверхности - это цифровая модель релье­фа или распределение климатических характеристик. Такие наборы данных в мелком масштабе есть в готовом виде для различных территорий мира.

Однако, как уже говорилось, любое измеренное значение в точке ландшафта, земной коры или атмосферы может быть использовано для построения непрерыв­ной поверхности.

Главная проблема, с которой сталкиваются спе­циалисты, занимающиеся моделированием в ГИС, - построение наиболее точной из возможных поверхностей на основе существу­ющих опорных точек, наряду с оценкой ошибки интерполяции и отклонений в значениях проинтерполированной поверхности.

Вновь построенные поверхности впоследствии используются в ГИС-моделировании и анализе, наряду с их трехмерной визуали­зацией. Понимание качества этих данных может значительно улуч­шить эффективность и направленность ГИС-моделирования. Эта роль и отводится модулю Geostatistical Analyst.

Анализ свойств поверхности в окрестностях опорной точки

В целом, объекты, расположенные ближе друг к другу, как пра­вило, более похожи между собой, чем удаленные друг от друга объекты. Это один из основных принципов географии (ТоЫег, 1970).

Представьте себе, что вы занимаетесь планированием в городе, и перед вами стоит задача разбить в своем городе живо­писный парк. У вас есть несколько предполагаемых мест, и вам необходимо смоделировать обзор для каждой проектируемой точ­ки.

Для этого вам необходим подробный набор данных с высотами поверхности на изучаемую территорию. Предположим, что у вас уже есть данные о высотах для 1000 точек, расположенных по всему городу. Эти данные вы можете использовать для построе­ния новой поверхности высот.

При построении поверхности высот, вы можете предположить, что значения высот в точках, для которых выполняется интерпо­ляция, и значения в опорных точках, расположенных к ним бли­же всего, будут похожи. Но возникает вопрос: сколько опорных точек следует рассматривать? И следует ли значения во всех опор­ных точках учитывать одинаково?

По мере того, как вы удаляетесь от искомой точки, влияние опор­ных точек будет уменьшаться. Учет в вычислениях точки, уда­ленной на значительное расстояние от опорной, может быть оши­бочным, поскольку точка может находиться на участке местнос­ти, кардинальным образом отличающимся от того, на котором расположена искомая точка.

Рисунок 7 – Схема места для строительства

Одно из решений - учитывать достаточное количество точек, об­разующих небольшую, но репрезентативную выборку. Число то­чек будет варьировать в зависимости от общего количества опор­ных точек и их расположения в пространстве, а также от харак­тера поверхности.

Если выборки с высотами относительно равно мерно распределены, и характеристики поверхности не меняют­ся в различных частях ландшафта, вы можете с достаточной точ­ностью интерполировать значения поверхности на основе значе­ний в близлежащих точках.

Чтобы учесть различную удаленность точек от искомой точки, значениям опорных точек, расположен­ных ближе к ней, присваивается больший вес.

Это основа метода интерполяции, известного как Метод (обрат­ных) взвешенных расстояний - Inverse Distance Weighting (IDW). Как следует из названия, вес значения уменьшается по мере уве­личения расстояния от искомой точки. Рассмотрим позже.