Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Малинин_1.doc
Скачиваний:
10
Добавлен:
06.11.2018
Размер:
152.58 Кб
Скачать

1.5. Основные этапы статистического анализа эмпирической информации

Слово «информация» в переводе с латинского означает осведом­ление и доведение сведений о чем-либо. Очевидно, в общем случае под информацией следует понимать любые сведения (в количественной и качественной форме) об исследуемом объекте. Естественно, что со статистической точки зрения наибольший интерес вызывает количественная информация, частным случаем которой является гидрометеорологическая информация. Объектом гидрометеорологической информации служит, как известно, природная среда.

Всю совокупность информации целесообразно разделить на первичную и вторичную. Первичная информация – это результат непосредственного измерения метеорологических, гидрологических, океанологических и иных параметров со стационарной сети станций, постов, полученных во время экспедиций, натурных экспериментов, а также с помощью наземных, самолетных, спутниковых измерительных комплексов и т.д.

Вторичная информация уже представляет результаты расчетов, выполненных на основе первичной информации. Так, например, данные по испарению могут представлять собой первичную информацию, если оно измерено с помощью малоинерционной аппаратуры, или вторичную информацию, если испарение рассчитывается тем или иным методом. Отметим, что основной в этом случае является вторичная информация по испарению.

Логическая схема статистического анализа эмпирических данных какого-либо процесса или явления может быть представлена в виде следующих основных этапов (рис. 1.5):

Этап 1: постановка задачи. Сюда входит формулирование основных целей предполагаемого исследования и возможных результатов, которые могут быть получены с его помощью. Естественно, что в каждом конкретном случае формулирование целей носит произвольный характер и осуществляется на содержательном (физическом) уровне. При этом правильное физическое представление изучаемого процесса или явления является тем «базисом», на который затем ставится «надстройка», представляющая собой совокупность статистических методов. Следовательно, важной составной частью постановки задачи должен служить предварительный физический анализ исследуемого реального процесса или явления, отображением которого выступает система исходных наблюдений (измерений). После этого осуществляется формализованная постановка задачи, включающая по возможности вероятностную модель или совокупность статистических методов, которые могут быть применены к анализу изучаемой системы данных. Кроме того, в случае необходимости выполняется оценка общего времени и трудозатрат на выполнение исследования.

Этап 2: информационный. В том случае, если задача поставлена таким образом, что реальные экспериментальные данные для ее решения отсутствуют, то необходимым условием данного этапа становится предварительное составление плана сбора исходной статистической информации. При этом желательно учитывать полную схему дальнейшего статистического анализа с тем, чтобы не возникали ситуации, когда становится очевидной невозможность проведения расчетов из-за отсутствия необходимых для этого данных. Если экспериментальные данные имеются в необходимом объеме, но только в табличном виде, то возникает задача их занесения на машинные носители, т.е. создание компьютерных архивов данных. Хотя эта задача носит технический характер, тем не менее следует предварительно составить такую схему занесения данных в ЭВМ, чтобы в последующем их было удобно обрабатывать.

Этап 3: первичный анализ. В ходе первичной статистической обработки исходной информации обычно решаются следующие конкретные задачи:

- унификация типа переменных, т.е. перевод их в единую однородную систему;

- расчет и анализ первичных статистик;

- анализ резко выделяющихся наблюдений (выбросов);

- восстановление пропущенных наблюдений;

- проверка статистической независимости наблюдений, составляющих массив исходных данных;

- проверка свойств внутренней структуры временного ряда с помощью статистических гипотез;

- экспериментальный анализ закона распределения исходной совокупности и его параметризация.

Отметим, что задача унификации типа переменных возникает при автоматизированном анализе многомерного случайного процесса, когда одновременно могут встречаться переменные всех трех типов: количественные, ординальные и номинальные. В этом случае используются два альтернативных подхода. Первый связан с «оцифровкой» (шкалированием) неколичественных переменных, когда исследователь, руководствуясь дополнительными соображениями и допущениями, пытается преобразовать качественные данные в количественные. При другом подходе все наблюдения многомерной случайной величины смешанной природы делятся на определенное число градаций (интервалов, классов и т.п.), внутри которых все данные заменяются на нули или единицы. Естественно, при переходе от индивидуальных к сгруппированным значениям происходит потеря информативности исходных данных, но это неизбежная плата за подобные преобразования.

Этап 4: построение эмпирических зависимостей. К данному этапу относятся следующие конкретные задачи:

- определение вида связи между переменными;

- корреляционный анализ;

- построение и анализ линейной регрессии двух переменных;

- построение и анализ одномерной полиномиальной регрессии;

- подбор нелинейной эмпирической формулы;

- построение и анализ двухмерной полиномиальной регрессии;

- построение и анализ множественной линейной регрессии.

Этап 5: анализ временных рядов. При проведении временного анализа решаются

следующие конкретные задачи:

- проверка стационарности временного ряда;

- построение и анализ трендов;

- гармонический анализ;

- автокорреляционный анализ;

- взаимнокорреляционный анализ;

- спектральный анализ;

- фильтрация временных рядов.

Этап 6: анализ пространственных полей. Данный этап включает в себя:

- определение числовых характеристик полей;

- оценка однородности и изотропности случайного поля;

- анализ статистической структуры полей;

- построение и анализ карт;

- объективный анализ случайных полей.

Сразу же отметим, что для этапов 3 - 6 перечислены в основном лишь те задачи, которые непосредственно рассмотрены в данном пособии. Безусловно, список их может быть существенно расширен. Следует также иметь в виду, что разделение на этапы во многом является условным. Прежде всего оно не означает, что эти этапы осуществляются в строгой хронологической последовательности один за другим. Некоторые из них могут быть объединены вместе, другие, исходя из специфики исходного материала, вообще пропущены. Кроме того, ряд этапов (например, 3, 4, 5 и 6 этапы) находится в соотношении итерационного взаимодействия: результаты более поздних этапов могут содержать выводы о необходимости повторения предыдущих этапов (см. рис. 1.4).

Этап 7: интерпретация результатов и подведение итогов исследования. Очевидно, это самый неформальный этап. Получение содержательных выводов – главный итог выполненного исследования. Однако прежде делается формальный статистический отчет, представляющий собой выводы из применения статистических процедур, результаты которых даются в виде таблиц, графиков, формул и т.п. Именно это и служит основой для формулирования содержательных выводов.

Отметим, что анализ получаемых результатов должен осуществляться не только в конце исследования, но и после каждого этапа, причем в зависимости от этого они могут подвергаться ревизии (пересмотру). Например, один статистический метод заменен другим, выдвигается новая вероятностная модель и т.д.

В заключение проверяется, в какой степени достигнуты намеченные на первом этапе исследования цели и если не все они достигнуты, то объясняется, с чем это связано.