Статья опубликована в рамках: XXXII Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 26 мая 2015 г.)
Наука: Технические науки
Секция: Моделирование
Скачать книгу(-и): Сборник статей конференции
- Условия публикаций
- Все статьи конференции
дипломов
ВОЗМОЖНОСТИ И ИНСТРУМЕНТЫ МОДУЛЯ GEOSTATISTICAL ANALYST
Кынашев Санжар Кадырович
магистрант ГУ им. Шакарима, Республика Казахстан, г. Семей
E-mail: kynashev89@gmail.com
Баранов Сергей Александрович
научный руководитель, канд. биол. наук, кафедра «Технической физики и теплоэнергетики» ГУ им. Шакарима, Республика Казахстан, г. Семей
Geostatistical Analyst представляет собой гибкое программное средство, предоставляющее любому пользователю, имеющему пространственно распределенные данные, широкие возможности исследования и анализа этих данных с использованием статистических инструментов и методов интерполяции оптимальных поверхностей. К некоторым из сфер эффективного применения модуля Geostatistical Analyst можно отнести такие как охрана окружающей среды, сельское хозяйство, георазведка (зондирование), геология, метеорология, гидрология, археология, лесное хозяйство, здравоохранение, горное дело, операции с недвижимостью и многие другие.
1. Представление данных и исследование данных
Для визуализации данных имеется достаточно много инструментов, предоставляющих большой объем информации еще до построения самой поверхности, она также позволяет получить полезную информацию. Представление данных является очень важным этапом для оценки репрезентативности данных и идентификации внешних факторов, которые могут оказывать первостепенное значение распределение данных.
Инструменты исследовательского анализа (ESDA) предназначены специально для исследования пространственных данных, такими средствами являются: визуализация распределения данных, выявление трендов данных, показ глобальных и локальных выбросов, определение пространственной автокорреляции, осмысление ковариаций (взаимной изменчивости) между несколькими наборами данных. ESDA представляет собой мощный набор исследовательских инструментов для выбора оптимального метода интерполяции для данных. Виды в ESDA выборочно интерактивны с ArcMap. Данные, выбранные или подсвеченные с помощью этих инструментов, будут также выбраны или подсвечены в окне отображения ArcMap. Это предоставляет пользователю уникальную возможность визуально взаимодействовать с данными для лучшего понимания взаимоотношений, представленных в разных вариантах отображения данных.
2. Подбор модели, построение поверхности
После тщательного исследования данных на предмет наличия аномалий, таких как глобальные и локальные выбросы и тренды в данных. Geostatistical Analyst предлагает применить Мастер, значительно облегчающий проведение процесса интерполяции. В нем имеется широкий выбор методов интерполяции для построения поверхностей.
Предлагаемые интерполяционные методы можно разделить на две основные группы, детерминированные и геостатистические. Первые используются для построения поверхностей по точечным измерениям, проведенным на основе области распространения сходства или степени сглаженности. Методы геостатистической интерполяции основаны на статистических проверках и используются для более продвинутого моделирования прогнозных поверхностей с учетом оценки достоверности или неопределенности прогнозов.
В зависимости от выбранного метода, могут быть созданы следующие виды выходных поверхностей: прогнозная, прогноза стандартной ошибки (неопределенности), квантильная, вероятностная, а также поверхность стандартной ошибки индикаторов. Geostatistical Analyst предоставляет пользователю возможность полного контроля за предлагаемыми параметрами соответствующих моделей и надежностью установок по умолчанию.
2.1 Детерминированные методы
Методы детерминированной интерполяции используются для построения поверхностей по точечным измерениям на основе области распространения сходства или степени сглаженности.
· Обратные взвешенные расстояния
· Глобальные полиномы
· Локальные полиномы
· Радиальные функции
Методы детерминированной интерполяции можно разделить на две группы: глобальные н локальные. Глобальные методы дают прогнозную оценку с использованием всего набора данных. Локальные методы дают прогнозную оценку по точкам измерений, расположенным в заданных областях (окрестностях) — локальных зонах в пределах более обширной области исследования. Geostatistical Analyst предлагает глобальные полиномы в качестве общего (глобального) интерполятора н IDW, локальные полиномы, и радиальные функции в качестве локальных интерполяторов.
Интерполяция может привести к тому, что результирующая поверхность будет либо проходить через измеренные значения данных (исследуемой переменной), либо не будет. Метод интерполяции, дающий прогнозные значения, идентичные измеренным в соответствующих точках, называется точным (полным, строгим) интерполятором. Неточный (нестрогий) интерполятор дает прогнозное значение в точке измерений, которое отличается от реально измеренного значения, который можно использовать, с целью избавиться от резких пиков или впадин в выходной поверхности. Методы IDW н основанные на радиальных функциях являются строгими интерполяторами, а методы, основанные на глобальных или локальных полиномиальных зависимостях — нестрогими. Типичными областями применения детерминированного метода может быть анализ местоположения недвижимости с целью прогноза интенсивности ее продаж в зависимости от близости домов и земельных участков к месту, где живет покупатель. Применение весовых показателей, используемых в методе IDW, позволяет дать эффективный прогноз оптимального расположения торговых точек.
2.2 Геостатистические методы
Методы геостатистической интерполяции основаны на статистических расчетах, они используются для более продвинутого прогноза н моделирования поверхности, включающего оценку ошибок или неопределенности полученного прогноза.
Предлагаются следующие варианты.
Кригинг и Кокригинг
· Обычный (Ordinary)
· Простой
· Универсальный
· Индикаторный
· Вероятностный
· Дизъюнктивный (альтернативный)
Выходные поверхности
· Прогноз или прогноз стандартной ошибки
· Квантильная
· Вероятностная и стандартная ошибки индикаторов
Геостатистические методы создают поверхности на основе статистических свойств данных измерений. Поскольку геостатистические прогнозы основаны на статистике, эти методы создают не только прогнозные поверхности, но также поверхности ошибки (достоверности) и неопределенности, являющиеся индикаторами качества прогноза. Кригинг позволяет решать два вида задач: количественная оценка пространственной структуры данных н прогнозирование. Первая задача, также называемая вариографией, заключается в подборе модели пространственной зависимости для описания данных. Для прогноза неизвестного значения исследуемой переменной в заданном местоположении кригинг будет использовать подходящую модель из вариографии, конфигурацию пространственных данных н значения, измеренные в точках опробования вокруг местоположения, для которого выдается прогноз. Geostatistical Analyst предоставляет много инструментов, помогающих определить, какие параметры использовать, и предлагает установки по умолчанию, обеспечивающие быстрое построение поверхности. С геостатистикой ассоциируется многие методы, но все они относятся к семейству кригинговых. Geostatistical Analyst предоставляет обычный, простой, универсальный, вероятностный н дизъюнктивный кригинг. а также множественные версии кокригинга.
Кригинг представляет собой достаточно быстрый интерполятор, который может быть как строгим, так и нестрогим (сглаженным) в зависимости от используемой модели ошибок измерений. Это очень гибкий метод, и он позволяет пользователям исследовать графики пространственной автокорреляции. Кригинг использует статистические модели, обеспечивающие на выходе такие картографические представления как прогнозные поверхности, прогнозы стандартных ошибок, стандартную ошибку индикаторов н вероятностную поверхность. Гибкость метода кригинга может обусловить необходимость принятия многих предварительных решений. Кригинг подразумевает, что входные данные подчиняются требованиям стационарного стохастического процесса. Стохастический процесс является совокупностью случайных переменных значений, распределенных в пространстве и или во времени подобно измерениям высоты поверхности. Ряд методов, таких как обычный, простой н универсальный кригинг подразумевает нормальное распределение данных.
Кокригинг является множественным (многомерным) эквивалентом кригинга. Вследствие использования нескольких наборов данных он является исключительно гибким методом интерполяции, предоставляющим пользователям возможность исследования графиков взаимной корреляции и автокорреляции. С гибкостью кокригинга связана высокая потребность в принятии предварительных решений по всем аспектам его применения. В кокригинге могут использоваться как вариограммы, так и ковариации. В нем могут применяться преобразования (трансформации) и удаляться тренды, он допускает наличие ошибок измерений в тех же случаях, что и в разных методах кригинга.
В Geostatistical Analyst доступны четыре типа интерполяционных поверхностей: прогноза, квантилей, вероятности превышения пороговых значений н ошибки прогноза. Они позволяют анализировать данные разными способами, с разных позиций.
· Прогнозная карта: Строится по интерполируемым значениям свободной переменной в местоположениях, по которым отсутствуют данные измерений.
· Карта ошибок прогноза: Строится по значениям стандартных ошибок интерполируемых значений или стандартной ошибке интерполированных значений индикатора с целью отображения неопределенности прогноза.
· Карта квантилей: Строится, когда пользователь задает вероятность и хочет получить карту прогнозных значений, превышающих (не превышающих) измеренные значения на заданной значений вероятности.
· Карта вероятности: Строится, когда пользователь задает пороговую величину и хочет получить карту вероятности того, что значения превысят (не превысят) заданную предельную величину.
3. Аналитические инструменты для построения поверхностей
Мастер в Geostatistical Analyst содержит аналитические инструменты, помогающие определить значение параметров используемых при построении поверхностей каждого из перечисленных выше типов. Часть предлагаемых диалоговых окон применима практически ко всем методам интерполяции, к ним, например, относятся диалоги задания окрестности поиска, перекрестной (взаимной) проверки достоверности и проверка достоверности. Другие, такие как моделирование вариограмм, трансформации, детрендинг, декластеринг и проверка соответствия нормальному распределению, относятся к геостатистическим методам (кригинг и кокригинг).
Функции вариограмм и ковариации помогают определить степень статистической корреляции в зависимости от расстояния. Geostatistical Analyst предлагает пользователю средство предварительного просмотра вариограммы ковариационной зависимости. Это облегчает и повышает эффективность процедуры подбора параметров модели, включая анизотропию и моделирование ошибок измерений. Вариограмма показывает статистическую корреляцию между соседними точками измерений. При росте расстояния, вероятность взаимосвязи между значениями в точках измерений уменьшается. Это значит, что дисперсия значений возрастает с ростом расстояния между точками измерений, то есть вариограмму можно рассматривать в качестве функции, представляющей несходство данных.
Взаимная (перекрестная) ковариация представляет статистическую тенденцию (тренд) переменных разного типа изменяться в зависимости от взаимосвязей друг с другом. Положительная взаимная ковариация возникает, когда обе переменные имеют общую тенденцию быть больше их среднего значения, а отрицательная взаимная ковариация — в случае, когда одна из переменных стремится быть больше своего среднего, а другие — меньше их среднего значения. Моделирование на основе взаимной ковариации используется для определения локальных характеристик пространственной корреляции между двумя наборами данных и для поиска локальных сдвигов во взаимной корреляции между двумя наборами данных.
Иногда бывает полезным удалить (вычесть) поверхностный тренд из данных и применить методы кригинга или кокригинга к этим бес трендовым (оставшимся) данным. Например, если в наборе данных по содержанию озона в атмосфере отмечается подавляющее направленное влияние восточных ветров, может понадобиться удалить этот тренд, чтобы лучше понять фактические уровни содержания озона над данной территорией. Детрендинг разделяет данные на два компонента, компонент детерминированного тренда и компонент случайной автокорреляции. После удаления тренда вы сможете применить метод кригинга к оставшимся данным. А перед тем, как сделать окончательный прогноз, выделенный тренд может быть добавлен к результирующей поверхности.
По мере удаления точек с данными измерений от местоположения, где значение переменной неизвестно, они становятся все менее полезными для целей прогнозирования. На некотором расстоянии пропадает корреляция между значениями в этих точках и точке, по которой делается прогноз, и весьма вероятно, что точки измерений даже находятся в области, значительной отличающейся от той, где находится точка с неизвестным значением. Поэтому, обычной практикой является задание области поиска, которая ограничивает количество и конфигурацию расположения точек, используемых в прогнозе. Для ограничения числа используемых точек существует два механизма: задание формы области соседства (окрестности) и задание ограничений для точек в пределах и вне этой формы.
4. Диагностирование
После построения прогнозной поверхности полезно проверить, является ли данная модель оптимальной для анализируемого набора данных. Geostatistical Analyst предлагает инструменты взаимной проверки (cross-validation) и проверки (validation) достоверности, обеспечивающие аналитическую оценку созданной поверхности. Эти инструменты позволяют количественно оценить «точность» модели. Вы можете либо принять модель с данными параметрами, либо изменить параметры модели и попытаться построить более подходящую поверхность.
Взаимная проверка и проверка достоверности основаны на следующей идее — изъять одно или несколько точечных измерений и затем спрогнозировать связанные с ними данные, используя данные измерений в оставшихся точках опробования. Взаимная проверка достоверности использует все данные для оценки тренда и моделей автокорреляции. Затем удаляется каждое из точечных измерений, по одному за раз, и рассчитывается связанное с ним значение исследуемой переменной. Для всех точек взаимная проверка достоверности проводит сравнение измеренных н прогнозных значений.
Geostatistical Analyst обеспечивает построение ряда графиков и сводок сравнения измеренных н прогнозных значений.
Прогнозный график (Predicted) показан, синей линией, проходящей через поле точек, уравнение которой приведено в нижней части графика. График ошибки (Error) отличается от прогнозного графика тем, что он проводится по данным, полученным вычитанием истинных значений из прогнозных значений. Для графика стандартной ошибки (Standard Error) истинные значения вычитаются из прогнозных графиков и делятся на оцененные методом кригинга стандартные ошибки. Все эти три графика помогают понять, насколько хорош прогноз на основе кригинга.
Диалоговое окно Сравнение (Comparison) используется в методе взаимной проверки достоверности и помогает проанализировать статистические выкладки вместе с каждым из графиков. Как правило, наилучшей является модель со стандартизованным средним близким к нулю, наименьшей среднеквадратической ошибкой прогноза, средней стандартной ошибкой, наиболее близкой к среднеквадратической ошибке прогноза, и наиболее близкой к единице стандартизованной среднеквадратической ошибкой прогноза. С помощью диалогового окна Сравнение вы можете провести совместное изучение статистик и графиков по разным моделям.
Список литературы:
- ArcGIS 9 Geostatistical Analyst Руководство пользователя. Издательство: Dataplus 2006, — 278 с.
дипломов
Оставить комментарий