WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     ||
|

а) оперативный каталог землетрясений, генерируемый в США (NEIC, National Earthquake Information Center, http://neic.usgs.gov ); данный каталог, несмотря на свое название, охватывает весь земной шар и дает информацию с задержкой не более 2 часов;

б) зеркальная копия оперативного каталога землетрясений в Обнинске, расположенная в ГЦ РАН (Мировой Центр Данных по физике твердой Земли); этот каталог ценен в первую очередь тем, что дает значительно более полную информацию по территории России, чем каталог NEIC.

И, наконец, последний, четвертый подход предлагается для доступа к геоданным стандарта WMS (OpenGIS консорциум). Хотя данные такого типа значительно менее ценны для аналитической обработки, чем указанные выше, поскольку представляют собой просто растровые изображения, тем не менее, их использование может быть весьма полезно при визуальном анализе. К счастью, стандарт WMS полностью описывает протокол доступа к данным, так что в этом случае параметризационный диалог полностью строится на основе XSLT преобразования результатов запроса GetCapabilities к соответствующему серверу.

Введенные пользователем параметры затем используются для построения точного запроса к WMS серверу. Сейчас в распределенной системе доступны следующие WMS данные:

а) глобальная карта залежей полезных ископаемых, включая карту геологических регионов (World Mineral Deposits Map, Канада, http://nlwis-snite1.agr.gc.ca );

б) карта разломов Земли, World Stress Map, карта ночных огней Земли (ГЦ РАН, Мировой Центр Данных по физике твердой Земли, http://grid.wdcb.ru );

в) геодинамический глобус, карта крупных и сверхкрупных месторождений, геологическая и геодинамические карты России (ГГМ РАН, http://earth.jscc.ru ).

На основе проведенного анализа мировых хранилищ геоданных и оценки созданных методов предоставления геоданных в распределенной информационно-аналитической системе делаются следующие выводы:

а) созданное универсальное хранилище геоданных может быть использовано, как базовая картографическая основа в географических, геофизических, геологических исследованиях;

б) разработанные методы преобразования геоданных достаточно универсальны, что позволяет значительно расширить состав типов и форматов ресурсов, доступных в распределенной информационно-аналитической системе.

Глава 5. Исследование и разработка архитектуры распределенной информационноаналитической системы и методов интеграции и анализа данных В предыдущих главах были рассмотрены все основные составляющие компоненты распределенной информационно-аналитической системы. Настоящая глава посвящена созданию ее общей архитектуры и методов интеграции и анализа данных.

В общем виде архитектура представлена на рисунке 5.1:

Коммерческие WMS Серверы Расчетные серверы серверы геоданных серверы геоданных системы (ГРИД) Узел (портал) системы Узел (портал) системы СПД СПД База База метаданных метаданных...

ИПС ИПС Интеграция метаданных и геоданных Преобразование геоданных ГИС Персональные клиенты метаданные и проекты Пользователь Персональные геоданные Рис. 5.1 Общая архитектура распределенной информационно-аналитической системы Реализованная архитектура системы является четырехзвенной:

а) звено реальных геоданных или расчетных алгоритмов;

б) звено узлов (порталов) системы с собственными ИПС и базами метаданных;

в) звено интеграции метаданных и собственно геоданных;

г) звено клиента.

Кроме этого, существует еще нетривиальная связь между пользователем и звеном интеграции, реализуемая ГИС-клиентами. В реальности, в зависимости от решаемой задачи, последняя связь может быть не задействована. Это происходит, например, в ситуации, когда пользователь решает конкретную вычислительно сложную задачу в ГРИД-системе без передачи результатов расчетов в ГИС. Важным обстоятельством является возможность интегрировать и персональные данные пользователя или приватные данные его организации без передачи их в сеть Интернет. Таким образом, появляется возможность создания закрытых корпоративных геоинформационных систем, например, для федеральных органов государственной власти, таких как МВД или Министерство обороны.

Физически, в настоящее время, звено интеграции данных, один из узлов системы и большая часть хранилища геоданных находится на сервере центрального портала системы, расположенном в ВИНИТИ РАН.

Звено реальных геоданных обеспечивается, как показано в первой и четвертой главах либо коммерческими серверами, либо WMS серверами, либо хранилищем геоданных на центральном портале или других узлах и, наконец, персональными или корпоративными данными пользователя. Особняком на данном уровне стоят расчетные алгоритмы. С точки зрения общей архитектуры они представляют собой специализированные серверы, которые, принимая на вход параметры и геоданные, выдают в качестве результата либо геоданные, либо иную цифровую информацию. В настоящий момент реализована такая схема взаимодействия с серверами этого типа, при которой результатом расчетов является либо данные примитивных типов, либо геоданные.

C точки зрения функциональности системы в целом, несмотря на очень сложную реализацию, звено узлов (порталов) является достаточно простым, поскольку его назначение ограничивается локальным поиском метаданных и передачей результатов поиска на следующее звено. В настоящее время в центральном узле (Центральный портал, ВИНИТИ РАН) созданной распределенной информационно-аналитической системы для загрузки и поиска данных используется ИПС и СПД, описанные в третьей главе. Именно этот узел обеспечивает полнофункциональный контекстный поиск, в то время, как узлы, использующие стандартные возможности реляционных СУБД, не обеспечивают этого.

Подробно рассматриваются различные уровни и методы интеграции геоданных для их последующей аналитической обработки.

Первым уровнем интеграции данных является наличие подсистемы централизованного или распределенного поиска. Подавляющее большинство реализованных в настоящее время распределенных геоинформационных систем этим и ограничивается, например такая сеть, как Geography Network, спонсируемая ESRI. Безусловно, учитывая специфику ГИС данных, все системы позволяют визуализировать найденную информацию с помощью простых клиентских программ (базирующихся, как правило на Javascript). Важным аспектом на первом уровне интеграции является система сбора данных – инициируемая самой системой или инициируемая пользователями системы. При этом в реально действующих системах не используются автоматизированные методы отбора метаданных (crawlers), поскольку это приводит к ее быстрому загрязнению. Далее приводится обоснование отказа от инициируемой пользователем схемы пополнения в созданной системе.

Второй уровень интеграции подразумевает наличие персонифицированных хранилищ данных. Количество действующих систем такого рода крайне мало и все они требуют жесткой процедуры регистрации – либо неавтоматизированной вообще (GEON), либо полуавтоматизированной со всевозможными ограничениями (Geography Network). Этот уровень интеграции позволяет пользователю вести внутри системы свою собственную библиотеку метаданных.

Третий уровень подразумевает объединение данных в проекты для последующей аналитической обработки. Автору не удалось найти в сети Интернет реально действующих систем такого рода, кроме GEON Network, которая при этом работает крайне нестабильно. На третьем уровне жизненно необходима жесткая типизация метаданных, поскольку именно она обеспечивает их корректное преобразование для включения в ГИС-проекты или иные аналитические расчеты.

Отдельно обсуждаются различные аспекты аутентификации пользователя в системе и безопасность системы. Наличие данных вопросов связано с наличием персонифицированного хранилища пользователя. В настоящий момент реализована встроенная в используемую на центральном портале CMS (Content Management System) система аутентификации. Данная система базируется на аутентификации в СУБД и, в принципе, является достаточно надежной, однако не подразумевает распределенности. В дальнейшем предполагается перевод аутентификации на схему LDAP, хотя это и усложнит реализацию отдельных серверов распределенной информационно-аналитической системы.

Показаны возможности системы для подготовки заданий по вычислительно трудоемким задачам анализа геоданных в ГРИД системах.

В настоящий момент реализованы две схемы взаимодействия созданной информационно-аналитической системы и ГРИД. Надо отметить, что в обоих случаях система взаимодействует с ГРИД не напрямую, а через своеобразных «брокеров». Задача системы сводится в данном случае к построению интерфейса «брокера» и фиксации задачи и ее состояния в персональном хранилище пользователя.

В первой схеме тип данных для вычислительной задачи жестко зафиксирован условиями самой задачи и, таким образом, данные должны либо вводится пользователем, либо присутствовать в системе. Безусловно, данная схема резко ограничивает возможности пользователя по использованию ГРИД. Тем не менее, с помощью данной схемы была решена задача по кластеризации массива геохимических анализов с Камчатки. На рисунке 5.приведена карта, полученная после обработки в ГРИД.

Рис. 5.2 Результаты кластерного анализа На рисунке отчетливо видны выделенные черным цветом аномальные зоны. Остальные данные массива выделены белым цветом.

Вторая схема доступа к ГРИД реализована значительно более гибко – сама задача теперь представляет собой такой же ресурс, как и все остальные, но обладает специфическим вторичным XML файлом. Таким образом, пользователь может производить с задачей базовые операции по интеграции данных, т.е. искать задачи и помещать их в свое персональное хранилище. Специфическое описание ГРИД-задачи представляет собой по сути адрес «брокера», который переправит ее в ГРИД и будет следить за ее состоянием и описывает входные и выходные параметры. По запросу пользователя система автоматически строит интерфейс для ввода данных либо из персонального хранилища (для картографических слоев, баз данных и т.п.), либо прямо (для примитивных типов данных).

Дальнейшая работа пользователя сводится к анализу состояния задачи, и получении результатов расчетов через гиперссылки. Состояние задачи также отражается в персональном хранилище.

Проведенный анализ созданной распределенной информационно-аналитической системы позволяет сделать следующие выводы:

а) реализованная четырехзвенная архитектура системы дает возможность полноценного поиска, интеграции и анализа геоданных через сеть Интернет без привлечения настольных аналитических ГИС-систем;

б) полноценное функционирование системы требует значительного развития используемых аналитических ГИС-клиентов в части их более глубокой интеграции в систему – использование проектов, генерируемых системой, прямой обмен геоданными с системой и т.п.;

в) система допускает легкое масштабирование и может быть значительно расширена, как в части добавления новых узлов (порталов), так и части расширения используемых геоданных;

г) для апробации системы необходимо привлечение ученых и специалистов в области наук о Земле с целью решения экспериментальных прикладных и фундаментальных задач.

Глава 6. Апробация распределенной информационно-аналитической системы на примерах поддержки решения различных геологических и геофизических задач.

Рассматриваются вопросы модернизации существующей клиентской аналитической ГИС ГеоПроцессор для возможности ее полноценного использования в созданной информационно-аналитической системе и поддержки решения прикладных и фундаментальных задач в области наук о Земле.

Безусловно, в классе апплетов, данная ГИС является одной из самых мощных в мире, поскольку позволяет не только визуализировать картографические данные, но и производить аналитические расчеты по этим данным. Громадным преимуществом данной ГИС является возможность интеграции распределенных картографических слоев и, в том числе, расположенных на локальном компьютере пользователя. К сожалению, изменения, обеспечивающие последнюю возможность были реализованы только в режиме апплета, в то время как все функции по сохранению результатов работы пользователя были реализованы только в режиме приложения. К середине 2006 года стало очевидно, что без внесения глубоких изменений в код ГеоПроцессора невозможно обеспечить многие функции распределенной системы в целом. Например, значительные трудности использования системы вызывались тем, что в режиме апплета было невозможно сохранить результаты аналитических расчетов любого рода.

Поэтому было принято решение о развитии ГИС ГеоПроцессор в следующих основных направлениях:

1) Создание в режиме апплета подсистемы сохранения результатов работы пользователя.

Несмотря на кажущуюся простоту данной части программы, здесь существует ряд проблем, связанных с распределенной схемой хранения геоданных и возможным удаленным хранением самого ГИС-проекта. Дополнительная сложность заключалась в необходимости сохранения информации, для которой в ГИС-проекте просто не было предусмотрено место.

В настоящее время структура проекта полностью переведена в XML формат. Причина здесь очевидна: картографический слой (параметр) обладает не только URI источника (значение), но и рядом других отличительных особенностей, которые никак не укладываются в позиционную классическую схему. Например, слой может обладать цветом, метаописанием, способом обработки, координатами, отличными от координат общего региона, своей картографической проекцией, своим датумом и т.п.

2) Создание полноценной схемы работы с векторной информацией, включая атрибутивную.

К началу работ в ГеоПроцессоре отсутствовала и сама атрибутивная информация и какие-либо методы работы с ней, хотя эти компоненты жизненно необходимы для работы с векторными данными. После того, как атрибутика была введена, потребовалось ввести полноценный аппарат для работы с ней. Так как атрибутивная информация слоя представляет собой таблицу, то было естественно использовать для этого методы, используемые в реляционных СУБД. Наиболее общим подходом в этой ситуации является применение языка SQL, а точнее его подмножества, описывающего синтаксис выражений. Фактически с помощью этих выражений можно производить почти любые преобразования атрибутов, их генерацию, отбор объектов и т.п.

Часть программы, занимающаяся разбором выражений SQL и их вычислением явилась наиболее сложной частью всех модификаций ГеоПроцессора. Она базируется на двух составных элементах – синтаксическом анализаторе и вычислителе псевдокода.

Синтаксический анализатор построен по схеме нисходящего анализа выражений подмножества языка SQL.

Pages:     ||
|



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.