WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     |
|

На правах рукописи

Шогин Алексей Николаевич РАСПРЕДЕЛЕННАЯ ИНФОРМАЦИОННО – АНАЛИТИЧЕСКАЯ СИСТЕМА ДЛЯ ПОДДЕРЖКИ ИССЛЕДОВАНИЙ В НАУКАХ О ЗЕМЛЕ Специальность: 05.25.05 – Информационные системы и процессы, правовые аспекты информатики

Автореферат диссертации на соискание учёной степени кандидата технических наук

Москва 2008

Работа выполнена во Всероссийском институте научной и технической информации (ВИНИТИ) РАН

Научный консультант: доктор технических наук Гитис Валерий Григорьевич

Официальные оппоненты:

доктор технических наук, профессор Черный Аркадий Иванович доктор физико-математических наук Сметанин Юрий Геннадиевич

Ведущая организация: Институт системного анализа РАН

Защита состоится «22» октября 2008 г. в 11 часов на заседании диссертационного совета Д 002.026.01 во Всероссийском институте научной и технической информации РАН по адресу:

125190, Москва, ул. Усиевича, д. 20.

С диссертацией можно ознакомиться в библиотеке Всероссийского института научной и технической информации РАН.

Автореферат разослан 15 сентября 2008 г.

Ученый секретарь диссертационного совета Д 002.026.01 доктор технических наук, профессор Цветкова Валентина Алексеевна

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. В настоящее время информационная составляющая в науках о Земле представляет собой громадный, распределенный в сети Интернет, массив данных самого разнообразного характера и формы представления – метаданные, базы и банки данных, картографические слои разного типа, геоинформационные системы, аналитические и расчетные методы. В связи с этим при выполнении исследований специалист вынужден использовать не только те данные, которые имеются у него, но и элементы всей накопленной информации.

Однако реальная разнородность всех указанных данных приводит к тому, что значительную часть времени при исследованиях занимает работа, не связанная с предметной областью – как правило, это поиск информации, методов ее обработки и преобразования данных. Это фактически является задачей в области информационных технологий и ведет к значительному росту трудовых и экономических затрат. В результате в последние годы наблюдается бурный рост систем, позволяющих с помощью сети Интернет частично решить эту задачу. К сожалению, эти системы в настоящее время позволяют исследователю работать либо с визуальным представлением распределенной в сети Интернет глобальной картографической информацией, либо с отдельными комплексными геоинформационными системам регионов (по большей части в США, Канаде и Австралии), либо с поисковыми системами метаданных. При этом, даже наиболее мощные системы не позволяют: а) производить аналитические преобразования геоданных и б) использовать персональные данные и методы пользователя без предварительного размещения их в сети Интернет. Таким образом, любая аналитическая обработка распределенных (в том числе личных) данных, как с помощью геоинформационных систем, так и в ГРИД (GRID – англ. сетка) системах, остаются вне поля действия существующих систем в науках о Земле.

Известно, что для крупных информационных систем характерен явно недостаточный уровень вторичной аналитической обработки данных. В связи с этим актуальным является создание систем, обеспечивающих интеграцию и аналитическую онлайновую обработку информацию из сети Интернет и имеющихся материалов пользователя.

Целью настоящей работы является развитие методов и средств, обеспечивающих максимально эффективное использование информации в сети Интернет, имеющуюся у конкретных разработчиков, ведущих исследования в области наук о Земле. Создаваемая распределенная геоинформационная система должна формировать персонифицированное информационное пространство пользователя, поддерживать интеграцию локальных и распределенных в сети Интернет ресурсов, включая возможность работы с ГРИД системами, а также обеспечивать использование наиболее распространенных форматов данных и существующих геоинформационных систем. Для достижения этой цели были поставлены следующие задачи:

Задачи исследования:

1. Разработка способов унификации представления данных и протоколов обмена метаинформацией о различных типах геоданных.

2. Разработка универсальной настраиваемой системы сбора, анализа, преобразования и поиска документальных данных в распределенной среде.

3. Разработка методов и алгоритмов интеграции геоданных с последующей их аналитической обработкой в геоинформационных и ГРИД системах.

4. Экспериментальная апробация системы на примерах поддержки решения различных геологических и геофизических задач.

Научная новизна работы.

В результате проведенных исследований предложена информационно-аналитическая система, обеспечивающая специалистам в области наук о Земле онлайновую компьютерную поддержку решения фундаментальных и прикладных задач.

Система использует новую двухуровневую схему метаданных, которая позволяет осуществлять гибкую настройку на задачи пользователя и использовать личные данные пользователя без передачи их в сеть Интернет.

Произведенная систематизация, мониторинг и преобразование геоданных позволили создать представительное хранилище глобальной бесплатной информации по наукам о Земле, доступное через одну точку входа в сети Интернет.

Научно-практическое значение.

Созданная распределенная информационно-аналитическая система была опробована для решения ряда экспериментальных задач: прогноз золоторудных месторождений на Камчатке, кластерный анализ геохимических данных на Камчатке с целью выявления возможных аномалий; региональный прогноз нефтегазовых месторождений в Западной Сибири, пространственный прогноз геофизических данных в Центральной Европе, анализ зон возможных очагов землетрясений и оценки ущерба от землетрясений на Северном Кавказе.

При личном участии диссертанта разработаны архитектура распределенной информационно-аналитической системы, структуры представления и протоколы обмена геометаданными в системе, универсальная настраиваемая система преобразования документальных данных, базовая информационно-поисковая система, методы и алгоритмы преобразования, интеграции и анализа геоданных при решении прикладных и фундаментальных задач. По результатам систематизации и мониторинга мировых геоданных в ВИНИТИ РАН и ряде других институтов РАН создано хранилище глобальной географической, геологической и геофизической информации. Реализованы сложные методы аналитической обработки геоданных в специализированной ГИС «Геопроцессор». Созданы методы и алгоритмы взаимодействия распределенной информационно-аналитической системы и ГРИД.

Апробация работы. Основные положения работы опубликованы в [7,8] и докладывались и обсуждались на крупных международных конференциях:

«Смирновские чтения – 2007», МГУ, Геологический факультет, Москва, Россия;

«International Union for Geophysics and Geodesy (IUGG) XXIV General Assembly», July 213, 2007,Perugia, ITALY; Network geoinformation environment for the analysis of spatial and spatiotemporal data //Gitis Valeri, Yuri Arsky, Alexei Shogin, Arkady Weinstock «50-летие Международного геофизического года и Электронный Геофизический год», 16-19 сентября 2007, Суздаль, Россия;

«Математические методы распознавания образов – 13», 30 сентября – 6 октября 2007, Ленинградская обл., Россия;

«Геоинформационные системы в геологии и науках о Земле», Queretaro, Mexico 2007;

«7-я Международная конференция НТИ-2007. Информационное общество.

Интеллектуальная обработка информации. Информационные технологии», ВИНИТИ, 23-октября 2007, Москва, Россия;

а также на заседаниях секций РАН и заседаниях Рабочей группы по проекту «Электронная Земля: научные информационные ресурсы и информационно-коммуникационные технологии».

По материалам диссертации опубликовано 14 работ, включая 1 монографию.

Структура и объем работы. Диссертация состоит из введения, шести глав, заключения, списка литературы, содержащего 58 источников, 6 приложений. Работа изложена на страницах машинописного текста, иллюстрированного 32 рисунками и 3 таблицами.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, определены цель и задачи работы, сформулированы полученные в ходе работы результаты, оценена новизна исследования и его практическая значимость.

Глава 1. Анализ существующих распределенных геоинформационных систем и стандартов геоданных.

В первой части главы приводится краткая история развития геоинформационных систем, стандартов и протоколов передачи данных в области наук о Земле.

Далее анализируются существующие стандарты хранения и передачи картографических геоданных. Показано, что в настоящее время малодоступность такой информации глобального характера является одной из проблем, сдерживающих развитие геоинформационной поддержки наук о Земле.

Производится сравнительный анализ существующих отечественных и зарубежных распределенных геоинформационных систем разного типа, как регионального, так и глобального характера. На основе анализа дается их классификация по степени доступности, распространенности и по возможностям аналитической обработки геоданных.

В заключение формулируется вывод об актуальности создания распределенной информационно-аналитической системы в области наук о Земле для поддержки прикладных и фундаментальных исследований в этой области.

Глава 2. Исследование и разработка структур представления метаданных и протоколов обмена информацией в распределенной информационно-аналитической системе.

Подробно рассмотрены основные существующие стандарты метаданных в геоинформатике:

– FGDC – федеральный стандарт США;

– CEN – европейский стандарт;

– ISO 19115 и 10139 – международные стандарты.

Показана история возникновения стандартов, их эволюция и текущее состояние.

Рассмотрены возможности использования данных стандартов в задаче построения распределенной информационно-аналитической системы.

Рассмотрены вопросы создания такой структуры представления метаданных, которая бы позволила использовать ее для создания узлов распределенной системы в самых разных организациях и институтах РАН с наименьшими затратами времени и ресурсов. Предложенная в диссертации структура позволяет обрабатывать в рамках распределенной системы две разновидности метаданных – описательные и фактографические.

К описательным, содержащим преимущественно текстуальную информацию, относятся следующие типы метаданных:

– публикации;

– организации;

– персоналии;

– ресурсы.

К фактографическим, содержащим строго цифровые данные, относятся следующие типы метаданных:

– картографические (сеточные, векторные, растровые);

– некартографические (базы данных, таблицы и т.п.).

Кроме того, эта структура может быть использована для формирования ГИС-проектов и запуска аналитических задач в ГРИД-системах.

Показано, что предлагаемая структура метаданных должна быть расширением базового стандарта метаданных Dublin Core и представлять из себя два уровня. При этом, тот элемент Dublin Core (в стандарте это Identifier), который описывает URI ресурса, ссылается на настоящий URI в случаях, когда метаданные описывают публикации, организации, персоналии и т.п..

Часть элементов данных представляют собой «словарные» данные, которые либо соответствуют международным или национальным стандартам (языки, коды стран, специальности по ВАК, классификаторы ГРНТИ, ВИНИТИ), либо предназначены для жесткой типизации метаданных. Последние абсолютно необходимы для задачи интеграции геоданных, рассмотренной ниже.

В случае, когда метаданные описывают реальные геоданные или отдельные аналитические задачи, указанная ссылка приводит к XML файлу, который содержит в себе две составляющие: а) детальное описание геоданных, включая координатную и временную информацию, формат картографического представления и т.п. и б) параметризационную составляющую. Не секрет, что подавляющее число геоданных, доступных через сеть Интернет, требуют задания иногда очень большого числа параметров для получения их фрагмента. Более того, отказ от ввода этих параметров приводит либо к отказу выдачи данных вообще, либо к выводу громадного объема информации (сотни мегабайт или даже гигабайты). Очевидно, что прямое использование таких данных без параметров невозможно.

С другой стороны, в распределенной системе с единым интерфейсом пользователя очень важно формализовать способы задания параметров различных информационных ресурсов. Вот эту задачу и решает параметризационная составляющая вторичного XML файла.

В работе приведено детальное описание вторичного XML файла, обеих его составляющих и возможности использования для различных геоданных. Показано, что данный файл может с успехом быть использован для описания аналитических задач, связанных с обработкой геоданных. Приведены перспективы расширения структуры вторичного XML файла для генерации ГИС-проектов в различных геоинформационных системах.

Приводятся спецификации протокола обмена в создаваемой распределенной системе, который обеспечивает относительно быструю реализацию даже в условиях слабых серверных систем с минимальной программной поддержкой. Протокол обеспечивает как прямой доступ к группам метаданных, так и их выборку по запросу. Структура запроса в протоколе такова, что она в большинстве случаев дает возможность его трансляции либо в обычный SQL запрос, либо в полноценный контекстный поиск.

Рассмотрены вопросы отображения абстрактных XML спецификаций создаваемых структур представления метаданных на реальные реляционные и нереляционные структуры существующих СУБД.

Для облегчения подготовки к вводу метаданных в систему были разработаны специализированные средства двух типов – рабочее место с использованием MS Access и рабочее место с использованием Web – технологий. В первом случае для ввода данных требуется применение ряда последовательных XSLT преобразований, а во втором случае обеспечивается прямой ввод и редактирование (хотя и отложенное по времени) информации в базе метаданных.

Проведенный анализ типовых структур метаданных и протоколов обмена позволяет сделать следующие выводы:

Pages:     |
|



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.