WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     ||
|

Результаты работы использованы в НИР, выполняемых в рамках грантов РФФИ: проект №05-07-90232 «Исследование и разработка инструментальных средств создания экспертных систем поддержки принятия решений» (Научные руководители д.т.н., проф. Вагин В.Н., д.т.н., проф. Еремеев А.П.).

Апробация работы. Основные результаты диссертации докладывались и обсуждались на 8-й, 9-й, 10-й, 11-й, 12-й, 13-й научных конференциях аспирантов и студентов «Радиотехника, электроника, энергетика» в МЭИ (ТУ), г. Москва, 2002-2007 гг.; на «Научных сессиях МИФИ», г. Москва, 2002-2007гг.; на международных формуах информатизации МФИ-2003, МФИ-2004, МФИ-2005, МФИ-2006, МФИ-2007, международные конференции «Информационные средства и технологии», г. Москва, 2003-2007 гг.; на семинаре «Multiphase Flow Measurement Seminar». Франция, Париж (Кламар), 14-19 декабря, 2004; на 13-ой Международной выставке «Нефтегаз – 2005». Россия, Москва, Экспоцентр, 21-25 июня, 2005; на конференции «Нечёткие Системы и Мягкие Вычисления». Россия, Тверь, 20-22 сентября, 2006; на XV Международной студенческой школе-семинаре «Новые информационные технологии». Украина, Крым, Судак, 20-27 мая, 2007; на конференции «Dependability of Computer Systems». Poland, Szklarska Porba, June 13-17, 2007; на конференции «Технологии Microsoft в теории и практике программирования», Россия, Москва, 2-3 апреля 2007.

Публикации. Основные результаты, полученные при выполнении диссертационной работы, опубликованы в 17 печатных работах, включая 2 работы в изданиях, рекомендуемых ВАК.

Структура диссертационной работы. Диссертация состоит из введения, четырёх глав, заключения, списка использованной литературы (119 наименований) и приложений. Диссертация содержит 196 страниц машинописного текста (без приложений) и 41 страницу приложений.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, её научная новизна и практическая значимость, сформулирована цель работы и приведено краткое содержание диссертации по главам.

В первой главе рассматриваются понятия интеграции и интероперабельности информационных ресурсов. В большинстве энциклопедических источников понятие интероперабельности определяется, как способность информационных ресурсов к совместному использованию, совместной деятельности для решения задач. Под интероперабельностью ИС понимается её способность взаимодействовать с другими ИС. Такое взаимодействие может выражаться в виде обмена данными, распределенного выполнения поисковых запросов, согласованного изменения баз данных (БД) и т.д.. Выделяется два аспекта интероперабельности: структурный и семантический. Структурный аспект интероперабельности систем означает способность к структурному согласованию сущностей систем. Семантический аспект означает возможность установления соответствия между смыслами единиц информационных систем.

Показана необходимость выполнения свойства интероперабельности для успешной интеграции информационных систем.

Формулируются проблемы, возникающие при интеграции информационных систем.

Во-первых, необходимость обеспечения систематиза­ции и структуризации исходной информации. Ин­формация, хранящаяся по частям в различных сис­темах, может частично дублироваться или иметь пробелы.

Во-вторых, максимальная унификация доступа к гетерогенным информационным ресур­сам.

В третьих, создание нового информа­ционно-технологического пласта, обеспечивающего ин­теграцию всех остальных систем, выполняющего роль диспетчера в ИТ-инфраструктуре компании.

Проведено исследование проблем связанных с интеграцией информационных систем, выявлены их причины и способы преодоления указанных трудностей.

Проведённый анализ подходов к интеграции информационных систем показал, что наиболее перспективным является подход, предполагающий применение метаданных в качестве базиса интеграции ИС. Учитывая сложность поставленной задачи, сделан вывод о том, что решение должно базироваться на использовании метаданных и базы общих знаний о предметной области.

Во второй главе исследуются языки, методы и модели представления знаний об информационных системах, предложен метод описания двухуровневой концептуальной модели информационных систем на основе схемы данных и онтологии предметной области. Рассмотрены методы описания метаданных и сделано обоснование для выбора конкретных методов в данной работе.

Вводится понятие онтологии предметной области, как точной (выраженной формальными средствами) спецификации концептуализации. Формальная модель онтологии представляет множество терминов предметной области (ПО), которую описывает онтология, множество отношений между терминами заданной ПО и функции интерпретации, заданные на терминах и/или отношениях онтологии. Обосновывается необходимость использования онтологического подхода для автоматизированного решения задачи интеграции информационных систем, как механизма создания непрерывного информационного поля.

Проводится классификация моделей и языков представления метаданных, на основе которой выделяется язык XML и модель RDF для описания метаданных информационных систем.

Показано, что для описания структуры информационных систем достаточно использование языка XML, как универсального синтаксиса, который лег в основу передачи информации между различными программами. Важным качеством указанного стандарта является его открытость и независимость от конкретных сфер применения. Таким образом, XML становится удобным средством для обеспечения синтаксической интероперабельности ИС. Однако при всех своих достоинствах XML не в состоянии адекватно справиться с задачей семантической интероперабельности. Основное ограничение XML состоит в том, что XML лишь описывает грамматику, и невозможно выделение семантических единиц в конкретной предметной области. Затем, XML является неоднозначным средством описания данных и позволяет одну и ту же информацию разметить различными способами. Также XML не подходит для задания метаданных по причине значимого порядка элементов.

Показано, что указанные проблемы могут быть решены, если для определения метаданных и правил преобразования данных при переходе от одной интегрируемой ИС к другой ИС использовать XML вместе с другой моделью данных, например, моделью семантической сети. Формально семантическую сеть можно определить при помощи модели RDF. В модели RDF имена концептов выбираются из определённого словаря концептов и определённого пространства имён, поэтому их представление более унифицировано, в отличие от XML разметки. Также, в семантической сети порядок элементов не важен, поскольку она представляет собой размеченный граф. Таким образом, совместное использование с технологией XML модели RDF позволит отразить семантику концептуальных моделей информационных систем, а также избежать изложенных ограничений XML.

Показано, что модель метаданных для ИС должна представлять собой двухуровневую систему: базовый - структурный уровень (технология XML), и опирающийся на него семантический уровень (модель RDF). Предложен метод описания метаданных для интегрируемых информационных систем. Он заключается в построении RDF-утверждений на основе информации, извлечённой из базы данных информационной системы, и онтологии предметной области. Данные утверждения описывают связи сущностей внутри ИС. В разработанном формате каждый концепт характеризуется своим уникальным идентификатором id (именем концепта) и типом type. Далее внутри описания концепта описываются ссылки на его концепты-потомки (rdf:subConceptOf), и на концепты-предки (rdf:hasSubConcept). Затем описываются концепты-атрибуты данного концепта. Также вводится поле “семантическая метка” (sv). В данном поле хранится описание концепта, указывающее соответствующее место концепта в онтологии предметной области.

Приводятся примеры использования разработанного формата для описания метаданных информационной системы Клуба Выпускников МЭИ.

В третьей главе, учитывая достоинства и недостатки проанализированных моделей, рассматривается разработка модели описания метаданных информационных систем и алгоритмов интеграции информационных систем.

Формальное описание разработанных концептуальных моделей информационных систем будет иметь следующий вид: S = (X, R),где: X = { Ci | i=1, 2, …, n } – непустое множество концептов (объектов предметной области), R = { Rj | j=1, 2, …, k } – семейство отношений на множестве X.

Каждый концепт C информационной системы определяется следующим образом, где: N – имя концепта C (уникальное имя концепта в конкретной информационной системе), T – тип концепта C, SV – семантическая метка концепта C, P – множество предков концепта C, P = { Cl | l=1, 2, …, nl }, Ch – множество потомков концепта C, Ch = { Cm | l=1, 2, …, nm }, <A> – кортеж атрибутов концепта C.

Каждый атрибут A разработанной модели представлен следующей тройкой, где: N – имя атрибута A, T – тип атрибута A, SV – семантическая метка атрибута A, K – ключ атрибута, V – значение атрибута.

В данной модели семейство отношений представляется множеством R = { R1, R2 }, где: R1 – отношение «зависимость», R1XX, С1R1С2 : С1P2 & С2Ch1, где Ch1 – множество потомков концепта С1, P2 – множество предков концепта С2; R2 – отношение агрегации («целое-часть»), R2XAt, At – множество атрибутов в рассматриваемой предметной области, At = { Aq | q=1, 2, …, nq}, С R2 Ai : Ai входит в <A>, где <A> – кортеж атрибутов концепта C.

Для описания правил преобразования концептов при интеграции информационных систем вводится функция интерпретации: Z(W)=Y, где W может принимать значения Ci, Ni, Ti, SVi, i[1,n], n – количество соответствующих элементов в концептуальной модели. Данная функция в качестве результата своей работы возвращает значение конкретного элемента модели, к которому она была применена.

Концептуальная модель каждой информационной системы строится из наборов утверждений, сформулированных в терминах разработанной модели. Построение единой метамодели осуществляется по аналогичным принципам. Для рассматриваемого в работе примера интеграции ИС ВУЗов описание концепта «Институт» будет выглядеть следующим образом:

<rdf:RDF rdf:parseType="Metadata" rdf:name="Institute Metadata">

<rdf:Description>

<rdf:concept id=”Institute” type="Entity" sv="Инcтитут">

<rdf:concept id="id_I" type="int" sv="Идентификатор" key="PK">

<rdf:concept id="Name_I" type="string" sv="Название института" key="">

</rdf:concept>

</rdf:Description>

</rdf>

Рассматривается процесс интеграции информационных систем. Пусть существуют две информационных системы ИС-А и ИС-В, функционирующие в рамках одной предметной области и необходимо провести интеграцию ИС-А и ИС-В. На рисунке 1 приводится схема разработанного процесса интеграции ИС. Задачей интеграции является обеспечение взаимодействия между ИС. Для этого необходимо определить соответствия сущностей ИС-А сущностям ИС-В и правила их преобразования. С этой целью вначале из информационных систем извлекаются их схемы данных. Схема данных представляет структурную схему базы данных, систему типизированных связанных сущностей и их атрибутов. При помощи анализа схем данных в отдельности, возможно установление лишь структурной интероперабельности, то есть правил преобразования типов полей и сущностей ИС друг в друга.

Для обеспечения семантической интероперабельности, требуется понимание назначения элементов ИС. Поэтому необходимо использовать вторую составляющую часть метаданных – концептуальную модель предметной области. Концептуальная модель является надстройкой над схемой данных и задаёт систему связей между концептами предметной области, установленную в данной ИС.

Построение данной модели осуществляется при помощи онтологии предметной области. Онтология содержит словарь концептов ПО и хранит общую сеть связей между этими концептами. То есть каждая концептуальная модель является подмножеством онтологии ПО. Использование онтологии позволяет определять концептуальные модели в одних терминах и анализировать связи между их концептами. Для упрощения работы с онтологией предметной области были разработаны следующие простые функции, определённые на концептах онтологии: функция склеивания, функция разделения, функция преобразования. Данные функции определяют правила перехода от концептов нижнего уровня к концепту верхнего уровня и наоборот.

Далее на базе концептуальных моделей ИС-А и ИС-В осуществляется построение метамодели предметной области интегрируемых ИС. Данная метамодель объединяет и согласует в себе обе концептуальные модели. На этапе её построения также используется онтология. Метамодель определяет соответствия сущностей ИС-А сущностям ИС-В и правила их преобразования, что позволяет установить взаимодействие между указанными информационными системами.

Формально метамодель интегрируемых ИС определяется следующим образом: M = (S1, S2, Rs), где S1 – концептуальная модель ИС-А, S2 – концептуальная модель ИС-В, Rs – правила преобразования совокупностей концептов при их трансляции из ИС-А в ИС-В, построенные согласно рассматриваемому далее разработанному алгоритму интеграции ИС.

В результате, обеспечивается интероперабельность, а, следовательно, необходимый уровень интеграции информационных систем.

Таким образом, разработанный процесс интеграции информационных систем состоит из выполнения следующих алгоритмов:

1. Анализ сущностей баз данных, их атрибутов и отношений между ними. На данном этапе приложением осуществляется построение схем данных.

2. Анализ семантических меток сущностей и атрибутов. На данном этапе строятся концептуальные модели информационных систем. Для получения и анализа семантических меток используется онтология предметной области.

3. Уточнение семантических соответствий. С помощью онтологии определяются недостающие связи между концептами.

4. Построение единой метамодели. Данная метамодель строится как объединение двух концептуальных моделей информационных систем. На данном этапе онтология используется для разрешения возможных противоречий.

5. Вывод результирующих отображений между сущностями и атрибутами информационных систем.

Наиболее сложным этапом является построение результирующих правил преобразования концептов в рамках формирования единой метамодели ИС, в ходе которого могут возникать различные ситуации сопоставления концептов. Они были рассмотрены, проанализированы и сгруппированы в следующие 6 классов:

Pages:     ||
|



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.