WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 || 3 |

перспективные методы и технологии, электронные коллекции» (RCDL’2007) – Переславль-Залесский, 15-18 октября 2007; Всероссийской научно-практической конференции «Свободное программное обеспечение: разработка и внедрение» - Томск, 17-18 мая 2008; XIII Байкальской всероссийской конференции «Информационные и математические технологии в науке, технике и образовании» – Иркутск, 716 июля 2008; International conference on environment observations, modeling and informational systems (ENVIROMIS-2008) – Tomsk, 28-5 July 2008; European geosciences union general assembly 2009 – Vienna, 19-April 2009; XVI Международном симпозиуме «Оптика атмосферы и океана. Физика атмосферы» – Томск, 12-15 октября 2009; IV Всероссийской конференции молодых учёных «Материаловедение, технологии и экология в 3-м тысячелетии» – Томск, 19-21 октября 2009; Всероссийской конференции «Знания – Онтологии – Теория» – Новосибирск, 20-22 октября 2009.

По теме диссертационной работы опубликовано 17 научных работ:

- из них шестнадцать печатных [1, 2, 3, 4, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17] и одна в электронном журнале [5];

- из них четырнадцать работ на русском языке [4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17] и три на английском [1, 2, 3];

- из них две в журналах из перечня ВАК по управлению, вычислительной технике и информатике [4, 9], две в журналах из перечня ВАК по физике [8, 11], две в журналах [5, 10], одиннадцать в трудах и материалах конференций [1, 2, 3, 6, 7, 12, 13, 14, 15, 16, 17].

Внедрение результатов диссертационной работы, было осуществлено в трех основных исследовательских группах спектроскопистов в России:

- Институт оптики атмосферы СО РАН, где результаты доступны активно используется в рамках НИВС (http://saga.iao.ru);

- Институт прикладной физики РАН, где результаты доступны в рамках НИВС по адресу http://saga.atmos.appl.sci-nnov.ru;

- Санкт-Петербургский государственный университет, где результаты доступны в рамках НИВС по адресу http://saga.molsp.phys.spbu.ru.

Работа выполнена при поддержке грантов: Российского Фонда Фундаментальных Исследований (РФФИ) «Распределенная информационная система «Молекулярная спектроскопия»« (05-07-90196, А.Д.

Быков, 2005-2007); РФФИ «Интернет доступная информационная система по молекулярной спектроскопии, основанная на знаниях» (08-0700318-а, А.З. Фазлиев, 2008-2010); UIPAC task 2004-035-1-100 «A database of water transitions from experiment and theory».

Личный вклад автора.

Опубликованные работы написаны в соавторстве с экспертами предметной области спектроскопии молекулы воды и сотрудниками центра интегрированных информационных систем ИОА СО РАН. В совместных работах диссертант принимал участие в непосредственной разработке схем XML-данных, метаданных и их дальнейшем внедрении в модель НИВС, в разработке прикладной онтологии задач по спектроскопии молекул воды, во внедрении результатов работы. В разработке перечисленного программного обеспечения ему принадлежит определяющая роль.

Благодарности.

Автор выражает благодарность профессорам А.А. Мицелю и А.Ф. Тузовскому за внимание к работе, ценные замечания и помощь, способствующие окончательному варианту рукописи. Автор признателен с.н.с. А.З. Фазлиеву за ценные консультации, постановки задач и всестороннюю поддержку данной работы.

Автор благодарен чл.-корр. РАН С.Д. Творогову, а также благодарит д.ф.-м. н. А.Д. Быкова и к.ф.-м.н. Б.А. Воронина за консультации и помощь при определении структуры данных в молекулярной спектроскопии воды; Н.А. Лаврентьева за реализацию программ для расчета коэффициентов поглощения газов; А.Ю. Ахлёстина за реализацию ядра НИВС; А.В. Козодоева за реализацию системы ввода данных;

д.ф.-м.н. О.Б. Родимову за помощь в составлении типовых вопросов для задачи нахождения уровней энергии молекулы.

Структура и объём диссертационной работы. Диссертация состоит из перечня условных обозначений, введения, четырёх глав, заключения, списка использованных источников и шести приложений.

Общий объём работы составляет 239 страниц. Список использованных источников насчитывает 128 наименований. Работа содержит 42 рисунка и 25 таблиц.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении излагается положение дел в прикладной части молекулярной спектроскопии, обосновывается актуальность темы диссертационной работы, сформулированы цель и задачи работы, изложены основные научные результаты, выносимые на защиту, и их практическая значимость.

В первой главе излагается подход к организации онтологических баз знаний в информационных системах.

Определение. Знания – совокупность зафиксированных в сознании и мышлении человека или машины фактов предметной области.

Сознание определяет восприятие и понимание окружающего мира, а мышление задаёт способы установления связей, сопоставлений и осуществление из этого выводов, используя логику. Если рассматривать логику, заложенную в машину, то используется формальный язык математической логики. Формальный язык (множество конечных слов над конечным алфавитом) определяется словами, порождёнными некоторой формальной грамматикой, например формой Бэкуса-Наура для описания синтаксиса. Интерпретации смысла синтаксических конструкций формального языка логики определяется логической семантикой, которая определяется формально. Формализация логической семантики позволяет явно задавать смысл высказываний и разделять сами высказывания и заключения об их истинности.

Для достижения компромисса между логикой предикатов, имеющей формальную семантику, и семантическими сетями, являющимися удобным способом представления знаний предметной области в виде иерархий понятий и их отношений, используется семейство дескриптивных логик, которое является подмножеством логики предикатов первого порядка.

Во вводной части главы рассматриваются разные точки зрения на понятие «онтология». Рассматриваются подходы к онтологической концептуализации и различные классификации онтологий. Представлено описание инженерии онтологий, языков онтологий и инструментальных средств для работы с ними.

В диссертационной работе понятие «онтология» используется в соответствии с определением языка спецификации онтологий OWL, имеющим формальный синтаксис и формальную семантику семейства дескриптивных логик, например, OWL Lite имеет основу в виде дескриптивной логики под названием SHIF(D), а OWL DL – SHOIN(D).

Определение. Онтология (база знаний) – совокупность TBox и ABox на формальном языке OWL DL.

Формальный синтаксис языка содержит алфавит, состоящий из трёх компонентов {C, R, I }, где C = {T,, C1...Cm} – конечное множество имён классов (понятий), включающее универсальный класс T и пустой класс ; R = { R1...Rk } – конечное множество имён свойств (бинарных отношений); I = {i1...in } – конечное множество имён объектов (экземпляров). Набор терминологических аксиом типа «дочерний класс», «эквивалентный класс», «дочерний свойство», «эквивалентное свойство» называется TBox (сокращение от terminological box), то есть вводит терминологию предметной области. Набор аксиом утверждений типа «экземпляр класса», «экземпляр свойства» называется ABox (assertional box), то есть содержит утверждения об именованных индивидах в заданной терминологии.

Определение. Семантические метаданные – описание информационного ресурса (ABox) относительно некоторой терминологии онтологической модели предметной области (TBox).

В работе семантические аннотации представлены с помощью языка спецификации OWL DL. Такие аннотации будем называть онтологическими аннотациями или онтологическими описаниями. Процесс формирования структуры семантической аннотации обусловлен задачей перевода интерпретируемого человеком описания в описание, интерпретируемое машиной.

В главе представлен обзор существующих НИВС по молекулярной спектроскопии.

Во второй главе рассмотрен подход к информационной модели предметной области в виде цепей её прямых и обратных задач.

В естественных науках большая часть задач связана со знаниями, основанными на решениях задач предметной области. Целью решения предметной задачи является изучение состояний физической системы.

Эти состояния исследуемой системы при представлении знаний рассматриваются как наборы фактов (ABox). Задачи классификации в молекулярной спектроскопии, как правило, сводятся к построению таксономии терминов предметной области и на практике рассматриваются как вспомогательные задачи. Предполагается, что в задаче классификации концепты представляют интенсионалы предметной области (TBox). Описание предметной области основано на нескольких таксономиях и наборах фактов для каждой из задач модели предметной области.

Важную роль при создании базы знаний играет концепт «информационный источник». Концепт информационный источник описывает решение задачи предметной области и важен при семантическом описании решений задач молекулярной спектроскопии.

Основной акцент для модели предметной области в виде цепей прямых и обратных задач сделан на автоматическое установление достоверности данных решений задач. В проверке на достоверность результатов решений задач можно выделить несколько уровней:

1. Проверка ограничений на типы данных.

2. Проверка ограничений на допустимые интервальные значения физических величин.

3. Проверка ограничений, следующих из математических моделей исследуемых физических объектов.

4. Систематизация результатов решений задач по величине среднеквадратичных отклонений.

5. Указание недостоверности данных, выявленных экспертом предметной области на основе «дальних корреляций» результатов решений задач.

Прямые задачи молекулярной спектроскопии связаны с расчетами из первых принципов фундаментальных характеристик молекул.

Обратные задачи молекулярной спектроскопии связаны с обработкой данных измерений спектральных функций, что позволяет в дальнейшем при машинной обработке классифицировать их выходные данные как экспериментальные. В цепи задач молекулярной спектроскопии существуют связи между прямыми и обратными задачами.

При решении задач обоих типов проводятся вычисления одних и тех же физических величин. Их сравнение между собой позволяет делать выводы о достоверности данных.

К классам элементарных прямых задач, используемых нами для проектирования информационной системы, относятся следующие классы задач: задача определения физических характеристик изолированной молекулы (Т1); задача определения параметров спектральной линии изолированной молекулы (Т2); задача определения параметров контура спектральной линии (Т3); задача расчета спектральных функций (Т4).

К классам элементарных обратных задач, используемых нами для проектирования информационной системы, относятся следующие классы: задача измерения спектральных функций (Е1); задача приписывания квантовых чисел спектральным линиям (Т5); задача определения коэффициентов Эйнштейна (Т6); задача определения уровней энергии изолированной молекулы (Т7).

В работе для первых двух уровней автоматической проверки на достоверность данных решений задач можно использовать представление структурированных данных в виде XML-документа с соответствующей XML-схемой, с заданными ограничениями на типы данных и интервальные значения. В НИВС можно использовать проверку данных по XML-схемам для выявления ошибок загрузки и выделять данные, которые не соответствуют заданным ограничениям.

В рамках диссертационной работы созданы XML-схемы. Организация XML-схем основана на предположении, что любая физическая задача состоит в изучении определенной молекулы. Поэтому, корневым элементом в документе будет название изотопомера молекулы, ему соответствуют название файла содержащего XML-схему.

В третьей главе рассмотрен подход к построению базы знаний по спектроскопии молекулы воды, описан процесс автоматизации процедуры наполнения онтологии молекулярной спектроскопии новыми фактами. Созданные онтологии используются для машинной систематизации и интерпретации знаний, для интеграции знаний в другие смежные предметные области, а также организации семантического поиска. На рис 1. представлены базовые классы прикладной онтологии по молекулярной спектроскопии, представленные в нотации Protg.

Рис. 1. Базовые классы онтологии по молекулярной спектроскопии В этой онтологии можно выделить три группы классов:

Классы, содержащие объекты, относящиеся к спектроскопии молекул, в частности, молекулы воды и ее изотопомеров (Substance, PhysicalState, PhysicalQuantity, DimensionalQuantity, QuantumNumbersType, Unit, SpectralBand, BandQuantumNumbers, BandQuantumNumbers, CorrelationBand) Классы, содержащие математические модели объектов, используемые в молекулярной спектроскопии (SymmetryGroup, Task, Method).

Классы, содержащие информационные объекты (Metadata, InformationSource, SubstanceRecord, PhysicalQuantityRecord, BroadeningSubstanceRecord).

Реализация онтологий по молекулярной спектроскопии проведена на языке OWL DL. Большая часть классов прикладной онтологии задач построены с помощью ограничений на свойства. Программная реализация TBox онтологии содержит 11 файлов, представляющих разные части предметной области.

Особенностью работы с онтологиями задач в НИВС «Молекулярная спектроскопия» является тот факт, что пользователи при решении задач механически составляют свою собственную онтологию, содержащую индивиды, соответствующие конкретной решенной задаче.

Эти индивиды можно объединять с онтологиями других задач или других пользователей, если это позволяют права доступа к базе знаний.

Использование прикладной онтологии возможно на клиентском месте с помощью любого редактора онтологий, например Protg.

Средства этого редактора позволяют пользователю составлять запросы с помощью конструкции утверждения (субъект, предикат и объект), экземпляры которого можно создавать из концептов прикладных онтологий.

Полная прикладная онтология по молекулярной спектроскопии в НИВС «Молекулярная спектроскопия» содержит 1 347 796 утверждений на языке OWL. Из которых, 1 467 утверждений приходится на таксономию. На факты по задаче T1 приходится 1 432 утверждений.

Pages:     | 1 || 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»