WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     |
|

На правах рукописи

Дударев Виктор Анатольевич ИНТЕГРИРОВАННАЯ СИСТЕМА БАЗ ДАННЫХ ДЛЯ ИНФОРМАЦИОННОЙ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ПРИ ПРОГНОЗИРОВАНИИ СВОЙСТВ НЕОРГАНИЧЕСКИХ ВЕЩЕСТВ 05.13.01 – Системный анализ, управление и обработка информации (химическая технология) А В Т О Р Е Ф Е Р А Т диссертации на соискание ученой степени кандидата технических наук

Москва – 2006

Работа выполнена на кафедре Информационных технологий государственного образовательного учреждения высшего профессионального образования "Московская государственная академия тонкой химической технологии им. М.В. Ломоносова".

Научный руководитель доктор технических наук, профессор, заслуженный деятель науки и техники РФ Корнюшко Валерий Федорович Официальные оппоненты доктор технических наук, профессор Кузин Рудольф Евгеньевич доктор физико-математических наук, профессор Бублик Владимир Тимофеевич Ведущая организация Институт химических проблем микроэлектроники Министерства образования РФ (ИХПМ)

Защита состоится " 19 " " декабря " 2006 года в 11.00 час. на заседании диссертационного совета Д 212.120.08 при Московской Государственной Академии тонкой химической технологии им. М.В. Ломоносова по адресу: 119571, г. Москва, просп. Вернадского, 86.

С диссертацией можно ознакомиться в библиотеке МИТХТ им. М.В. Ломоносова (119571, г. Москва, просп. Вернадского, 86).

Автореферат диссертации размещен на сайте http://www.mitht.ru.

Реферат разослан " 17 " " ноября " 2006 г.

Ученый секретарь диссертационного совета, доктор технических наук Бурляева Е.В.

2

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы Обеспечение химиков-технологов достоверной информацией о свойствах и технологиях получения современных веществ является необходимым условием развития современной промышленности. На современном этапе качественная информационная поддержка специалистов невозможна без использования специализированных баз данных (БД). Разработка информационных систем (ИС) по свойствам веществ и процессам их получения ведется во всех промышленно развитых странах. Наиболее мощные информационные системы, основанные на современных СУБД, предлагают NIST (National Institute of Standards and Technology – Национальный институт стандартов и технологий, США) и STN (The Scientific and Technical Information Network – Международная сеть научно-технической информации). Как правило, БД по свойствам веществ разрабатываются в разных организациях и даже в разных странах. Полная интеграция таких систем невозможна из-за разного уровня качества данных, хранящихся в разных БД ИС. Обычно она связана и с организационными трудностями, т.к. большинство ИС используются в коммерческих целях или являются открытыми для доступа пользователей только определенных стран или организаций.

В последние годы наблюдается тенденция к кооперации в разработке ИС и к интеграции уже созданных ИС, как на национальном, так и на международном уровне. Актуальность решения этой задачи вызвана стремлением устранить необоснованное дублирование работ и уменьшить затраты на разработку и поддержку ИС. Кроме того, интеграция информации, содержащейся в ИС по свойствам веществ и технологиям их получения, позволяет применять методы компьютерного анализа для поиска взаимосвязей в данных. Использование найденных взаимосвязей позволяет проводить компьютерное конструирование новых перспективных соединений, обладающих заданными свойствами. Получаемая с помощью интегрированной ИС обобщенная информация может быть использована специалистами для поддержки принятия решений при выборе того или иного вещества и технологии его получения для использования в изделиях современной промышленности.

Цель работы Целью работы является информационная поддержка принятия решений при прогнозировании свойств веществ на основе интеграции разнородных баз данных по свойствам веществ и технологиям их получения.

Для достижения цели работы были поставлены следующие задачи:

• провести анализ современных технологий интеграции разнородных информационных систем;

• осуществить выбор программной платформы для построения интегрированной информационной системы;

• проанализировать и систематизировать архитектуру современных информационных систем по свойствам веществ и технологиям их получения;

• разработать методику построения интегрированной информационной системы с учетом возможности ее использования конечными пользователями и системами поддержки принятия решений;

• разработать структуры данных для применения в интегрированной информационной системе по свойствам веществ;

• разработать интегрированную информационную систему в виде программного комплекса;

• разработать программное обеспечение баз данных по свойствам акустооптических, электрооптических и нелинейнооптических веществ “Кристалл” и по ширине запрещенной зоны неорганических веществ “BandGap”;

• применить созданную интегрированную информационную систему для прогнозирования свойств веществ, перспективных для использования в современной промышленности.

Для достижения этой цели было необходимо найти решение проблем интеграции информационных систем, удовлетворяющее следующим условиям.

Решение должно быть:

• масштабируемым, т.е. обеспечивать возможность поэтапного добавления существующих информационных систем;

• достаточно простым для реализации, чтобы на основе предложенной методики любой участник мог самостоятельно разработать программные модули для включения своей информационной системы в интегрированную систему;

• гибким, чтобы учитывать различия в данных и информационных структурах ИС разных организаций;

• мощным, чтобы обеспечить сложные механизмы извлечения и манипулирования данными.

Научная новизна • предложен комплексный подход к интеграции ИС, как на уровне пользовательских интерфейсов, так и на уровне источников данных;

• на основе теории множеств дано определение релевантной информации в контексте интегрированной ИС по свойствам неорганических веществ;

• разработаны схемы данных и алгоритмы разрешения конфликтов гетерогенности для интегрированной ИС по свойствам веществ и технологиям их получения;

• разработана методика применения интегрированной ИС в программном комплексе компьютерного конструирования химических соединений для прогнозирования свойств веществ.

Практическая значимость Разработан и внедрен в Институте металлургии и материаловедения им. А.А. Байкова РАН (ИМЕТ РАН) программный комплекс, реализующий интегрированную ИС, объединяющий информационные системы по свойствам веществ и технологиям их получения. При помощи этого программного комплекса выполнена интеграция информационных систем, разработанных ИМЕТ РАН совместно с другими организациями России: БД по свойствам неорганических соединений “Фазы”, БД по фазовым диаграммам полупроводниковых систем “Диаграмма”, БД по свойствам акустооптических, электрооптических и нелинейнооптических веществ “Кристалл”, БД по ширине запрещенной зоны неорганических веществ “BandGap”, БД по свойствам химических элементов “Элементы” и информационной системы по свойствам полупроводникового кремния и процессам его получения и обработки “Кремний”. Полученный информационный комплекс не только позволяет конечным пользователям получать доступ ко всей информации и расчетным подсистемам в рамках интегрированной ИС, но и использовать ИС в качестве источника информации для программ компьютерного конструирования соединений и СППР.

Применение интегрированной ИС позволяет сократить время, затрачиваемое на поиск полной информации по свойствам и технологиям получения веществ.

Полученный программный комплекс используется в учебном процессе кафедры "Материалы микро-, опто- и наноэлектроники" МИТХТ при чтении курсов "Технология полупроводниковых материалов" и "Моделирование процессов полупроводниковой технологии".

Методы исследования Структуризация и формализация предметной области выполнена на основе методов структурного системного анализа. Для определения релевантной информации в контексте интегрированной ИС и построения модели понятий предметной области использован математический аппарат теории множеств.

При разработке интегрированной ИС использованы теория построения БД и Web-технологии. Для иллюстрации использования ИС в интеллектуальных системах использованы методы индуктивного вывода и компьютерного конструирования неорганических соединений, основанные на обучении ЭВМ распознаванию образов.

Апробация работы Основные результаты работы докладывались и обсуждались на следующих научно-технических конференциях и семинарах: III-rd International Conference, “Information Research, Applications and Education – i.Tech”, Bulgaria, Varna, 2005; Всероссийских научных конференциях “Научный сервис в сети Интернет”, Новороссийск, 2002, 2005; Международной научной конференции “Гагаринские чтения”, Москва, 2002; Научных конференциях молодых специалистов ИМЕТ им. А.А. Байкова РАН (проводятся в рамках Международных научных конференций “Теоретические основы создания металлических сплавов со специальными свойствами”), Москва, 2004, 2005; Первой научной конференции молодых ученых МИТХТ им. М.В. Ломоносова, Москва, 2005; Международных студенческих школах-семинарах “Новые информационные технологии”, Украина, Судак, 2002, 2004; Всероссийском семинаре по кинетике физикохимических процессов в газовой динамике (Институт механики МГУ им. М.В. Ломоносова), 2006.

Публикации Результаты диссертационной работы опубликованы в 14 печатных трудах, в том числе в 3 статьях в журналах, рекомендованных ВАК РФ для опубликования результатов диссертационных работ, 3 статьях, 8 публикациях в сборниках трудов и тезисов докладов конференций и семинаров.

Структура и объем диссертации Диссертация состоит из введения, четырех глав и заключения, изложенных на 150 страницах, включая библиографию из 163 источников, 41 рисунка и 9 таблиц.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении кратко рассмотрены актуальность и практическая ценность работы. Сформулирована цель работы и поставлены задачи. Кратко рассмотрены методы исследований, научная новизна, результаты апробации и внедрения диссертационной работы. Приведена структура диссертации и краткое содержание основных разделов.

В первой главе кратко рассмотрены наиболее значимые БД по свойствам веществ и технологиям их получения, созданные в мире. На рис. 1 дано распределение БД по тематике содержащейся в них информации.

Количество БД Термодинамические или термохимические свойства Технические и технологические свойства Химические и физико-химические свойства Кристаллографические и кристаллохимические свойства Физические (электрические, магнитные, оптические и т.д.) свойства Другие свойства Рис. 1. Распределение БД по свойствам неорганических веществ по тематике.

Детально рассмотрены три подхода к интеграции: (1) интеграция корпоративных приложений (Enterprise Application Integration, EAI), (2) интеграция корпоративной информации (Enterprise Information Integration, EII) и (3) программное обеспечение для извлечения, преобразования и загрузки данных (Extract, Transform, Load – ETL), основанное на технологии хранилищ данных.

Указаны области применения, а также достоинства и недостатки, присущие этим подходам. Отмечено, что ни один из существующих подходов не способен решить все проблемы, возникающие при интеграции ИС, т.е. справиться с объединением информационРис. 2. Современные подходы к интеграции.

ных источников и приложений ИС по свойствам веществ и технологиям их получения (рис. 2).

Проанализированы информационные потоки при разных методах интеграции ИС по свойствам веществ и технологиям их получения, а также связь интегрированной ИС с системами поддержки принятия решений (СППР) при исследовании и использовании химических веществ для современной промышленности (рис. 3).

Рис. 3. Анализ информационных потоков при использовании разных подходов к интеграции и место интегрированной ИС в СППР.

Учитывая то, что интегрированную ИС планировалось использовать в качестве источника информации для СППР, был сделан выбор в пользу подхода EII при интеграции на уровне данных. Этот подход, в отличие от ETL, позволяет получать актуальные данные из информационных источников, не требует промежуточного хранилища данных и является более гибким.

Рассмотрены основные подходы к интеграции информации средствами EII: (1) Global-As-View (GAV – описывает глобальную схему предметной области в терминах представлений локальных схем предопределенных источников данных) и (2) Local-As-View (LAV – рассматривает схемы локальных источников данных как материализованные представления в терминах общей глобальной схемы предметной области). После рассмотрения достоинств и недостатков, присущих GAV и LAV, осуществлен выбор подхода LAV для разработки интегрированной ИС, поскольку он позволяет построить масштабируемую интегрированную ИС с возможностью оперативного подключения новых источников информации. При LAV-интеграции программные адаптеры выполняют функцию преобразования данных из формата информационных источников к глобальной схеме X (рис. 4). Кратко рассмотрены и систематизированы три типа конфликтов гетерогенности, которые должны быть разрешены при разработке интегрированной ИС: (1) платформенные и системные, (2) синтаксические и структурные, (3) семантические.

Проведен обзор созапросы пользователей временных программных платформ для разработки предметный интегрированной ИС.

каталог посредник источников Предложены критерии (схема X) данных выбора платформ: производительность, безопасадаптер адаптер схема X схема X ность, надежность, инте… роперабельность и совокупная стоимость владеисточник1 источникN ния (ССВ). Используя предложенные критерии и Рис. 4. Интеграция на основе результаты тестирования, принципа Local-As-View.

проведенного независимыми компаниями, сделан вывод, что в настоящее время Microsoft предлагает наиболее надежные и высокопроизводительные системы, при этом ССВ решений этой компании оказывается ниже, чем у основных конкурентов. Это обусловило выбор решений на платформе Microsoft для реализации интегрированной ИС.

Pages:     |
|



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.