WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     || 2 |

На правах рукописи

Бодров Алексей Анатольевич ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ ПРИМЕНЕНИЯ ССЫЛОЧНЫХ МАССИВОВ ДАННЫХ В ИНТЕГРИРОВАННЫХ СИСТЕМАХ ОБРАБОТКИ ИНФОРМАЦИИ Специальность: 05.13.01 – Системный анализ, управление и обработка информации (технические системы)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва 2009

Работа выполнена в Учреждении Российской академии наук Институте конструкторско-технологической информатики РАН (ИКТИ РАН).

Научный консультант: доктор технических наук Григорьев Олег Георгиевич.

Официальные оппоненты: доктор технических наук, профессор Фролов Евгений Борисович;

доктор технических наук, профессор Саксонов Евгений Александрович.

Ведущая организация: Учреждение Российской академии наук Институт системного анализа РАН (ИСА РАН).

Защита диссертации состоится " 26 " февраля 2009 г. в 12 часов на заседании диссертационного совета Д 212.142.03 в ГОУ ВПО Московском государственном технологическом университете «Станкин» по адресу:

127994, г. Москва, Вадковский пер., д. 3а.

С диссертацией можно ознакомиться в библиотеке ГОУ ВПО Московского государственного технологического университета «Станкин».

Автореферат разослан «_21_» января 2009 г.

Ученый секретарь диссертационного Совета Д 212.142.03, кандидат технических наук, доцент Е. Г. Семячкова 2

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Проблема интеграции данных, содержащихся в локальных независимых автономных и неоднородных источниках, стала весьма актуальной в последние годы при разработке и развитии систем обработки информации различного уровня и назначения.

Интеграция позволяет пользователям и программным средствам корпоративной системы осуществлять доступ к локальным информационным системам как к одной общей системе и производить поиск и обработку требуемой информации без учета специфики представления, хранения и обеспечения безопасности в локальных системах. Поэтому интеграция информационных ресурсов является, в настоящее время, одним из наиболее важных направлений при создании корпоративных систем обработки информации и управления. Важной темой сегодняшнего дня становятся технологии и программные продукты, способные обеспечить безболезненную интеграцию локальных систем обработки информации, возможность концентрации информации с целью оперативного и более эффективного принятия решений (анализа и управления).

Существует множество методов интеграции информационных ресурсов. От выбора метода зависит эффективность работы программного обеспечения, скорость выполнения запросов и актуальность предоставляемых данных. Одним из наиболее распространенных является метод, основанный на создании и применении ссылочных массивов.

Однако его эффективное практическое применение требует разработки соответствующих методов управления процессами обработки информации, анализа взаимодействия с локальными системами, знания специфики решаемых прикладных задач, требований к качеству данных и алгоритмам управления.

В связи с этим тематика диссертационной работы, связанная с разработкой математических моделей для анализа и повышения эффективности применения ссылочных массивов в интегрированных системах обработки информации, является актуальной, а результаты диссертации имеют важное практическое значение.

Целью работы является повышение эффективности применения ссылочных массивов в интегрированных системах обработки информации за счет разработки и теоретического обоснования методов создания, ведения и актуализации ссылочных массивов и обработки запросов к ним.

Для достижения указанной цели были поставлены следующие задачи:

1) исследование и анализ методов построения интегрированных систем обработки информации;

2) разработка алгоритмов формирования и актуализации ссылочного массива, позволяющих обеспечить доступ к информации, обработку запросов к локальным системам;

3) разработка математических моделей для управления процессами актуализации ссылочного массива и обработки запросов пользователей к ссылочному массиву;

4) разработка методики адаптации математических моделей и алгоритмов для создания специализированных интегрированных систем обработки информации.

Научная новизна полученных результатов заключается в выборе объекта исследования – ссылочного массива, проведении анализа и обобщения известных теоретических и практических данных по созданию интегрированных систем обработки информации с использованием ссылочных массивов, установлении связей между характеристиками интегрированной системы и параметрами ссылочных массивов, что позволило построить комплекс математических моделей для системного анализа, оценки и повышения эффективности применения ссылочных массивов в интегрированной системе.

Разработаны:

- алгоритмы создания и ведения ссылочных массивов;

- комплекс математических моделей процессов актуализации и обработки запросов в ссылочных массивах;

- алгоритмы актуализации ссылочных массивов и обработки запросов в ссылочных массивах.

Практическая значимость результатов диссертации состоит в создании алгоритмов для анализа и управления процессами организации и управления работой ссылочных массивов данных при актуализации и организации обработки запросов, ориентированных на специфику конкретной корпоративной системы управления. Полученные результаты можно применять при создании, анализе и администрировании корпоративных информационных систем, использующих интегрированные данные различного назначения.

Достоверность и обоснованность основных результатов и выводов диссертации базируются на обобщении и развитии существующего опыта создания и применения ссылочных массивов в интегрированных системах обработки информации, разработке математических моделей с учетом специфики применения ссылочных массивов и обработки запросов пользователей, на соответствии полученных результатов сведениям, опубликованным в отечественной и зарубежной печати, на результатах практического применения разработанных моделей и алгоритмов при создании конкретных интегрированных систем управления и обработки информации специального назначения.

Методы исследований. При решении поставленных в диссертации задач применялись методы теории систем, теории очередей, теории вероятностей, теории множеств, математического программирования.

Апробация работы. Результаты диссертационной работы докладывались и обсуждались на научных семинарах ИКТИ РАН, ИСА РАН, ИПИ РАН.

Результаты проведенных исследований использованы при создании специализированных интегрированных систем обработки информации в ФСБ России и МВД России, что подтверждено соответствующими актами.

Публикации. Основные результаты диссертации опубликованы в 6 печатных работах, в том числе 2 из них в журналах рекомендованных ВАК.

Структура диссертации. Диссертация состоит из введения, четырех глав и списка литературы. Общий объем диссертации 122 страницы, включая 25 рисунков и 2 таблицы.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность темы диссертационной работы и проводимых исследований, описываются новизна, практическая значимость и реализация результатов работы.

В первой главе рассматриваются наиболее перспективные и часто употребляемые способы создания интегрированных систем обработки информации путем интеграции данных из локальных подсистем.

Показано, что интегрированные системы являются одним из основных подходов при создании крупных корпоративных и межотраслевых систем, информационных систем федерального, регионального и отраслевого уровней.

Сложность и трудоемкость процессов интеграции и необходимость их анализа обусловлены тем, что интегрируются информационные ресурсы, находящиеся в ранее созданных системах. Причем эти системы создавались независимо друг от друга и, естественно, с использованием различных правил и стандартов.

Сформулированы требования к интегрированной системе по предоставляемым услугам и обслуживанию пользователей.

Показано, что интегрированная система может рассматриваться как набор слабосвязанных информационных ресурсов, сосредоточенных в локальных системах. Доступ пользователей к локальным ресурсам должен обеспечиваться по единым правилам и соответствовать регламентам локальных систем. Эти правила должны обеспечивать корректное совместное использование локальных ресурсов при решении специфических задач интегрированной системы, определяющих ее прикладное назначение.

Правила создания системы определяются возможностями управления локальными ресурсами и готовностью владельцев локальных ресурсов к внесению необходимых изменений в свои информационные системы.

Показано также, что интегрированная система должна обеспечивать санкционированный доступ к локальным ресурсам при прозрачности механизма доступа.

Исследованы различные варианты интеграции, удовлетворяющие заданным требованиям по доступу к информации, но отличающиеся по таким параметрам, как объемы перемещаемых данных, затраты на интеграцию, связанные с созданием необходимых программных и информационных ресурсов, трудоемкость настройки и модернизации ранее созданных локальных информационных систем, эффективность организации процессов обработки информации и ответственность за качество данных.

Показано, что такие методы, как использование единого профиля стандартов, создание централизованных хранилищ данных или санкционированный доступ пользователей непосредственно к локальным системам связаны с внесением серьезных изменений в ранее созданные системы, могут нарушать требования локальных систем по безопасности информации, требуют большого объема подготовительных работ. Однако отмечены те случаи, когда применение указанных методов оправдано.

По результатам проведенного анализа вариантов интеграции для исследования в диссертационной работе выбран метод на основе ссылочных массивов или витрин данных. Здесь под ссылочным массивом понимаем специализированный массив данных, содержащий информацию о размещении данных в локальных системах и правилах доступа к таким данным. Ссылочный массив является своеобразным промежуточным слоем между пользователями интегрированной системы и локальными системами, используя который пользователи могут находить и получать доступ к требуемой информации. По сути, ссылочный массив – это массив метаданных. Часто ссылочный массив называют витриной данных.

Таким образом, ссылочный массив, представляет совокупность данных, необходимых для обработки запросов к интегрированной системе.

Сервер ссылочного массива является главной точкой входа (порталом) в интегрированную систему, куда поступают запросы пользователей системы, где происходит их интерпретация и формирование запросов к локальным системам, а также получение ответов от локальных систем и формирование ответов на запросы пользователей.

Метод интеграции на основе ссылочного массива обладает рядом преимуществ:

- минимизирует объем изменений в локальных системах;

- минимизирует объемы данных перемещаемых из локальных систем;

- позволяет создавать виртуальное корпоративное хранилище данных;

- обеспечивает доступ в систему через единую точку входа (портал);

- позволяет скрыть истинное размещение данных в локальных системах;

- позволяет совмещать процедуры поиска и доступа к данным;

- позволяет эффективно применять известные Web- технологии;

- позволяет достаточно просто администрировать работу пользователей и приложений.

К наиболее значимым недостаткам метода можно отнести:

- необходимость регулярной актуализации ссылочного массива с учетом изменений и дополнений в локальных информационных ресурсах, обеспечивающей полноту обработки запросов к интегрированной системе;

- сложность создания единой семантической модели данных и ее применения во всех локальных системах;

- высокие требования к производительности серверов обработки запросов к ссылочному массиву, связанные с централизацией получения и обработки запросов.

Показано, что при правильной организации и управлении работой со ссылочным массивом, перечисленные достоинства, позволяют повысить эффективность обработки информации в интегрированной системе за счет увеличения скорости и повышения качества обработки запросов.

Таким образом, определен объект исследования – ссылочный массив интегрированной систем обработки информации, исследованы свойства объекта и наиболее значимые задачи, решение которых необходимо при организации интегрированных систем на основе ссылочных массивов.

Все это позволило сформулировать направления и задачи исследований данного объекта, связанные с разработкой моделей для вычисления (оценки) и оптимизации количественных значений характеристик системы.

Во второй главе диссертации проводится анализ процесса формирования ссылочного массива (витрины) данных, сформулированы основные задачи, которые необходимо решить при организации обработки информации с использованием ссылочных массивов.

Рассмотрены различные варианты организации процессов формирования и обработки запросов.

Так, варианты формирования ссылочного массива учитывают возможные отличия в семантике атрибутов, относящихся к одному и тому же объекту в локальных базах данных. При этом формируемое множество поисковых атрибутов в ссылочном массиве должно позволять получать информацию об объекте во всех интегрируемых локальных системах.

Обработка запросов в интегрированной системе может проводиться в синхронном и асинхронном режимах в зависимости от возможностей клиентского программного обеспечения и организации работы пользователей. Режим обработки влияет на время получения ответа на запрос и требует соответствующих настроек прикладного программного обеспечения, поэтом необходим предварительный анализ каждого из режимов.

Pages:     || 2 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»