WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


На правах рукописи

БРЕЙМАН Александр Давидович М А Т Е М А Т И Ч Е С К О Е И П Р О Г Р А М М Н О Е О Б Е С П Е Ч Е Н И Е А Д А П Т И В Н Ы Х С И С Т Е М П Е Р С О Н А Л Ь Н Ы Х Б А З Д А Н Н Ы Х Специальность 05.13.11 — Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей А В Т О Р Е Ф Е Р А Т диссертации на соискание ученой степени доктора технических наук

Москва — 2007

Работа выполнена на кафедре «Персональные компьютеры и сети» ГОУ ВПО «Московский государственный университет приборостроения и информатики»

Научный консультант: доктор технических наук, профессор МИХАЙЛОВ Борис Михайлович

Официальные оппоненты: доктор технических наук, профессор ГЕТМАНОВ Виктор Григорьевич доктор технических наук, профессор ИВАННИКОВ Александр Дмитриевич доктор технических наук, профессор ПЕТРОВ Олег Михайлович

Ведущая организация: Московский государственный институт электроники и математики (технический университет)

Защита состоится 25 декабря 2007 г. в 10 часов на заседании Диссертационного совета Д 212.119.02 в Московском государственном университете приборостроения и информатики (107076, г. Москва, ул. Стромынка, д. 20)

С диссертацией можно ознакомиться в библиотеке Московского государственного университета приборостроения и информатики.

Автореферат разослан «___» _____________ 2007 г.

Ученый секретарь диссертационного совета Д 212.119.02, к.т.н., доц. Зеленко Г.В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ



Актуальность темы. Проблемы создания и администрирования адаптивных систем персональных баз данных, ориентированных на максимально полное отражение предметной области индивидуального пользователя не имеют на настоящее время достаточно полного решения. Доступные индивидуальному пользователю системы управления базами данных позволяют отражать лишь сильно структурированные типовые подобласти потенциально очень обширной предметной области, удовлетворяя при этом лишь ничтожную долю пертинентных информационных потребностей.

Такие факторы как, рост объемов и разнообразия хранимой информации, рост скорости получения данных, возможность автоматического получения данных из компьютерных сетей, необходимые для обеспечения удовлетворения растущих информационных потребностей, приводят к существенному снижению эффективности повсеместно используемой файловой организации данных.

Важнейшей особенностью индивидуального пользователя является отсутствие у него специальной подготовки в области информационных технологий. Поэтому решение поставленной задачи в большой степени зависит от обеспечения адаптивного автоматизированного администрирования систем персональных баз данных. При этом возникают задачи расширенного администрирования, к которым относятся задачи формирования активных и доминантных зон баз данных и автоматического согласования состояния этих зон с информационными потребностями пользователя. Проблемы автоматизации отдельных задач администрирования баз данных корпоративных информационных систем активно решаются производителями систем управления базами данных, однако внедрение этих инструментов автоматизации не уменьшает, а увеличивает расходы на администрирование.

Набор инструментов автоматизации, ориентированных на современные проблемы администрирования систем персональных баз данных, ограничен по номенклатуре и рассчитан на решение отдельных задач. При этом средства комплексной автоматизации администрирования в настоящее время практически отсутствуют, что является одним из основных препятствий широкого внедрения современных информационных технологий в жизнь.

Значительный вклад в изучение систем баз данных внесли следующие отечественные и зарубежные ученые: Э. Кодд, К. Дейт, Д. Белл, Ф. Бернштейн, Дж.

Грей, П. МакБрайн, Т. Коннолли, Г. Гарсия-Молина, Дж. Ульман, Дж. Уидом, Г.

Видерхольд, Дж. Б. Рутни, Я. Саито, Б. Кемме, Я. Амир, М. Висманн, И.Л. Братчиков, В. Вапник, А.М. Вендров, Э.Э. Гасанов, С.В. Емельянов, И.А. Ефремов, Л.А. Калиниченко, М.Р. Когаловский, В.Б. Кудрявцев, С.Д. Кузнецов, А.Н. Наумов, Б.А.Новиков, И.П. Норенков, И.И. Румянцева, И.В. Сергеев, А.В. Силин, Б.Я.

Советов, Л.Б. Соколинский, А.Ю. Фадеев, В.М. Цыганков, А. Червоненкис, М.Е.

Ярошевич и др.

Подавляющее большинство работ в качестве объекта рассматривает многопользовательские системы баз данных, ориентированные на информационное обслуживание совместной деятельности людей в рамках организации. Предметная область таких систем обычно сильно структурирована и содержит ограниченный типовой набор объектов и связей, мало изменяющийся с течением времени. При этом с интегрированными в системе данными работает множество пользователей с разными точками зрения на эти данные, соответственно, необходимо согласовывать внешние модели данных, выводя общую концептуальную инфологическую модель.

Для персональных систем баз данных ситуация прямо противоположная:

один пользователь обладает одной точкой зрения, но его жизненные интересы крайне разнообразны, соответственно, предметная область слабо структурирована и включает много разнородных объектов и связей, множество которых существенно изменяется с течением времени. Традиционные подходы к организации баз данных, будучи применены к персональным базам данных, приводят к необходимости существенного участия в ее функционировании профессионалов в информационных технологиях: системных аналитиков, программистов, администраторов баз данных. Если для управления данными организации обычно используется штат таких профессионалов, то каждый персональный пользователь не может себе этого позволить. Для него остаются только те возможности по управлению данными, которые он может задействовать сам. Обычно это приводит к ручной классификации документов и файлов данных по вручную созданной иерархической системе каталогов, и другим элементам научной организации труда. Однако информационный поток по множеству тем, интересующих персонального пользователя, выросший во много раз с появлением возможности получения данных из глобальных сетей, значительно превосходит возможности одного человека по его ручной обработке.

Если для корпоративных баз данных теоретическому осмыслению отдельных задач администрирования уделяется внимание, то работы по созданию теоретических основ организации персональных баз данных, а также по разработке принципов автоматизации администрирования систем персональных баз данных практически отсутствуют.

Таким образом, разработка математического и программного обеспечения адаптивных систем персональных баз данных является одной из важнейших научно — технических проблем.

Цель работы. Целью диссертационной работы является разработка теоретических положений, математического и программного обеспечения адаптивных систем персональных баз данных.

Для достижения намеченной цели были поставлены и решены следующие задачи:

Разработаны принципы структурирования информации в персональных базах данных на основе концепции транспарентного администрирования систем персональных баз данных.

Разработаны принципы организации адаптивных систем персональных баз данных.

Разработаны теоретические основы и методы организации систем расширенного администрирования систем персональных баз данных.

Разработана архитектура системы расширенного администрирования систем персональных баз данных, предложена методология проектирования ядра автоматизированных систем расширенного администрирования систем персональных баз данных.

Разработано математическое и программное обеспечение ядра системы расширенного администрирования систем персональных баз данных.

Методы исследования. В диссертационной работе использованы методы теории множеств, теории вероятностей, методы оптимизации, теории структурного анализа, теории баз данных и др. При программной реализации предлагаемых методов и алгоритмов использованы технологии объектно-ориентированного, структурного и модульного программирования.

Научная новизна. Научная новизна работы заключается в следующем:

1. Разработаны теоретические основы построения и администрирования адаптивных систем персональных баз данных, в том числе модели поиска, восприятия и усвоения информации пользователем, модели генерации запросов, модели потерь при обслуживании запросов, модель представления данных пользователем, модели надежности систем персональных баз данных, модели порождения и устранения ошибок, модели мониторинга ресурсов, модели взаимодействия администрирующих приложений.

2. Предложена и обоснована концепция кинематического подхода к проектированию персональных баз данных.

3. Cформулированы и обоснованы принципы проектирования и построения систем расширенного администрирования систем персональных баз данных.

4. Разработана архитектура адаптивной системы расширенного администрирования систем персональных баз данных.

5. Разработано алгоритмическое и программное обеспечение ядра адаптивной системы расширенного администрирования персональных баз данных.

Практическая значимость. Достоверность научных положений, выводов и рекомендаций, разработанных в диссертации, подтверждена результатами их практического использования. Результаты диссертационной работы внедрены в учебный процесс Московского государственного университета приборостроения и информатики, в ООО «Сименс», STOCRETRADE Ltd., ООО «Актавис», ЗАО «Дельта Системс», ЗАО «Титан Мета», ЗАО «ИТ-Центр», ООО «Информ Проект», ООО «Р.В.С.», ООО «Иверс», ООО «Промышленно-строительная компания «ОПТАУН», ООО «Фирма «Солбис», о чем имеются соответствующие акты.

Разработанные в диссертации концепции, методы и принципы внедрены и широко используются в учебно-методических пособиях по дисциплинам «Базы данных» и «Управление большими базами данных». На программные средства, разработанные в диссертации, получены свидетельства о регистрации в Федеральной службе по интеллектуальной собственности, патентам и товарным знакам (РОСПАТЕНТ).

Апробация результатов работы. Основные результаты диссертационной работы докладывались на международных конференциях «Фундаментальные и прикладные проблемы информатики, приборостроения и экономики» в г.Сочи в 1998-2006 г.г., международной научно — технической конференции «Информатика – 2005» в г. Воронеж в 2005 г., международных научно – технических конференциях «Новые информационные технологии» в г.Москва в 2002-2006 г., научно – технических семинарах и конференциях кафедры «Персональные компьютеры и сети» МГУПИ.

Публикации. По основным результатам диссертационной работы опубликована свыше 50 печатных работ, из них 7 — в изданиях, рекомендованных ВАК РФ для публикации результатов докторских диссертаций.

Структура и объем работы. Диссертация состоит из введения, 6-ти глав, заключения и библиографического списка. Общий объем работы — 383 страницы текста, из них 337 страниц — основное содержание, включая 68 рисунков и таблиц, 13 страниц — приложение (акты о внедрении результатов диссертационной работы, свидетельства об официальной регистрации программ для ЭВМ), страницы — библиографический список (357 наименований).

СОДЕРЖАНИЕ РАБОТЫ

Во введении дана краткая характеристика решаемой проблемы, обоснована актуальность темы, сформулированы цель исследования, основные задачи и положения, выносимые на защиту, приведен обзор диссертации по главам.

В первой главе проведен анализ современного состояния технологий, поддерживающих информационную работу индивидуального пользователя, в том числе баз данных (БД). Определены основные проблемы в области организации, проектирования, сопровождения и администрирования персональных баз данных (ПБД) и возможные пути их решения. Сформулированы общие требования к системам ПБД (СПБД), а также специфические требования к их адаптивности.

Разработке теоретических вопросов и прикладных задач, связанных с созданием эффективных корпоративных БД, уделяется значительное внимание исследователей и разработчиков, однако полученные ими результаты не всегда применимы при организации СПБД, поскольку большую важность приобретает поддержка новых функций, обеспечивающих максимально полное удовлетворение значительно более разнообразных пертинентных информационных потребностей пользователей (ИПП) на очень больших интервалах времени, а в перспективе — на протяжении всей жизни пользователя.

Появление новых функций приводит к росту нагрузки на пользователя СПБД в части ее администрирования. Практическим вопросам автоматизации администрирования корпоративных БД уделяют внимание все крупнейшие фирмыпроизводители СУБД (в их числе Oracle, IBM и Microsoft, выступившие с программами поэтапной автоматизации администрирования БД, рассчитанными на долгосрочную перспективу). Внимание к вопросам администрирования СПБД со стороны как разработчиков, так и исследователей, ограничивается традиционными задачами — управлением ресурсами памяти и производительностью. В то же время, остаются не решенными многочисленные задачи администрирования СПБД, порождаемые несоответствиями между ИПП и возможностью их удовлетворения. Предложенный в работе подход к организации адаптивных СПБД позволяет значительно сократить количество таких несоответствий.

Задачей администрирования СПБД является обеспечение максимальной транспарентности взаимодействия пользователя с БД, чему соответствует минимизация потока коллизий при максимально полном удовлетворении информационных и, в результате, витальных потребностей пользователя. Степень транспарентности администрирования определяется относительным количеством возникающих в процессе удовлетворения ИПП коллизий.

Выражение витальных потребностей, а, соответственно, форма, семантика и объем, требуемой информационной поддержки, существенно зависит от состояния пользователя, претерпевающего изменения со временем. Текст, описываюP щий совокупную ИПП T, представляет собой объединение текстов TjP, описыP P вающих частные ИПП: T t t.

T j j Каждая из функций ПБД может быть описана текстом, а вся система может быть представима текстом:

S Текстовое описание СПБД T представляет собой совокупность описаний S S S отдельных функций СПБД T : T t t, и находится в функциональной заT i i i P S P висимости F от T : T t FT t. Зависимость F отражает наличие принципиальной возможности реализации системой группы частных ИПП. Она зависит от текущего состояния пользователя, однако, базовая часть ПБД может быть достаточно стабильной: ее зоны будут лишь активизироваться в нужное время. Выделены две основные группы задач администрирования: выбор и настройка программных приложений и создание БД, содержащей необходимую информацию.

Поток административных задач определяется построением системы:

P t F FT t. Функциональная зависимость FAt отражает интенсивность A порождения задач администрирования при данной концептуальной организации ПБД и ее конкретной аппаратно-программной реализации. На этом уровне возникает две группы задач по администрированию: техническое администрирование и семантическое администрирование.

Поток коллизий, порождающий поток административных задач, зависит от R текущего уровня подготовки пользователя T t:

R P R t F t,T t F F F t, t.

T T K K K A j j j j Как техническое, так и семантическое администрирование требует оптимизации функциональной зависимости FK ( t ) для обеспечения согласования языка СПБД с языком активного словаря пользователя. Задачей создания транспарентно-администрируемой СПБД является определение и адаптивное изменение функциональных зависимостей FK,FA,F, при заданной номенклатуре и динамике потока ИПП, а также заданного уровня транспарентности текстов взаимодействия пользователя с системой, таким образом, чтобы в идеальном случае выполнялось соотношение t 0. В качестве характеристики приближения ПБД к идеальK ному случаю вводится понятие степени транспарентности, как отношения исходного потока команд ( t ), сформированного пользователем, к потоку команд КП воспринятых системой :

К КП ( t ) К ( t ) ( t ) ( t ) K( t ) 1 1 ( t ) К ( t ) К ( t ) К ( t ) при ( t ) 1.

Степень транспарентности зависит не только от организации системы администрирования, но и от транспарентности языка пользователя, языка интерфейса СПБД, языков интерфейсов используемых приложений и интерфейса администрирования.

Выделим в качестве критериев качества СПБД две взаимосвязанные группы параметров: степень соответствия организации и структуры СПБД информационным и витальным потребностям пользователя и ее транспарентность по отношению к непрофессиональному пользователю, т.е.

P R RE t min при max и T T T, K j j k j j k RE где T — слова активного словаря пользователя.

k Во второй главе подробно рассмотрены концептуальные основы повышения адаптивности СПБД и, в том числе, факторы, влияющие на формирование предметной области индивидуального пользователя, рассмотрена оптимизация функций СПБД, оптимизация отражения ИПП и критерии качества их удовлетворения, а также влияние на это качество эффективности процессов администрирования СПБД.

Предлагаемая концепция оптимизации СПБД включает несколько основных положений: предметная область ПБД должна максимально полно отражать явные и скрытые пертинентные ИПП; СПБД должны быть ориентированы на длительный срок эксплуатации (в идеальном случае на всю жизнь пользователя); структуризация данных, их модель и меры по обеспечению их доступности должны быть ориентированы на удовлетворение ИПП и учитывать особенности и ограничения человеческого восприятия информации; СПБД должны обеспечивать выполнение функций по управлению процессом удовлетворения пертинентных ИПП; СПБД должны обеспечивать выполнение функций по их расширенному администрированию.

Неполное отражение предметной области пользователя порождает как явные, так и скрытые, во многих случаях проявляющиеся значительно позднее оптимального времени удовлетворения информационной потребности, потоки коллизий. Проблему оптимизации ПБД по полноте отражения предметной области пользователя решает предложенная двухуровневая организация ПБД, где первый исходный уровень содержит типовую информацию потенциально необходимую в процессе жизнедеятельности пользователю, а второй уровень — развивается и дополняется в соответствии с ИПП.

Оптимизация ПБД с учетом большого жизненного цикла предполагает выделение в ней актуальной зоны данных, поскольку в течение жизненного цикла степень актуальности информации изменяется, а к некоторым видам информации после ее восприятия больше не возвращаются никогда. Формирование актуальной зоны производится на основе текущих ИПП с учетом типовой составляющей скрытых пертинентных ИПП, определяемой в основном возрастом и состоянием пользователя. Типовая составляющая ИПП весьма объемна, соответственно целесообразно выделение в ней относительно небольших активных зон, совокупность которых, связанная единой целью, образует доминантную зону ПБД.

Актуальные ИПП проявляются в виде последовательности информационных запросов (см. рисунок 1).

Доминирующий стимул Анализатор Выбор на- Ранжирование семантики бора клю- ключевых стимула чевых слов слов Информ.

запрос Тезаурус пользова- Выбор варителя анта запроса Ответ на Принятие Принятие решения запрос Анализатор решения о о пополнении теответа на соответствии зауруса вариант заответа стипроса мулу Рисунок 1 — Модель генерации единичных информационных запросов За счет возникновения коллизий время удовлетворения ИПП возрастает на величину, равную времени устранения коллизии (для коллизий типа отказа):





tУП tУП Ш tУК, где t — полное время удовлетворения ИПП, tУП Ш — время удовлетворения УП ИПП в штатном режиме, t — время устранения коллизии.

УК Предложено оценивать эффективность СПБД по совокупным временным потерям Loss:

tУП Loss FПОТ tУП WtУП dtУП, где WtУП — вероятность удовлетворения ИПП за время t, FПОТ tУП — функция УП потерь.

Показано, что экспоненциальный характер функции потерь tУП K T F t Ae ПОТ УП приводит к следующему виду выражения для совокупных временных затрат:

tУП tУП TМ 2 K tУП tУП K K T Loss Ae WtУП dt tУП W tУП WtУП ...dt W T 1! T 2! 0 2 KM tУП K DtУП K M tУП 1 ...

2 T T T Функция потерь в общем случае зависит от типа приложения или типа поддерживаемого им информационного процесса. Если система обслуживает N различных процессов, то каждый канал обслуживания может быть охарактеризован распределением времен задержки W t и функцией потерь F t, отражающий i ПОТ i особенности именно этого канала. Тогда потери по каждому каналу составят Loss :

i tУП Lossi FПОТ i tWi tdt.

Показано, что потери в целом аддитивны:

tУП N N Loss Loss F tW tdt.

i ПОТ i i i1 i В некоторых случаях возможно упрощение задачи. В данном случае вес канальных потерь учтен в характере функции F t, поэтому для общих потерь ПОТ i справедливо выражение:

N tУП N NП П П Loss Lossi pi NУ tИЗ Ш FПОТ iNУ tИЗ Ш pi tFПОТ itdt.

1 Wi i1 i1 iИспользуя предложенный критерий минимизации общих временных потерь при обслуживании запроса можно количественно оценивать уровень эффективности различных способов построения СПБД.

Оптимизация построения СПБД предполагает учет существенных особенностей восприятия, запоминания и забывания информации пользователем, среди которых особую важность имеют ограничения на объем и скорость предъявления отдельных фрагментов информации. Из представлений о механизмах долговременной памяти наибольшим влиянием в настоящее время пользуется гипотеза об долгосрочных изменениях синаптической проводимости при повторяющихся картинах возбуждения, хотя и гипотеза о молекулярном субстрате памяти регулярно привлекает внимание исследователей.

Распространенные модели памяти не отражают в явном виде многоуровневый способ организации памяти, в основе которой лежит уровень рецепторов сенсорной информации, а каждый последующий иерархический уровень обобщает информацию, поступающую от нижележащих уровней, создавая из нее синтетические образы. Рецепторы преобразуют физические воздействия в первичные сигналы ощущений различной модальности, при этом модальность рецептора однозначно определяется его координатами, а информацию о воздействии несет только частота сигнала.

По мере передачи данных по уровням снизу вверх происходит перекодирование комбинаций стимулов в устойчивые синтетические образы, отражающие как интенсивности стимулов, так и координаты их источников. В простейшем случае синтетический образ имеет линейную структуру и составлен из записей фиксированной длины, представляющих собой пары (адрес источника; интенсивность стимула), причем значения таких записей повторяются.

В диссертации предлагается модель, учитывающая иерархическую структуру памяти, представляющую собой совокупность элементарных накопителей разных уровней — «лент памяти» — на которые записываются символы из некоторого алфавита, ассоциированного с каждой лентой. Важной характеристикой каждого текста является набор частот вхождения в него отдельных символов f (l).

j Показано, что при некоторых упрощениях модель адекватно описывает процессы поиска информации в иерархической системе памяти, при этом поток информации определяется выражением:

t t t I ( t ) n ... fn( t )dt fn1( t )dt... f1( t )dt.

n 0 0 0 Полученная формула позволяет оценить время воспроизведения некоторого объема информации I :

V IV n! t( IV ) .

n n fi i При психологически допустимом времени вспоминания, равном 5 секундам, и частоте предъявления раз в сутки ( 105 c1) по оценке на двухуровневой модели информации поступает в 2,5 раза больше, чем по оценке на одноуровневой модели. Следует отметить, что рассматриваемые оценки связаны нелинейной зависимостью, которая для некоторых случаев приведена на рисунке 2.

На рисунке 3 приведено изменение относительного количества воспроизведенной информации в зависимости от числа уровней для различных значений психологически приемлемого времени воспроизведения/вспоминания. Из рисунка 3 видно, что при небольшом числе уровней многоуровневая модель дает большие величины относительного количества информации, а при малом времени воспроизведения быстро падает после прохождения максимума. Учет этих фактов особенно важен при анализе процессов взаимодействия пользователя с информационной системой с использованием образной информации.

J n=n=n=n=t, с 1 2 3 4 5 Рисунок 2 — Оценка относительного количества воспроизведенной информации (tRk f1)nf в зависимости от времени воспроизведения J n! J 4 t=2c t=3c t=4c t=5c n 1 2 3 4 5 6 7 8 9 Рисунок 3 — Относительное количество воспроизведенной информации в зависимости от количества уровней В третьей главе разработаны принципы организации ПБД. Предложены способы отражения в ПБД подобластей предметной области и кинематический подход к проектированию БД.

Область ИПП можно представить как иерархическое объединение тематических подобластей, содержащих объекты, состоящие из последовательностей символов, чисел, слов естественного или искусственного языка. Элементарный объект представляет собой знакоместо (словоместо) — знак/слово и его координаты в пространстве и времени. Детализируя образный информационный объект, получаем точечный элементарный образ — геометрическую точку. Счетное множество таких комбинаций (кадров) образуют универсум. Множество координат активных точек K любого кадра определяется выражением:

K x | S(x) S & t iT, где x — вектор координат точки кадра, Sx — активность точки изображения, воспринимаемая субъектом, S — пороговая активность, T — период дискретизации изображения зрительным анализатором субъекта, t — текущее время, i — номер отсчета.

Множество координат активных точек кадра-реализации образа при его формировании определяется выражением:

O x | S(x) S & Э Э & t nT, 0 где t — текущее время, n — число отсчетов статичности кадра, Э — уровень эмоционального состояния при наблюдении кадра, Э — пороговый эмоциональный уровень.

Каждому естественному образу предмета O, согласно Н.И. Жинкину, соотj ветствует универсально-предметный код УПКO :

j Oj Oi |УПК УПКOj , j где Oi — i -я реализация образа O.

j j Конкретные реализации образа у разных индивидуумов могут различаться, однако, если они знакомы с данным предметом, то имеется высокая вероятность совпадения большого числа реализаций. Именно эта особенность образной коммуникации делает ее очень эффективной в качестве универсальной системы структуризации предметной области, ее интеграции, а также при взаимодействии компьютерной информационной среды с неподготовленным пользователем. ИПП при это представляется множеством образов:

S P { Oj | Э( OkS,Oj ) 0 Э( Ok,Oj ) 0 }, где P — ИПП, Oj — множество образов результата удовлетворения ИПП, OkS — S множество стимулов, Э( Ok,Oj ) — эмоциональный уровень при неудовлетвореS нии внешнего стимула, Э( Ok,Oj ) — эмоциональный уровень при удовлетворении внешнего стимула.

Основой структуризации предметной области индивидуального пользователя может служить сочетание в базовой системе структуризации образного и метаобразного представления информационных объектов предметной области и пространственно-временной системы координат.

В диссертации предложен кинематический подход к проектированию ПБД, опирающийся на универсальность пространственно-временного описания как физических, так и информационных объектов. Любая сущность всегда имеет координаты рождения и непрерывную линию (траекторию) жизни, а связь сущностей отражает условия вхождения их в область контакта. Траектория перемещения в пространстве времени любого материального объекта уникальна. Если существует зона взаимодействия некоторых типов объектов, то для их взаимодействия необходимо, по крайней мере, присутствие этих объектов в данной зоне в определенное время. Тогда условие взаимодействия некоторого количества объектов можно описать системой уравнений, определяющих положение объектов в пространстве-времени.

Использование календарного времени и географических координат места рождения объекта, позволяют полностью его идентифицировать. Рождение в одной точке пространства в одно и тоже время двух и более физических объектов в рамках классической физики считается невозможным событием. В результате кинематическая картина предметной области, органично отражающая ее динамику, полностью определяется координатами рождения/ уничтожения объектов и их линиями жизни. В первом приближении можно положить, что взаимодействие между объектами может наступить лишь на время совпадения координат линий жизни объектов. Моменты взаимодействия l ( j,i), где l 1,2...L — номер акта j,i взаимодействия объектов с номерами i и j, определяются из решения уравнения:

K (t) Ki (t) , j j,i где Ki (t) — вектор координат объекта с номером i, — вектор размеров обj,i ласти взаимодействия объектов.

Время перемещения объекта между соседними зонами взаимодействия определяется выражением:

(k,k 1) g g (k, k 1) (t)dt, j v j g где (k, k 1) — норма вектора расстояния между двумя соседними точками, j g v (t) — вектор скорости перемещения j-го объекта при перемещении по g-ому j фрагменту его маршрута, (k, k 1) — время перемещения между соседними зонами.

Положение объекта в пространстве является непрерывной функцией времени, и именно это является фундаментальной основой для формализации предметной области и упрощения проектирования ПБД. В диссертации показано, что все изложенное применимо с некоторыми оговорками и к информационным объектам. Предложено в дополнение к глобальным координатам использовать аналоги пространственных локальных координат путем именования некоторых связных групп информационных объектов, например, имен папок и файлов.

Показано, что если поиск ведется последовательным выбором информационных объектов, переходя с более высоких уровней на более низкие уровни иерархии, то время анализа без учета возвратов и повторов составит V 1 V V ( N ) ( ), a ii v i N v v i i1 i i i где V — объем информационного массива, N — количество файлов на i -м уроi вне массива, — среднее время чтения и осмысления слова.

Так как время анализа ограничено психологически допустимым, то при увеличении числа единиц хранения неизбежно возникают многочисленные коллизии.

Уменьшить этот поток позволяет создание иерархической системы хранения, но, как показано в диссертации, оптимальное число уровней иерархии ограничено несколькими единицами.

Предложено при значительном росте объемов слабоструктурированной информации использовать в качестве основы системы управления такими базами данных информационно-поисковую систему в сочетании с созданием текущей актуальной зоны ПБД. Использование информационно-поисковой системы как формирователя виртуальных уровней иерархии, в сочетании с кинематическим подходом, позволяет гибко изменять координаты структуризации слабоструктурированных областей ПБД, обеспечивать создание между ними связей, а также обеспечивать связь с локальными базами сильноструктурированных данных.

В четвертой главе исследованы процессы администрирования БД, предложена организация системы администрирования СПБД и пути автоматизации основных этапов ее администрирования. Предложена методика управления искусственными объектами как основной механизм автоматизации расширенного администрирования СПБД.

Задача администрирования представима как определение атомарной причины коллизии и последующее устранение этой причины:

i i i FЗЗti, xiЗ K tk, xk ; TЗ i, i i i FК K tk, xk PRi; TК i, F PR PR ; T , ПР i / i1 i a i PR i где F — функция преобразования запросов в коллизии, T — набор тестов З З i для нахождения видов коллизий по запросам, FК — функция преобразования коллизий в причины 1-го уровня, T — набор тестов для нахождения причин К i коллизий, F — функция преобразования причин, T — набор тестов для ПР i / i1 PR i нахождения причин нижнего уровня.

Одним из проявлений ограничений естественного характера является ограниченная надежность БД, использование для ее оценки параметра «поток отказов» упрощает анализ сложных систем, поскольку в этом случае характеристикой их надежности будет интенсивность суммарного потока отказов и вероятность безотказной работы всей системы составит N t t N N 1 i i t t.

e i e i i1 iАналитические модели надежности программного обеспечения используют функцию надежности t и интенсивность потока отказов:

1 dt t .

t dt При этом предполагается, что все ошибки в программном обеспечении независимы и проявляются в случайные моменты времени с постоянной средней интенсивностью. Интенсивность потока отказов предполагается пропорциональной числу оставшихся ошибок m : cm .

0 Если в процессе исправления ошибок новые не вносятся, то интенсивность dm исправления ошибок будет равна интенсивности их обнаружения: .

d С учетом этого можно определить зависимость m :

m M e c .

Тогда cm0 cM cM cMe c cMe c.

Модель надежности СПБД, учитывающая отказы как аппаратного, так и программного обеспечения, вызванные естественными ограничениями, представлена в виде потока отказов с интенсивностью:

АЕ ПО N N NПР A П ПР, c cБД ПР, j СУБД П БД сБД M e c M e iA П ПР,i ПР, j ПР, j БД iA i1 j где — суммарная интенсивность отказов аппаратного обеспечения по причиАЕ не старения, — суммарная интенсивность отказов программного обеспечеПО ния из-за скрытых ошибок, i — интенсивность отказов i-го аппаратного модуля.

A Количество ошибок в БД изменяется в соответствии с соотношением:

dn t БД K K n t t.

1 2 БД n dt Если рассматривать БД как динамическое звено, на входе которого присутствует воздействие , порождающее на выходе суммарное количество ошибок в n БД nt, то его передаточная функция имеет вид:

1 K1KKs .

s K1Ks K1KОтклик звена с такой передаточной функцией равен K ns s.

n s K K 1 В таблице 1 приведены наиболее важные типовые воздействия — характер изменения nt и их изображения ns, изображение отклика nБД s и динамики изменения количества ошибок в БД nБД t.

Таблица 1 — типовые воздействия на БД и отклики на них № t s n s n t n n БД БД п/п ' 1 K K 1 t 1 e tK K K K 1 s K K 1 1t 1 K K1 e tK1K2 s s s 1 K1K2 3 t 1 K K tK1K1 e Kt s K1K s2 s 1 K1K2 К аналогичным результатам приводит рассмотрение процесса появления и исправления ошибок в виде схемы с обратной связью. При этом БД представляетKся интегрирующим звеном с передаточной функцией W1 , а функция админиS стрирования — пропорциональным звеном обратной связи с передаточной функцией W2 K2.

Передаточная функция такой системы имеет вид:

W1 K1 / S KW .

1W1W2 1 K1 / SK2 S K1KМодель процесса устранения ошибочных действий пользователей представлена системой с передаточной функцией K W K K АДМ 1 Ф Ф W .

ОШ. Д.

1 W K K s K K 1 Ф АДМ Ф АДМ s K K Ф АДМ Отклик этой системы на постоянное воздействие t имеет вид:

ИЗМ K АДМ s s.

ПС.О ИЗМ s K K Ф АДМ Отклик этой системы на основные виды воздействий t соответствует ИЗМ ' данным таблицы 1. При этом строка 1 ( t 1 t) соответствует следующим ИЗМ ситуациям: освоение (приобретение опыта, навыков) пользователем работы с СПБД; освоение новых приложений; освоение изменений правил работы с СПБД.

Строка 2 ( t1t) моделирует долговременные условия пользования:

ИЗМ уровень общей компетенции пользователя и его психофизических возможностей.

Строка 3 ( t t ) моделирует изменения таких показателей, как психоИЗМ физическое состояние пользователя (например, при накоплении усталости, ослаблении внимания и т.д.).

Основным способом исключения отказа СПБД по причине ограниченности ресурсов является ведение постоянного мониторинга их состояния СПБД и прогнозирование его изменений.

Период мониторинга T в общем случае должен зависеть от текущеМ.Р.

М го запаса ресурса и его порогового значения:T f R, R . В нашем слуМ.Р. ЗАП i ПОР i чае спектр функции изменения запаса ресурса принципиально неограничен, поскольку рассматриваемая функция имеет нерегулярную природу. Используя прямое преобразование Фурье можно записать:

RF j R0ebte jtdt .

b j Для определения граничной частоты задается минимальная амплитуда гармоники, которую нужно оставить в спектре, как доля от максимальной амплитуды: FГР FMAX .

R R b 0 Тогда F и 1 .

ГР ГР 2 b b ГР С учетом выражения для ГР, частота мониторинга без потерь информации 2b 1 fM , а соответствующий период мониторинга TM .

fM 2b 1 Показано, что применение для определения частоты мониторинга обратно пропорциональной зависимости от текущего запаса ресурса дает приемлемые результаты: f t f .

М Rt Специфические особенности СПБД как объекта управления, в том числе необходимость управления искусственными информационными объектами с целью обеспечения бесперебойного доступа пользователя к релевантной и пертинентной информации, делают целесообразной разработку общих теоретических подходов к автоматизации администрирования СПБД.

В диссертации предложена система базовых типовых операций по управлению информационными объектами, включающая операции частичного, полного и аддитивного копирования, а также операцию по управлению адресацией. При этом показано, что эти операции позволяют решить основные задачи автоматизации администрирования путем управления информационными объектами.

Основой системы автоматизации администрирования СПБД является специальная база данных (СБД), содержащая все данные о состоянии СПБД и пользователя (см. рисунок 4).

СПБД СУБД Пользователь Мониторинг пользователя ПБД Мониторинг СПБД Формирование и Приложения прием запросов пользователей СБД Формирование Определение СА СПБД администрирующих типов коллизий воздействий Определение причин коллизий Определение Определение коор- Классификация функции качества динат коллизий причин коллизий Рисунок 4 —Процессы администрирования на основе специальной базы административных данных В пятой главе разработана архитектура адаптивной системы администрирования СПБД, а также ее алгоритмическое обеспечение. Создание информационно-аппаратных резервов является основой автоматизации процессов администрирования СПБД. При этом возникает новый класс задач администрирования, включающих, например, управление формированием ИПП, управление процессом обучения и др. Архитектура адаптивной автоматизированной системы администрирования (СА) СПБД показана на рисунке 5. В диссертации подробно рассмотрены все модули СА СПБД.

ПБД Информационные Поставляемая Развиваемая резервы часть часть Коммутатор резервов Программные среды Модуль управления памятью Сервер СА СПБД Монитор Диспетчер СУ СБД Клиенты резервов состояния Приложения ПБД САА ПБД СБД Рисунок 5 — Архитектура адаптивной системы администрирования СПБД Создание информационно-аппаратных резервов является основой автоматизации процессов администрирования СПБД. Создание этих резервов может инициироваться различными приложениями, обслуживающими решение отдельных задач администрирования. Функции их координации выполняет модуль Диспетчера резервов. Введение резервов в действие требует, во-первых, мониторинга состояния СПБД, во-вторых, принятия решения о вводе резервов, и, в-третьих, реализации этого решения. В СА СПБД эти функции выполняют соответствующие функциональные модули: Монитор состояния, Монитор резервов и Коммутатор резервов. Диспетчер резервов принимает заказы на размещение резервной информации и обладает полной информацией о состоянии информационных и аппаратных резервов. Монитор состояния производит сбор и предварительную фильтрацию информации, отражающей не только состояние СПБД, но и процессов взаимодействия пользователя с СПБД.

Администрирующие приложения запрашивают информацию из СБД о состоянии СПБД, действиях пользователя, о коллизиях в СПБД, состоянии и размещении резервов и т.п. На основе этих данных приложения формируют заказы на перемещение резервов, создание новых информационных объектов и другие операции по обеспечению администрирования. Такое построение СА СПБД обладает следующими достоинствами: разгружает СУБД от обработки служебной (административной) информации, позволяет обеспечить согласованность администрирования локальных задач, позволяет обеспечить доступность данных даже при выходе из строя значительной части СПБД (за счёт организации автономной системы администрирования).

Особенностью предлагаемого решения является наличие независимой аппаратно-программной системы автоматизации администрирования. Она включает часть информационных резервов, Коммутатор резервов, Сервер СА СПБД, Диспетчер резервов, Монитор состояния СПБД, СБД СА СПБД и СУ СПБД. Автоматическое введение в действие резервов осуществляется с помощью Коммутатора резервов.

Важнейшим модулем СА СПБД является Модуль управления памятью (см.

рисунок 6). Это связано с тем, что наиболее распространенные программные среды, предназначенные для индивидуального непрофессионального пользователя, используют файловые системы памяти и не предусматривают инструментов поддержки автоматизации управления памятью. Основными функциями Модуля управления памятью являются: обеспечение сопряжения с используемыми программными средами; автоматическая идентификация активной программной среды; интерпретация команд Сервера СА СПБД по управлению памятью; формирование команд управления, адекватных данной программной среде, на поиск, запись, перемещение и копирование информационных объектов по запросам Сервера СА СПБД.

Клиент Иденти- Формирова- Интерфейсы СА БД фикатор тели команд связи с протипа управления граммными запроса в программ- средами ных средах Идентификатор типа активной программной среды К серверу К программным СА БД средам Рисунок 6 — Структура модуля управления памятью СА СПБД Модуль Информационные резервы представляет собой набор клиентских частей, принадлежащих специально выделенным ресурсам резервной памяти (часть объёма памяти основной СПБД, память третичных запомнающих устройств, память СА и т.п.), а также включает информацию о размещении актуальных сведений во внешних ресурсах, в т.ч. в Интернете. К основным функциям модуля Информационные резервы относятся: управление собственными запоминающими устройствами (возможно, разного типа), полностью или частично выделенными под хранение резервной информации; управление поиском и размещением в собственных запоминающих устройствах резервной информации ранее размещенной в сторонних запоминающих устройствах; интерпретация команд Сервера СА СПБД по управлению информационными резервами; обеспечение взаимодействия с модулем Коммутатор резервов.

Модуль Монитор состояния СПБД включает программные средства, позволяющие отслеживать текущее состояние аппаратного и программного обеспечения СПБД. В работе обоснована целесообразность укрупнённого мониторинга на уровне отдельных устройств, что позволяет положить в основу мониторинга штатные средства контроля этих устройств. Основными функциями модуля Монитор состояния СПБД являются: сбор информации о состоянии устройств; обеспечение тестового контроля; нормализация данных о состоянии СПБД; генерация отчетов о текущем состоянии СПБД; инициация приложений по анализу и устранению коллизий; передача данных о состоянии СПБД в СБД СА СПБД.

Модуль Коммутатор резервов обеспечивает инициацию подключения тех или иных информационных резервов по требованию модуля Диспетчер резервов.

К основным функциям модуля Коммутатор резервов отнесятся следующие: предоставление пользователю резервных копий информации по командам СА СПБД;

подключение резервных устройств по командам СА СПБД; обеспечение маршрутизации при создании резервов информации.

Модуль Диспетчер резервов обладает полной информацией о наличии и размещении копий данных, на основе которой, а также с учётом состояния СПБД и информационных потребностей пользователя, принимает решения обо всех изменениях в составе и номенклатуре информационных резервов. Основные функции модуля Диспетчер резервов заключаются в следующем: формирование команд на перемещение и создание информационных резервов; создание и ведение журнала учета информационных резервов; контроль состояния резервов и их доступности; инициация работы администрирующих приложений.

Решение задач администрирования в автоматизированном режиме требует создания и ведения специальной базы данных, которые отражают как динамику изменения состояния СПБД, так и динамику изменения во времени информационных потребностей пользователя. Основными функциями системы управления СБД являются: интеграция и совместное использование данных административного назначения различными администрирующими приложениями; поддержка разнообразных представлений одних и тех же административных данных; поддержка целостности и безопасности данных; поддержка неизбыточности административных данных; поддержка возможности работы с потоковыми данными;

поддержка темпоральности; поддержка расширяемости базы данных.

Унифицированный способ взаимодействия модулей СА СПБД друг с другом, а также с программными приложениями СА СПБД обеспечивает специальный модуль Сервер СА СПБД. Его наличие, кроме всего прочего, придаёт системе автоматизации администрирования дополнительную гибкость и поддерживает мероприятия по ее модернизации.

Автоматическое выявление информационных потребностей пользователя возможно лишь путем анализа его взаимодействия с информационной системой.

Сбор исходных данных для такого анализа является главной функцией модуля Монитор состояния пользователя. Основными функциями модуля Монитор состояния пользователя являются: сбор информации о воздействиях пользователя на информационную систему; сбор информации о реакциях пользователя на ответы информационной системы; нормализация информации о взаимодействии пользователя с СПБД; фильтрация информации о взаимодействии пользователя с СПБД для хранения ее в структурированном виде в СБД; сжатие полной информации о состоянии пользователя с целью долговременного ее хранения с возможностью извлечения из нее полезных данных в будущем; обеспечение взаимодействия с СБД и администрирующими приложениями.

Для адаптивных СА СПБД на первый план выходит решение новых, специфических задач администрирования, кардинально отличных от традиционных задач администрирования корпоративных БД. В диссертации большое внимание уделяется вопросам организации взаимодействия с основными типами приложений, характерных для индивидуальных пользователей: автоматический поиск информации в глобальной сети; автоматическое прогнозирование ИПП (ОРАКУЛ);

автоматический анализ соответствия интеллектуального уровня пользователя поставленным целям (ТЕСТ); ведение личной библиотеки (БИБЛИОТЕКАРЬ); автоматический подбор информации воспитательного характера (ВОСПИТАТЕЛЬ);

автоматический подбор информации учебного характера (УЧИТЕЛЬ); автоматический подбор информации образовательного характера (МЕНТОР); автоматическая подготовка сценариев подачи информации (СЦЕНАРИСТ); автоматическая постановка сценариев (РЕЖИССЕР).

Архитектура СА ПБД обеспечивает возможность использования новых типов и новых версий приложений за счет выделения ядра СА СПБД, взаимодействующего с приложениями в клиент-серверном режиме. К основным общим функциям всех Клиентов приложений можно отнести выполнение следующих процедур: инициализация/завершение преобразования адресной информации; информационное взаимодействие с Сервером СА СПБД, с СБД, с модулями СА СПБД. Несмотря на многие общие элементы, клиентские части приложений имеют и существенные отличия, связанные с разной функциональной направленностью приложений. В диссертации подробно рассмотрена структура и организация клиентских частей основных типов приложений.

В силу высокой загрузки сервера обеспечением работы пользователя в интерактивном режиме, выполнением заданий по поиску информации, поддержкой решения разнообразных административных задач от обеспечения надежности до формирования активных и доминантных зон, а так же ограниченности ресурсов клиентов-приложений, возникает проблема обмена и синхронизации данных. В случае роста численности клиентов — администрирующих приложений, ухудшается качество обслуживания клиентов — рабочих приложений и, следовательно, пользователя СПБД, ввиду увеличения времени отклика системы на пользовательские запросы.

В диссертации построена марковская модель процесса синхронизации данных при наличии N рабочих клиентов-приложений (РК) и N администрируюW A щих клиентов (АК). Каждый клиент в случайные моменты времени генерирует запросы на обработку, каждый из которых попадает в неограниченную очередь запросов, причем количество интерфейсов для АК не ограничено. Исследована применимость традиционного метода синхронизации с общей таблицей и очередями запросов и метод двухфазной синхронизации с кешированием, перераспределяющий нагрузку от запросов АК на период пассивного функционирования системы.

Для первого метода показано, что с ростом количества клиентов загрузка системы может достигнуть предельного допустимого уровня. В случае же применения подхода, основанного на использовании кэша, явной зависимости времени выполнения транзакций РК и синхронизации с АК от количества клиентов не наблюдается. При таком подходе все АК производят первый этап синхронизации в своих кэшах, после этого все кэши выстраиваются в очередь для последовательного проведения синхронизации с основной таблицей. Начиная с некоторого значения интенсивности, двухфазный метод становится лучше традиционного, а с точки пересечения кривой традиционного метода с порогом, двухфазный метод оказывается единственным применимым. Для классического метода границей области применимости является кривая, соответствующая интенсивности потока обработки данных сервером. Если сумма значений пиковых интенсивностей потоков запросов превосходит, то такой поток система обслужить не может. Традиционное решение — переход на более производительный сервер. Метод двухфазной синхронизации позволяет и на том же сервере обслужить такой поток запросов.

Получены выражения для границ области эффективного использования метода двухфазной синхронизации относительно количества АК:

1 1 1 1 2N 1 N 4 2 t t 2N t W W W W A A A P S S A N ;, A 1 N 1 A зап 1 где — интенсивность потока запросов от одного РК, — интенсивность поW A тока запросов от одного АК, — интенсивность совокупного потоков запросов W от всех РК, — интенсивность совокупного потоков запросов от всех АК, t — A A время активной обработки клиентских запросов, t — время пассивного функP ционирования системы, t — время, необходимое для выполнения регламентных S операций (штатная репликация, создание резервных копий и т.д.), — интенсивность выходного потока обработанных запросов, — доля запросов, вносимых РК, передаваемая АК, N — количество записей.

зап В шестой главе сформулированы и решены задачи, позволяющие создать концептуальную основу проектирования ядра СА СПБД, а также предложено алгоритмическое обеспечение процессов поиска данных при реализации администрирования СПБД; предложено алгоритмическое обеспечение процессов семантического сканирования как основы интегрирования приложений СПБД; рассмотрены вопросы рациональной организации данных аналитического компонента, реализующего актуальные, активные и доминантные зоны в ПБД и предложены алгоритмы эффективного динамического деления доступного объема памяти.

К основным модулям ядра СА СПБД можно отнести систему интегрирования локальных БД, адаптивную систему динамического структурирования памяти, а также монитор состояния пользователя и специализированную базу административных данных, так как именно эти элементы определяют качество и эффективность работы всей СПБД. К модулям инфраструктуры СА СПБД можно отнести модули, реализующие задачи мониторинга и управления информационными ресурсами и резервами СПБД, в том числе, формированием доминантных зон, распределением памяти и производительностью СПБД.

Использование меню-языка позволяет формализовать процессы анализа семантики взаимодействия, однако наличие потенциально больших и разнообразных подобластей ПБД, поддерживающих и тематические, и управленческие, и администрирующие функции требует особого внимания к организации универсального механизма многомерного анализа, основой которого является аналитический компонент СПБД.

В диссертации разработаны рекомендации по рациональной организации аналитического компонента СПБД. Поскольку в СПБД отсутствует возможность упреждающего планирования структуры аналитической подсистемы, необходимо обеспечить возможность динамического выбора измерений для агрегирования в зависимости от типов запросов, выдаваемых пользователем и приложениями СА СПБД. Для хранения аналитической БД выделяется ограниченный объем памяти, а разным запросам требуется наличие данных, агрегированных по разным измерениям. Предложено часть памяти отвести под хранение квазистатического, в смысле набора агрегируемых измерений, раздела многомерной БД, а оставшуюся память использовать для динамического раздела многомерной БД, хранящего агрегированные данные, использованные в последнем “редком” запросе, который не может быть удовлетворен за счет информации квазистатического раздела.

Прирост эффективности при данном подходе достигается за счет того, что редкие запросы имеют тенденцию к группированию во времени. Если в процессе выполнения первого запроса подготовиться к выполнению последующих аналогичных запросов, построив в динамическом разделе многомерную БД по требуемым измерениям, время выполнения последующих запросов может быть сокращено. Если поступает другой “редкий” запрос, динамический раздел очищается и в нем строится новая многомерная БД, соответствующая новому запросу.

В диссертации решена задача разбиения доступного объема ресурса общей памяти, выделенной для хранения аналитической ПБД, и размещения в квазистатическом разделе агрегированных данных в соответствии со статистикой запросов. Для решения задачи необходимо максимизировать линейную форму:

N PN (X ) xi pi max, iпри выполнении следующего динамического условия:

N xi vi max xi 1 vi V, mod i1,N iгде V — доступный объем, X x , x 0,1, i 1,2,, N — характеристиi i ческий вектор, x 1 если i-й элемент загружается в объем, p — ценовая харакi i теристика i-го элемента, v — объем i-го элемента.

i В зависимости от устойчивости статистики предпочтений предлагается использовать два алгоритма решения этой задачи – точный и эвристический, сложностные оценки которых (соответственно, O (N ln N) и O(N V) ) позволяют осуществить их обоснованный выбор.

На первом шаге точного алгоритма решается базовая задача упаковки:

f0 ( ) fk ( ) max{xk pk fk 1( xk )};k {1,2,...,N}, {0,1,...,V}, xk {0,1} k xk с ограничением: x V, i i где f (v) — стоимость оптимальной упаковки k элементов в объеме v.

k Результатом первого шага является набор оптимальных значений целевой функции f (v) и соответствующих векторов оптимальной упаковки для всех объN емов от V до V исходными элементами. На втором шаге определяется внутрен1 няя динамическая граница упаковки, максимизирующая приведенную линейную * форму при заданном ограничении путем нахождения по условию:

* * * V d( ) R( );

, * * * * V ( 1) d( 1) R( 1);приV1 Vгде V — доступный объем, R( v ) max vi, i : xiv 0, i 1,2,...,N — необходимый остаток объема для размещения максимального по объему неупакованного элемента.

Предложенный двухшаговый эвристический алгоритм позволяет получить рациональное решение с лучшей временной эффективностью. Он использует предварительную сортировку элементов по удельному предпочтению на единицу объема — по убыванию значений. Упаковка осуществляется в порядке расположения элементов в отсортированной последовательности с пошаговой проверкой выполнения ограничений, сводящейся к проверке возможности расположения максимального по объему незагруженного элемента в общий объем.

В диссертации предложен новый подход к созданию и развитию программного обеспечения интегрирующей части системы. Исходные данные, необходимые для программного встраивания нового приложения в систему, определяется автоматически путем сканирования приложения и уточняется в режиме упрощенного WIMP-взаимодействия, что требует решения задачи перевода профессиональных терминов на язык, понятный непрофессиональному пользователю.

Таким образом, специфические проблемы, возникающие при создании СА СПБД, можно свести к решению трех взаимосвязанных задач: создание концептуальной основы модуля сканирования приложений; создание концептуальной основы создания CASE-средств проектирования приложений для WIMPадминистрирования; создание СASE-средств для целей разработки систем такого типа в целом. Модуль сканирования приложений (см. рисунок 7) предназначен для автоматизированного определения интерфейса и характеристик программных продуктов с целью возможности их полноценного использования по назначению без необходимости детального изучения их свойств. Создание полного частотного словаря приложения предполагает осуществление преобразования сканирования.

Результат этой операции служит исходной информацией для операции семантического сравнения, результатом которой является словарь взаимнооднозначных соответствий слов, то есть пересечения множеств слов двух приложений.

Разработчик, Приложения Пользователь/администратор Подсистема интерактив- Генератор активиного взаимодействия зации приложений Генератор инициализирующих воздействий Анализатор текущего состояния приложения Словарь Словарь данных команд Семантический фильтр Тематические словари Рисунок 7 — Основные элементы сканера характеристик приложений Ключевой проблемой при построении развитой системы администрирования, рассматриваемой в диссертации, является обеспечение эффективного поиска различных данных. Для решения задачи рационального выбора соответствующего алгоритмического обеспечения проведены исследования эффективности основных алгоритмов поиска и сформулированы следующие рекомендации по выбору рациональных алгоритмов поиска: при оценке качества алгоритмов по показателю среднего тактового времени рациональным на всем исследованном сегменте является алгоритм поиска на основе хеш-функции; при оценке качества алгоритмов по значению показателя информационной чувствительности предпочтение так же может быть отдано алгоритму поиска методом хеширования; при оценке качества алгоритмов по показателю тактового времени в худшем и лучшем случаях рациональным на всем исследованном сегменте является алгоритм комбинированного интерполяционного поиска. На рисунках 8-10 приведены в наглядной форме результаты исследования эффективности алгоритмов хеширования, интерполяционного поиска, бинарного поиска и поиска методом прямого перебора.

Рисунок 8 — Зависимость среднего тактового времени поиска от длины массива ключей Рисунок 9 — Частотная гистограмма значений тактового времени выполнения для программной реализации алгоритма комбинированного интерполяционного поиска Рисунок 10 — Частотная гистограмма значений тактового времени выполнения для программной реализации алгоритма поиска методом хеширования В Заключении сформулированы основные результаты работы, указаны перспективы развития исследований и разработок.

В Приложении приведены акты внедрения результатов диссертационной работы и свидетельства об официальной регистрации программ для ЭВМ.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ Основным научным результатом диссертационной работы является теоретическое обобщение и решение важной проблемы в области организации баз данных, разработки и создания систем управления базами данных — разработка основ теории организации адаптивных систем персональных баз данных, практическое применение которых будет способствовать повышению эффективности работы пользователей с накопленными и вновь получаемыми информационными массивами.

В диссертационной работе получены следующие результаты:

1. Разработаны принципы структурирования информации в персональных базах данных на основе концепции транспарентного администрирования СПБД.

2. Разработаны принципы организации адаптивных систем персональных баз данных и теоретические основы расширенного администрирования СПБД.

Предложено решение проблем автоматизации основных этапов администрирования СПБД: основные задачи автоматизации могут быть реализованы с помощью метода управления искусственными информационными объектами; для СПБД наиболее характерны коллизии, связанные со сложными в обращении приложениями, поэтому необходима развитая подсистема интерактивного администрирования; в СПБД задача диагностики и прогнозирования состояния ресурсов сводится в основном к задаче определения ИПП, т.е. к мониторингу процессов взаимодействия пользователя с СПБД; механизмы административных воздействий на СПБД при автоматизации администрирования осуществляются, в основном, через операции резервирования, копирования и перемещения информации.

3. Разработаны методы организации систем расширенного администрирования СПБД: использование единой служебной базы административных данных;

использование архитектуры клиент-сервер для обеспечения унифицированного взаимодействия администрирующих приложений с СПБД и друг с другом; использование в качестве основы интеграции разнородных предметных подобластей индивидуального пользователя кинематического подхода к инфологическому моделированию.

4. Разработана архитектура системы расширенного администрирования СПБД, предложена методология проектирования ядра автоматизированных систем расширенного администрирования СПБД. Разработано математическое и программное обеспечение ядра системы расширенного администрирования СПБД.

5. Предложен метод семантических таблиц для автоматизации сбора исходных данных для CASE-средств с учетом специфики объектов проектирования.

Разработана концепция автоматической трансформации семантического образа программных продуктов в исходные данные для CASE-проектирования. Предложена концепция сканера семантики программных продуктов. Предложены алгоритмы автоматического построения исходного и обобщенного семантического образа программного продукта и представления его в виде таблиц. Разработан метод упрощения администрирования за счет создания специальных средств WIMPадаптации универсальных администрирующих приложений и рабочих приложений. Сформулированы требования к системе поиска семантической информации и рекомендации по ее алгоритмическому обеспечению. Разработаны рекомендации по алгоритмическому обеспечению аналитического компонента базы административных данных.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ В изданиях, входящих в список изданий, рекомендованных ВАК для публикации результатов докторских диссертаций:

1. Брейман А.Д. Оценка эффективности и качества администрирования информационных систем [Текст] / А.Д. Брейман // Автоматизация и современные технологии. — 2004. — №11. — С. 16-23. (8с.) 2. Брейман, А.Д. Решение задачи рациональной организации данных аналитического компонента в индивидуальных информационных системах алгоритмом упаковки с динамической внутренней границей объема [Текст] / А.Д. Брейман, М.В. Ульянов // Автоматизация и современные технологии. — 2004. — №12.

— С. 17-23. (7с., из них авторских 3,5c.) 3. Брейман, А.Д. Оценка качества администрирования индивидуальных информационных систем [Текст] / А.Д. Брейман // Автоматизация и современные технологии. — 2005. — №14. — С. 14-21. (8с.) 4. Брейман, А.Д. Автоматизация администрирования баз данных. // Автоматизация и современные технологии. — 2005. — №5. — С. 25-27. (3с.) 5. Брейман, А.Д. Выбор рациональных алгоритмов поиска по ключу для баз данных, размещаемых в оперативной памяти на основе анализа их информационной чувствительности [Текст] / А.Д. Брейман, М.В. Ульянов // Информационные технологии. — 2006. — №1. — С. 50-56. (7с., из них авторских 3,5c.) 6. Брейман, А.Д. Архитектура системы автоматизации администрирования баз данных индивидуальных информационных систем [Текст] / А.Д. Брейман // Информационные технологии. — 2006. — №7. — С. 33-37. (5с.) 7. Брейман, А.Д. Модели запоминания и воспроизведения информации пользователем системы персональных баз данных [Текст] / А.Д. Брейман // Известия ВУЗов. Полиграфия и издательское дело. — 2007. — № 3. — С. 44-52. (8с.) Свидетельства о регистрации программ для ЭВМ в Федеральной службе по интеллектуальной собственности, патентам и товарным знакам (РОСПАТЕНТ):

8. Брейман, А.Д. Программа двухфазной синхронизации мобильных и стационарных баз данных: Св. об офиц. рег. прогр. для ЭВМ [Текст] / А.Д. Брейман, С.Л. Солдатов // Федеральная служба по интеллектуальной собственности, патентам и товарным знакам, 2005.

9. Брейман, А.Д. Программа адаптивного администрирования систем персональных баз данных: Св. об офиц. рег. прогр. для ЭВМ [Текст] / А.Д. Брейман // Федеральная служба по интеллектуальной собственности, патентам и товарным знакам РФ, 2007.

10. Брейман, А.Д. Программа адаптивной гибридной виртуальной интеграции данных: Св. об офиц. рег. прогр. для ЭВМ [Текст] / А.Д. Брейман, М.А. Аникин // Федеральная служба по интеллектуальной собственности, патентам и товарным знакам РФ, 2007.

В прочих изданиях:

11. Брейман, А.Д. Исследование характера информационных процессов в обучающих системах с использованием средств мультимедиа [Текст] / А.Д. Брейман, И.В. Голубятников // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.:

МГАПИ, 1996. — Вып. 1. — С. 51–55.

12. Брейман, А.Д. Оценка производительности обучающей системы с динамической распределенной базой данных, построенной на основе локальной сети [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 1996. — Вып. 1. — С. 56–58.

13. Брейман, А.Д. Особенности требований к базам данных обучающих систем с использованием элементов мультимедиа [Текст] / А.Д. Брейман, И.В. Голубятников // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 1996. — Вып. 1.

— С. 86–88.

14. Брейман, А.Д. Модель динамической распределенной базы данных обучающей системы с элементами мультимедиа на основе локальной сети [Текст] / А.Д.

Брейман // Тезисы докладов международной научно-технической конференции «Информационные технологии в моделировании и управлении». — СПб.:СПбГТУ, 1996. — c.316-318.

15. Брейман, А.Д. Архитектура системы управления данными обучающих систем [Текст] / А.Д. Брейман, И.В. Голубятников, Б.М. Михайлов // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ:

межвуз. сб. науч. тр. — М.: МГАПИ, 1998. — Вып. 2. — С. 7–10.

16. Брейман, А.Д. Функциональная модель системы управления данными обучающих систем [Текст] / А.Д. Брейман, И.В. Голубятников // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ:

межвуз. сб. науч. тр. — М.: МГАПИ, 1998. — Вып. 2. — С. 52–56.

17. Брейман, А.Д. Модель данных системы управления данными обучающих систем [Текст] / А.Д. Брейман, И.В. Голубятников // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб.

науч. тр. — М.: МГАПИ, 1998. — Вып. 2. — С. 57–61.

18. Брейман, А.Д. Метод обеспечения гибкости системы управления данными обучающих систем при изменении алгоритмов формирования распределенной базы данных [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 1998. — Вып. 3. — С. 43–47.

19. Брейман, А.Д. Оценка эффективности поиска информации в больших информационных системах [Текст] / А.Д. Брейман // Тезисы докладов научнотехнической конференции факультета ИТ. — М.:МГАПИ, 1999. — С. 10-14.

20. Брейман, А.Д. Анализ возможностей количественного описания информационных объектов [Текст] / А.Д. Брейман // Сборник научных трудов II международной научно-практической конференции «Фундаментальные и прикладные проблемы приборостроения, информатики, экономики и права». — М.:МГАПИ, 1999. — Книга «Информатика». — С.54-59.

21. Брейман, А.Д. Основные факторы, влияющие на эффективность поиска информации в больших информационных системах [Текст] / А.Д. Брейман, Б.М.

Михайлов // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 2000. — Вып.

3. — С. 7–9.

22. Брейман, А.Д. Проблемы семантического анализа в больших информационнопоисковых системах [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч.

тр. — М.: МГАПИ, 2000. — Вып. 3. — С. 26-29.

23. Брейман, А.Д. Результаты экспериментального исследования символьного состава русскоязычных текстов [Текст] / А.Д. Брейман // Сборник научных трудов III Международной научно-практической конференции «Фундаментальные и прикладные проблемы приборостроения, информатики, экономики и права».

— М.: МГАПИ, 2000. — Книга «Информатика». — C. 39-40.

24. Брейман, А.Д. Методы классификации текстовых документов для поиска информации [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 2001. — Вып. 4. — С. 49-50.

25. Брейман, А.Д. Низкоуровневое статистическое представление текстовых документов для информационно-поисковых систем [Текст] / А.Д. Брейман // Сборник научных трудов IV Международной научно-практической конференции «Фундаментальные и прикладные проблемы приборостроения, информатики, экономики и права». — М.:МГАПИ, 2001. — Книга «Информатика». — С. 36.

26. Брейман, А.Д. Способ двухуровневой организации распределенной ИПС [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 2002. — Вып. 5. — С. 41-42.

27. Брейман, А.Д. Основные проблемы и пути совершенствования СУБД ИПС [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 2002. — Вып. 5. — С. 43-44.

28. Брейман А.Д. Функциональные особенности современных систем автоматизированного администрирования баз данных [Текст] / А.Д. Брейман // Сборник научных трудов VI Всероссийской научно-технической конференции «Новые информационные технологии». — М.: МГАПИ, 2003. — С. 71-73.

29. Брейман А.Д. Анализ основных тенденций развития систем администрования баз данных [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 2003. — Вып. 6. — С. 54-55.

30. Брейман А.Д. Временной критерий качества функционирования информационной системы [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч.

тр. — М.: МГАПИ, 2003. — Вып. 6. — С. 56-60.

31. Брейман, А.Д. Администрирование целостности данных в СУБД [Текст] / А.Д.

Брейман, А.В. Сузанович // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.:

МГАПИ, 2003. — Вып. 6. — С. 242-245.

32. Брейман, А.Д. Автоматизированная система администрирования баз данных [Текст] / А.Д. Брейман // Сборник научных трудов VI Международной научнопрактической конференции «Фундаментальные и прикладные проблемы приборостроения, информатики, экономики и права». — М.: МГАПИ, 2003. — Книга «Информатика». — С. 40-42.

33. Брейман, А.Д. Модели естественных ограничений функционирования баз данных информационных систем [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз.

сб. науч. тр. — М.: МГАПИ, 2004. — Вып. 7. — С. 55-57.

34. Брейман, А.Д. Модели отказов программного обеспечения баз данных информационных систем по причине скрытых ошибок [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 2004. — Вып. 7. — С. 58-61.

35. Брейман, А.Д. Задачи администрирования баз данных информационных систем, связанные с конвенциональными ограничениями [Текст] / А.Д. Брейман // Вестник МГАПИ. — 2004. — №1. — С.14-22.

36. Брейман, А.Д. Модель влияния ресурсных ограничений на функционирование баз данных информационных систем [Текст] / А.Д. Брейман // Сборник научных трудов VII Всероссийской научно-технической конференция «Новые информационные технологии». — М.: МГАПИ, 2004. — С. 8-14.

37. Брейман, А.Д. Базы данных как искусственные информационные объекты [Текст] / А.Д. Брейман, И.В. Степанова // Сборник научных трудов VII Всероссийской научно-технической конференции «Новые информационные технологии». — М.: МГАПИ, 2004. — С. 14-19.

38. Брейман, А.Д. Управление искусственными информационными объектами в системах администрирования баз данных [Текст] / А.Д. Брейман // Сборник научных трудов VII Международная научно-практическая конференция «Фундаментальные и прикладные проблемы приборостроения, информатики, экономики и права». — М.: МГАПИ, 2004. — Книга «Информатика». — С. 44-48.

39. Брейман, А.Д. Модель процесса синхронизации баз данных в стационарномобильных распределенных системах [Текст] / А.Д. Брейман, С.Л. Солдатов // Вестник МГАПИ. — 2005. — №3. — С. 11-20.

40. Брейман, А.Д. Обобщенная модель порождения и обработки запросов на администрирование баз данных информационных систем [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 2005. — Вып. 8. — С. 2431.

41. Брейман, А.Д. Автоматизация процесса формирования и приема запросов на администрирование баз данных информационных систем [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 2005. — Вып. 8. — С. 32-34.

42. Брейман, А.Д. Автоматизация процессов определения типов, причин и локализаций причин коллизий при администрировании баз данных информационных систем [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.:

МГАПИ, 2005. — Вып. 8. — С. 35-39.

43. Брейман, А.Д. Синхронизация баз данных с мобильными клиентами [Текст] / А.Д. Брейман, С.Л. Солдатов // Сборник научных трудов VIII Всероссийской научно-технической конференции «Новые информационные технологии». — М.: МГАПИ, 2005. — С.12-16.

44. Брейман, А.Д. Использование одноранговых баз данных в индивидуальных информационных системах [Текст] / А.Д. Брейман // Сборник научных трудов всероссийской научно-технической конференции «Информационные технологии» (г. Воронеж, 24-26 мая 2005г.). — Воронеж: Научная книга, 2005. — С.123-125.

45. Брейман, А.Д. Семантическая адаптация одноранговых баз данных [Текст] / А.Д. Брейман // Сборник научных трудов VIII Международной научнопрактической конференции «Фундаментальные и прикладные проблемы приборостроения, информатики, экономики и права». — М.: МГАПИ, 2005. — Книга «Информатика». — С.38-42.

46. Брейман, А.Д. Распределенные хеш-таблицы в одноранговых системах управления данными [Текст] / А.Д. Брейман, М.А. Аникин // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз.

сб. науч. тр. — М.: МГАПИ, 2006. — Вып. 9. — С. 12-18.

47. Брейман, А.Д. Одноранговые системы извлечения данных [Текст] / А.Д. Брейман, М.А. Аникин // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 2006.

— Вып. 9. — С. 19-48. Брейман, А.Д. Облегченные встраиваемые СУБД для программных систем со стабильной структурой данных [Текст] / А.Д. Брейман, Н.С. Рябчикова // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 2006. — Вып. 9. — С. 191192.

49. Брейман, А.Д. Семантические индексы в одноранговых системах управления данными [Текст] / А.Д. Брейман, М.А. Аникин // Сборник научных трудов IX Международной научно-практической конференции «Фундаментальные и прикладные проблемы приборостроения, информатики и экономики». — М.:МГУПИ, 2006. — Книга «Информатика». — C. 8-11.

50. Брейман, А.Д. Организация хранения и поиска данных в индивидуальных информационных системах [Текст] / А.Д. Брейман // Сборник научных трудов IX Международной научно-практической конференции «Фундаментальные и прикладные проблемы приборостроения, информатики и экономики». — М.:МГУПИ, 2006. — Книга «Информатика». — C. 37-40.

51. Брейман, А.Д., Аникин М.А. Пространство интероперабельности в одноранговых средах [Текст] / А.Д. Брейман, М.А. Аникин // Сборник научных трудов IX Международной конференции «Интеллектуальные системы и компьютерные науки». — М.:Механико-математический факультет МГУ им. М. В.

Ломоносова, 2006. — Том 2. — С. 64-72.

52. Брейман, А.Д. Кинематический подход к концептуальному проектированию баз данных [Текст] / А.Д. Брейман // Вестник МГУПИ. — 2007. — № 7. — C.

37-43.

53. Брейман, А.Д. Способы организации самоуправляемых систем персональных баз данных [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 2007. — Вып. 10. — С. 21-54. Брейман, А.Д. Оценка эффективности систем персональных баз данных по критерию транспарентности администрирования [Текст] / А.Д. Брейман // Программное и информационное обеспечение систем различного назначения на базе ПЭВМ: межвуз. сб. науч. тр. — М.: МГАПИ, 2007. — Вып. 10. — С. 2731.






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.