WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 | 2 || 4 |

Одной из актуальных задач в области управления рисками является задача кластеризации предприятий по набору некоторых (финансовых или операционных показателей) в группы рисков. Пусть у нас определено как множество предприятий, для которого строится разбиение. Для каждого предприятия определен набор параметров, характеризующих элемент множества. Эти параметры считаются заранее известными и определенными методом экспертных расчетов. Задача состоит в построении множества здесь кластер, содержащий похожие друг на друга объекты из множества

Основные известные алгоритмы кластеризации (например, модификации алгоритмов K-Means, Expectation Maximization) налагают ограничения на геометрию получаемых кластеров, в частности, требуя возможности охвата каждого кластера отдельным выпуклым множеством. В результате, эти алгоритмы не в состоянии адекватно разбить на кластеры невыпуклые множества, тем более вложенные структуры.

В связи с этим в диссертации разработан алгоритм кластеризации, который не требует существования центров кластеров и позволяет выделять кластеры в виде невыпуклых множеств, а также вложенные структуры кластеров.

Предлагается подход к кластеризации конечного набора элементов произвольного метрического пространства на основании разбиения множества на классы эквивалентности по нечеткому отношению. На основании метрики определяется нечеткое отношение, обладающее свойствами четкой рефлексивности и нормальной -симметричности. Далее строится транзитивное замыкание отношения, которое для каждого значения в диапазоне от 0 до 1 позволяет определить отношение эквивалентности на исходном множестве. По построению отношения два элемента входят в один класс эквивалентности тогда и только тогда, когда между ними есть последовательность попарно «близких» друг к другу элементов.

Пусть X – метрическое пространство и определенная на нем метрика, - последовательность элементов из X. В работе предполагается, что и, следовательно, справедливо:

,.

(18)

Таким образом, для каждого индекса i можно определить функцию, описывающую меру сходства j-ого элемента последовательности с i-ым элементом :

(19)

Для каждого индекса i определим функцию, описывающую меру сходства k-ого и l-ого элемента относительно i-ого элемента:,. Определим далее функцию, описывающую меру сходства любых двух элементов последовательности относительно всех элементов последовательности:,.

Для k=1,2,…,n рекурсивно определим функции :

(20)

Для на множестве определим бинарное отношение :. При этом отношение является отношением эквивалентности и выполняются свойства:

1. рефлексивности.

;

2. симметричности:

;

3. транзитивности:

.

Таким образом, отношение эквивалентности порождает разбиение исходного множества на классы эквивалентности. В случае если пространство кластеризуемых элементов является векторным пространством, то полученные при помощи описанного алгоритма кластеры могут иметь произвольную структуру.

Таким образом, в диссертации разработан метод кластеризации не предполагающий существование центров кластеров. В качестве преимуществ предложенного метода кластеризации можно отметить отсутствие необходимости в априорных предположениях относительно структуры данных (вид и параметры распределения вероятности по кластерам, центров плотности, числа кластеров).

В результате интеграции разработанных в диссертации моделей, приведенных выше, исходя из кривой вероятностей получения прибыли, полученной на основании расчетов управления рисками, строится кривая распределения вероятностей возможных потерь (кривая риска). На основе анализа кривой выделяется ряд характерных точек. Точка 1 определяет вероятность нулевых потерь прибыли. В соответствии с принятыми допущениями вероятность нулевых потерь максимальна - Вр. Точка 2 характеризуется величиной возможных потерь, равной ожидаемой прибыли, т.е. полной потерей прибыли, вероятность которой равна – Вд. Точки 1 и 2 являются граничными, определяющими положение зоны допустимого риска. Точка 3 соответствует величине потерь, равных расчетной выручке. Точки 2 и 3 определяют границы зоны критического риска. Точка 4 характеризуется потерями, равными имущественному состоянию (ИС) предпринимателя, вероятность которых равна Вкт. Между точками 3 и 4 находится зона катастрофического риска. Вероятности определенных уровней потерь являются показателями, Таким образом, для каждого разработанного плана управления рисками методика позволяет определить вероятностные характеристики оценки экономической эффективности деятельности предприятия. Это позволяет при выбранных критериях эффективности провести сравнительный анализ различных стратегий развития фирмы в плане наращивания резервов.

В связи с многообразием и сложности структур данных для анализа риска, а именно, финансово-экономических, производственных, операционных, да и практически всех показателей производственной деятельности, для реализации методики статистического анализа управления риска разработана формализованная методика проектирования систем баз данных (БД), учитывающая особенности методов управления рисками. Предполагается, что задано множество приложений:, где - приложение -го типа; - количество приложений.

Каждое приложение представляется в виде, где - множество задач (функций) приложения; - множество пользователей -го приложения. Множество задач (функций) конечно и, где - j-ая задача i-го приложения, а множество пользователей связано с тем или иным типом задач приложения.

Для всех - общему множеству задач - и типов пользователей определим модель пользователя по задаче в виде:

(21)

где - информационная потребность пользователя по задаче ; - потребность пользователя по запросам; - характеристики элементов модели пользователя.

Имея на входе множество приложений, определяемых составом задач и моделями пользователей по каждой из них, формализованная методика проектирования систем БД на концептуальном уровне включает следующие шаги.

Шаг 1. Начальная концептуализация данных. осуществление отображения, где - информационная потребность пользователя по задаче (функции), выраженная с помощью реляционной схемы.

Шаг 2. Осуществляется построение КМД приложения из неструктурированной информации, представленной в виде множества отношений и выделение тех семантических свойств данных, которые должны быть представлены на концептуальном уровне. Формирование КМД приложений то есть осуществление отображения:

(22)

где - множество типов элементов КМД, - система ограничений модели.

Шаг 3. Осуществляется разбиение приложения, если КМД данного класса не может быть сформирована, то есть в рамках КМД не могут быть согласованы информационные потребности пользователей.

Если, то осуществить разбиение положить и перейти к шагу 1 ; иначе - шаг 4.

Шаг 4. Выполняется описание КМД на языке специального типа или используются графические диаграммы. Текст описания КМД является основной исходной информацией для работы процедур автоматизированного проектирования систем БД. выполняется процесс концептуального описания данных.

Шаг 5. Процедуры шага 5 позволяют построить оценки элементов КМД различного типа. При этом в качестве оценок рассматриваются различные модификации коэффициентов различия. Выбор оценок в виде коэффициентов различия объясняется тем, что на коэффициент различия наложено меньше ограничений, чем на функцию расстояния, поскольку этот коэффициент не обязан удовлетворять неравенству треугольника. Вместе с тем, он хорошо служит целям анализа данных сложной структуры, где характеристики исследуемых объектов имеют дискретный характер и определяют содержание или отсутствие определенного признака в конкретном анализируемом объекте. строятся оценки элементов КМД типа l, где - оценка элементов и типа l ; -область возможных оценок, представленных в виде коэффициентов различия.

Шаг 6. Осуществляется классификация элементов КМД различного типа, что позволяет проанализировать элементы различных приложений. Выполняется анализ элементов и формируется множество отношений эквивалентности

Шаг 7. Выполняется подсчет оценок КМД на основе результатов шага 6 строятся оценки КМД в виде

Шаг 8. Информация шагов 6 и 7 позволяет на шаге 8 сформировать систему ПО (предметных баз данных), каждая из которых состоит из множества КМД приложений. Выполняется решение задачи формирования множества ПО (предметных баз данных) :

Шаг 9. Строятся КМД предметной области.. Выполняется согласование КМД приложений и строится система КМД ПО

Шаг 10. Осуществляется заполнение словаря-справочника данных. Фактически этот шаг распределен по каждому из предыдущих шагов. Заполнение словаря-справочника данных.

Шаг 11. Выполнение процедуры шага позволяет получить реальные оценки. Если они неудовлетворительны, то необходимо снова повторить решение задачи формирования ПО. В противном случае (шаг 12) осуществляется процесс построения внешних схем путем отображения элементов на сопутствующие элементы..

Шаг 12. Корректировка КМД приложений

Шаг 13. Шаги 13-14 показывают связь процессов концептуального и логического проектирования. Реализуется концептуализация запросов пользователей:

,

(24)

Шаг 14. Отображение каждой в структуры данных целевой СУБД с учетом эффективности реализации и ограничений на объем БД.

Шаг 15. Определяет условие окончания процессов концептуального и логического проектирования систем БД. Если отображение выполнимо - то конец ; иначе - переход к шагу 1 с учетом пересмотра характеристик

Предложенная формализованная методика позволяет в полной мере определить последовательность действий при проектировании баз данных сложной структуры и большой размеренности - систем баз данных.

В четвертой главе диссертации рассматриваются вопросы построения программного комплекса автоматизации процесса управления рисками промышленных предприятий. Разработана структура базы данных, интегрирующая статистические данные и данные вычислительных экспериментов. Приведен список программных приложений с описанием их основных функциональных возможностей.

Архитектура автоматизированной системы управления рисками.

Рис.

5.

В качестве программного продукта реализующего типовые математические алгоритмы используется пакет Statistica. Данный пакет имеет API, что делает его доступным из других приложений. Также данные пакет используется в виде системы получения отчетов и графического анализа, так как обладает большими возможностями визуализации данных.

В диссертации разработана формализованная методика проектирования систем БД, учитывающая особенности методов управления рисками. Так как объем анализируемых данных для управления рисками достаточно большой, то в качестве СУБД выбирается СУБД Oracle 10g, поддерживающая распределенные вычисления по технологии GRID. Данная СУБД имеет улучшенные способности к масштабированию и высокую производительность и встроенный язык программирования Pl\SQL позволяющий реализовать большую часть статистических процедур на стороне сервера БД, что снижает нагрузку на компьютеры клиентов.

Для организации открытой структуры в процессе его апробации и внедрения, комплекс имеет отдельные приложения, которые носят самостоятельный характер, а методы аналитической обработки данных базируются на интерфейсном взаимодействии с пакетами аналитической обработки данных.

В заключении представлены основные результаты работы.

В приложении приводятся акты внедрения результатов диссертационной работы.

Публикации. По результатам выполненных исследований опубликовано 8 печатных работ.

Основные выводы и результаты работы

Pages:     | 1 | 2 || 4 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»