WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 || 3 |

m – число классов.

При этом дисперсия каждого признака может быть определена так:

k k x xj j j j k k, (2) x j где – признак объекта;

k – число объектов в классе.

- Внутригрупповая сумма квадратов отклонений (ВСКО ) n z z 1 W x2 ( x )ji ji n z j 1 i 1 i, (3) где xji – j-тый признак i-того объекта;

n – число признаков объекта;

z – количество объектов в классе.

- Квадраты внутриклассовых и межклассовых расстояний dij Fin i, jk Kl nll, (4) Fin где – среднее внутриклассовое расстояние;

nl l – число объектов класса;

k – число классов;

dij Sl – расстояние между объектами i и j класса.

dij i Sq, j Kl Fout nl nq l q, (5) Fout где – среднее межклассовое расстояние;

nl,nq q l – число объектов и классов соответственно;

dij Sl Sq – расстояние между объектами i и j классов и.

В третьей главе рассматривается вопрос о разработке модели алгоритма, идея которого, заключается в следующем: на первом этапе формируются начальные эталолны для каждого класса, с помощью определения наиболее удаленных дгуг от друга объектов.

На втором этапе происходит класссификация оставшихся элементов исходного множества по принципу, известному как “сравнение с эталоном”.

При этом после отнесения объекта к какому-либо классу изменяется и эталон данного класса. Результатом работы алгоритма является разбиение множества объектов на m классов с эталоном для каждого класса.

Под эталоном следует понимать реальный или абстрактный объект, значения признаков которого однозначно идентифицируют принадлежность Этап I Формирование начальных эталонов для каждого класса методом определения наиболее удаленных объектов Этап II Классификация оставшихся объектов исходного множества по методу “сравнение с эталоном” Принадлежность объекта классу определяется минимальным значением выбранного заранее критерия Рисунок 2 Обобщенная схема алгоритма классификации объекта определенному классу.

Обобщенная схема алгоритма классификации представлена на рис.2.

Блок-схема алгоритма классификации объектов на заданное число классов представлена на рис.3.

начало S {S1,S2,...,Sl}с описанием Ввод множества объектов I(Si ) {pi1, pi2,..., pil} признаков, i 1,l Ввод числа классов m Число созданных классов mt=да Классификация m1 или m<бессмысленна С Создать матрицу расстояний Dll Найти максимальный элемент в матрице D, определяющий два наиболее удаленных объекта Si и Sj Сделать объект Si начальным эталоном En1 класса К1, и объект Sj начальным эталоном En1 класса КУвеличить число созданных классов и эталонов на ( mt mt ) Удалить объекты Si и Sj из множества S и уменьшить число объектов множества S на 2 (l l 2 ) R[mt][l]между эталонами Создать матрицу расстояний созданных классов и всеми оставшимися объектами множества S Найти объект Si наиболее удаленный от каждого уже созданного класса A B ЭТАП 1. Формирование начальных эталонов A В Увеличить число созданных классов и эталонов на mt mt ( ) Сделать объект Si начальным эталоном класса Кmt, Enmt Si K и поместить объект в новый класс mt Si Удалить объект из множества S и уменьшить число объектов множества S на 1 ( l l ) да mt m нет Определить критерий принадлежности Fij каждого объекта Si, i 1,l множества S каждому классу j, j 1, m K K Si Определить min Fij и соответствующие ему класс и объект j Si K Поместить найденный объект в класс и сформировать j K новый эталон Ej класса j Si Удалить объект из множества S и уменьшить число объектов множества S на 1 ( l l 1) да l нет нет Расчет и вывод результатов (классов, эталонов, ха на первом этапе формируются начальные эталолны для каждого класса, с помощью определения наиболее удаленных дгуг от друга объектов.

На втором этапе происходит класссификация конец оставшихся элементов исходного множества по принципу, известному как “сравнение с эталоном”. При этом Рисунок 3.Алгоритм классификации объектов после отнесения объекта к какому-либо классу изменяется и эталон данного класса. Результатом Разработано программное средство реализующее алгоритм в виде программы языке C++ Builder 5.

работы алгоритма является разбиение объектов на m классов с эталоном для каждого класса.

рактеристик) ЭТАП 1. Формирование начальных эталонов ЭТАП 2. Завершение классификации В четвертой главе работы исследована работоспособность разработанного алгоритма для решения задачи классификации.

Работоспособность разработанного алгоритма проверяется на примере классификации стадий развития заболеваний ЖКТ (гастриты).

Поскольку полная классификация гастритов достаточно сложна, то целесообразно остановиться, например, на классификации стадий развития гастритов по морфологическому признаку (рис. 4).

Поверхностный Неатрофический Умеренный Атрофический Выраженный Атрофический С явлением перестройки желез Гипертрофический Рисунок 4. Классификация гастритов по морфологическому признаку.

Как уже было отмечено, классификация ТГМА обладает малой степенью детализации, поскольку не позволяет с высокой точностью говорить о качественном составе признаков, характерных для каждого класса. Поэтому созданное в результате работы над диссертацией программное средство было использовано для классификации заболеваний ЖКТ. Исходными данными для исследований служат:

I(Si ) {pi1, pi2,..., pin} Описания объектов на языке признаков Заданное количество классов (m) Описания объектов на языке признаков приведены в таблице 1.

Объектом классификации в данном случае является желудочнокишечный тракт человека, а признаками – данные обследования, выраженные числовыми значениями.

Для получения практических результатов была исследована выборка из 20 пациентов. Алгоритму необходимо было на основании данных обследования разбить исходную выборку на m классов таким образом, чтобы пациенты, оказавшиеся в одном классе имели одинаковую или схожую стадию заболевания.

Таблица 1. Исходные данные для классификации.

№ Исходная выборка объектов призн. Индекс S0 S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 S11 S12 S13 S14 S15 S16 S17 S18 SP1 ИСПЭ 0 0 6 6 12 0 12 5 10 4 8 6 4 6 8 6 7 11 6 P2 ИСЖЯ 0 0 2 3 2 0 2 0 2 2 2 2 0 2 3 0 2 3 0 P3 ИАЖЖ 0 0 1 2 1 0 2 2 2 2 1 0 1 2 2 1 1 2 1 P4 ИСЖЭ 1 0 1 3 5 0 4 1 3 2 1 3 2 1 2 3 3 4 1 P5 ИХВП 0 0 1 0 2 0 2 2 3 0 3 0 1 0 2 0 1 2 1 P6 П-ИМ 0 0 2 4 3 1 7 3 6 3 4 5 3 2 4 2 4 7 2 P7 С-ИМ 0 0 1 7 11 0 11 7 9 2 4 6 4 2 9 4 8 12 4 P8 В-ИМ 0 0 2 6 7 0 8 4 7 1 7 6 3 3 7 4 7 7 4 В данной работе используется два критерия отнесения объекта к классу. Для того чтобы оценить, как влияет выбор критерия отнесения объекта к классу на результаты классификации, была произведена m 2,классификация на m классов ( ).Зависимость показателей качества классификации от выбора критерия отнесения объекта к классу показана на рисунке 5.

Влияние критерия отнесения объекта к классу на суммарную ВСКО классов 41,41,29,25,15,13,14,4211 11,12,9,8,6563 6,4,7,8708 6,4,4,4,2 3 4 5 6 7 8 9 Количество классов по минимальой ВСКО по минимальному расстоянию Рисунок 5. Влияние критерия отнесения объекта к классу на суммарную ВСКО классов.

Анализ зависимостей ВСКО классов показывает, что безошибочность СКО классов для каждого из критериев отнесения объекта к классу уменьшается с увеличением числа классов. Эта зависимость легко объясняется тем, что при увеличении количества классов их размеры становятся меньше, а схожесть объектов внутри класса больше.

Суммарная ВСКО классов В результате анализа графиков, можно сделать вывод, наилучшая безошибочность достигается после обучения по критерию суммарной ВСКО.

Следовательно, предложенный в данной работе алгоритм классификации объектов на заданное число классов более эффективен при использовании на втором этапе в качестве критерия отнесения объекта классу критерий суммарной ВСКО.

Эффективность разработанного алгоритма оценивается путем сравнения полученных результатов с результатами работы классического алгоритма Ворда, при одинаковых исходных данных.

Для оценки эффективности разработанного алгоритма была создана программная модель классического алгоритма классификации объектов на заданное число классов.

Эффективность разработанного алгоритма проверяется путем сравнения результатов классификации, полученных каждым алгоритмом. В качестве критерия отнесения объекта к классу для разработанного алгоритма выбран критерий суммарной ВСКО.

Процентное соотношение совпадений составов классов представлено на рис. 6.

Процентное соотношение совпадений составов классов 100% 100% 1 95% 90% 90% 85% 0,9 85% 85% 0,0,0,50% 0,0,0,0,0,1 2 3 4 5 6 7 8 Количество классов Рисунок 6. Процентное соотношение совпадений составов классов Как видно из рисунка 6, результаты работы двух алгоритмов совпадают не менее, чем на 56% для любого количества классов.

Гистограммы и графики оценки эффективности разработанного алгоритма по суммарной ВСКО представлены на рис. 7.

Процент совпадения Эффективность разработанного алгоритма по суммарной ВСКО классов 41,41,29,25,15,14,13,12,11,8,6,9,4,7,6,4,4,4,1 2 3 4 5 6 7 8 Количество классов классический алгоритм разработанный алгоритм Эффективность разработанного алгоритма по суммарной ВСКО классов 2 3 4 5 6 7 8 9 Количество классов классический алгоритм разработанный алгоритм Рисунок 7. Безошибочность СКО классов Анализ рисунка 7 показывает, что суммарная ВСКО классов для каждого алгоритма уменьшается с увеличением числа классов. Эта зависимость легко объясняется тем, что при увеличении количества классов их размеры становятся меньше, а сходство объектов внутри класса больше.

При этом сходство объектов в классах, полученных с помощью разработанного алгоритма, в большинстве случаев выше, чем в классах, полученных классическим алгоритмом. Следовательно, разработанный Суммарная ВСКО классов Суммарная ВСКО классов алгоритм по критерию суммарной ВСКО образованных классов эффективнее, чем классический алгоритм Ворда.

Практическая эффективность и пригодность разработанного алгоритма для классификации стадий развития заболеваний ЖКТ проверялась кафедрой Факультетской терапии ТГМА.

С целью оценки практической эффективности разработанного Si алгоритма, экспертами для каждого объекта,i 0,l исходной выборки была заранее определена априорная принадлежность к одному из классов.

Результат разбиения исходного множества на три класса (m=3) представлен на рис. 8.

Класс №1 Класс №2 Класс№S1 S0 S5 S16 S14 S8 S4 S6 S17 S2 S12 S9 S13 S15 S18 S19 S3 S7 S11 S0 0 0 7 8 10 12 12 11 6 4 4 6 6 6 5 6 5 6 0 0 0 2 3 2 2 2 3 2 0 2 2 0 0 2 3 0 2 0 0 0 1 2 2 1 2 2 1 1 2 2 1 1 0 2 2 0 0 1 0 3 2 3 5 4 4 1 2 2 1 3 1 2 3 1 3 0 0 0 1 2 3 2 2 2 1 1 0 0 0 1 0 0 2 0 0 0 1 4 4 6 3 7 7 2 3 3 2 2 2 2 4 3 5 0 0 0 8 9 9 11 11 12 1 4 2 2 4 4 3 7 7 6 0 0 0 7 7 7 7 8 7 2 3 1 3 4 4 3 6 4 6 ИССОЖ=0.00 ИССОЖ=33.00 балла ИССОЖ=16.00 балла ИССОЖ=1.00 ИССОЖ=48.00 балла ИССОЖ=30.00 балла ИССОЖ=0.67 ИССОЖ=41.83 балла ИССОЖ=21.27 балла Здоровое состояние Поверхностный гастрит Атрофический гастрит Гипертрофический гастрит Рисунок 8. Составы классов при m=При m=3 можно заметить, что полностью выделен класс здоровых пациентов (класс №1), в класс №2 попали больные с гипертрофическим и атрофическим гастритом, а в класс №3 – с атрофическим и поверхностным.

Это позволяет сделать вывод, что атрофический гастрит у пациентов, попавших в класс №2, выражен ярче, чем у пациентов, попавших в класс №3.

Выражаясь языком кластерного анализа, это значит, что области классов №и №3 частично перекрываются. Следовательно, необходимо ввести по крайней мере еще один класс, чтобы уменьшить эту область неопределенности, или увеличить количество объектов исходной выборки.

Что касается ИССОЖ, то его значения близки тем, которые получены исследователями кафедры Факультетской терапии ТГМА (табл.2).

Таблица 2. Сравнение результатов по интегральному показателю Методика ТГМА Разработанный алгоритм Здоровое состояние (ИССОЖ=1.00 0.36 балла) Класс 1 (ИССОЖ=0,67 балла) Период ремиссии (ИССОЖ=31.50 0.56 балла) Класс 2 (ИССОЖ=21,27 балла) Класс 3 (ИССОЖ=41,83 балла) Период обострения (ИССОЖ=45.46 0.80 балла) Произведен анализ предложенной методики классификации по признакам и методики кафедры Факультетской терапии ТГМА. Выявлено, что методика классификации по признакам не противоречит методике ТГМА, и является более конкретизированной и точной.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ.

1. Обоснована актуальность решения задачи классификации заболеваний ЖКТ с использованием индексов состояния слизистой оболочки желудка. Проанализированы существующие алгоритмы решения задачи классификации многомерных объектов по их признакам.

2. Построена математическая модель заболевания ЖКТ послужившая основой для разработки классификатора многомерных объектов по признакам на заданное число классов.

3. В интегрированной среде разработки приложений Borland C++ Builder создано программное обеспечение, позволяющее осуществлять разбиение объектов на заданное число классов и реализующее двухэтапный алгоритм классификации.

4. Проведены исследования влияния критериев отнесения объекта к классу на результаты классификации, позволившие оценить эффективность разработанного алгоритма, путем сравнения полученных результатов с результатами работы классического алгоритма по нескольким критериям.

5. Проведена оценка практической значимости разработанного алгоритма для определения стадий развития заболеваний желудочнокишечного тракта. Программное средство включено в систему поддержки принятия решений в АРМ – врача – клинициста по заболеваниям ЖКТ кафедры общефакультетской терапии Тверской Государственной Медицинской Академии и получило свидетельство № 2009611696 от федеральной службы Российской Федерации по интеллектуальной собственности, патентам и товарным знакам о регистрации программы ЭВМ (автор Айисси Г.А).

ПУБЛИКАЦИИ ПО ТЕМЕ РАБОТЫ Журналы рекомендованные ВАК:

1. Айисси Г.А, Вероятностная модель медицинской диагностики [Текст] / Г.А. Айисси, Ю.Н. Матвеев// Международный журнал «Проблемы теории и практики управления». Международное научно-практическое приложение «Программные продукты и системы», № 2 (86), Тверь 2009,С.168-170.

2. Айисси Г.А. Классификация стадий развития заболевания желудочнокишечного тракта // Свидетельство о государственной регистрации программы для ЭВМ № 2009611696. –М.: Роспатент, 2009.

Публикации в других изданиях:

3. Айисси Г.А. Использование алгоритмов самоорганизации в задачах синтеза систем медицинского диагностирования.[Текст] / Г.А. Айисси, Р.Н.

Pages:     | 1 || 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»