WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     ||
|

Рисунок 4 - Отделение контура мягких тканей головы и тканей черепа от вещества головного мозга Анализ работ показал, что для выделения областей интереса на изображениях чаще всего используются методы сегментации и методы шаблонов. На практике они обладают недостатками и не всегда справляются с задачей поиска небольших и малоконтрастных объектов на изображениях со сложной изменчивой структурой.

Для решения проблемы выделения патологического очага на томограмме предложен способ анализа гистограммы яркости изображения (рисунок 5).

Рисунок 5 - Анализ гистограммы При сравнении гистограмм яркости изображений с патологией и изображений с нормой выявлена особенность, позволяющая отличать одно от другого. Она заключается в различном количестве пикселей высокой яркости после участка плавного спада Hmin (рисунок 5). При появлении патологии на изображении, после плавного спада, что является нормой и связано с особенностями сканирующих катушек, количество пикселей высокой яркости оказывается на порядок больше, чем при норме. На рисунке 6 рассмотрен метод анализа гистограммы.

Рисунок 6 - Процесс анализа гистограмм яркости Для оценки крутизны спада гистограммы предлагается критерий:

hi hi H hmax hi где - высота оцениваемого столбца гистограммы, hi 1 - высота следующего столбца гистограммы, hmax - высота самого высокого столбца гистограммы.

Экспериментально выявлено такое значение Hmin, что выше соответствующей ему яркости все пиксели либо принадлежат патологии, либо их количество незначительно и связано с особенностями сканирования.

Из-за того, что диапазон яркости изображения может варьироваться в широких пределах, гистограммы яркости имеют разный масштаб визуальное сравнение их затруднено. Для этого все гистограммы проходят процедуру нормирования по яркости.

Из-за случайных неоднородностей магнитного поля выделенная область анализируется по количеству пикселей и если их количество ниже n = 12, то область не считается патологией. Это значение соответствует минимально различимому очагу патологии.

Результат работы метода представлен на рисунке 7.

Рисунок 7 - Выделение патологии на томограмме Для распознавания выделенной области патологии от других структур головного мозга (тканей орбит, тканей нижней части головы и др.), имеющих повышенный сигнал, предлагается метод, отличающийся учетом априорной информации о признаках нормальных анатомических структур мозга. Последовательность распознавания патологии от нормальных структур представлена на рисунке 8.

Рисунок 8 – Последовательность распознавания патологии.

Каждая из вышеперечисленных структур мозга обладает набором признаков, по которым ее можно отличить от патологической области. Основным признаком является локализация – принадлежность выделенной области зоне M(Xi, Yi):

Xi X0 Ak, X0 Ak Yi Y0 Bl,Y0 Bl Где X0,Y0 – координаты контрольной точки привязки;

A, B – размеры головного мозга по горизонтали и вертикали;

k, l – коэффициенты определяющие размер области M(Xi, Yi).

Среди других признаков можно выделить размер, форму выделенной области, количество. Таким образом, удается распознать выделенную патологию среди вариантов нормы.

Для определения основных характеристик патологической зоны на томограмме разработан ряд алгоритмов. Характеристики патологии – это признаки патологии на томограмме. Среди всех признаков, перечисленных в Главе 1 диссертационной работы, автоматизированному распознаванию на томограмме подлежат лишь несколько:

1. Изменение сигнала на томограммах Т1 взвешенности 2. Изменение сигнала на томограммах Т2 взвешенности 3. Количество зон патологии 4. Форма патологии 5. Размеры патологии 6. Локализация патологии 7. Наличие субдуральной гематомы 8. Наличие геморрагии в патологическом очаге Распознавание остальных признаков затруднено из-за сложности и комбинированной структуры их описания. Выделенные признаки используются для принятия решений в диагностической подсистеме.

Третья глава диссертации посвящена разработке алгоритмов принятия решений на основе признаков заболевания.

Проведен анализ различных методов принятия решений. Приоритетным направлением выбраны методы поиска закономерностей в данных (data mining), позволяющие выявить скрытые закономерности.

Среди всех методик data mining выбраны деревья решений, так как деревья решений позволяют создавать классификационные модели в областях, где достаточно сложно формализовать знания, а также дают возможность извлекать правила из базы данных на естественном языке, понятном пользователю и наглядно представлять результаты.

Исследованы наиболее популярные алгоритмы построения деревьев решений C4.5, CART, CHAID и ID3, и выявлены недостатки при работе с большими объемами трудноформализуемых данных.

Для устранения этих недостатков был предложен алгоритм отделения однородных групп наблюдений, который отличается компактной структурой дерева, сравнительно простым и не требующим больших затрат памяти критерием ветвления, компенсацией смещения данных в сторону одного из классов, а также способом обработки пропущенных значений.

При построении дерева решений с помощью алгоритма отделения однородных групп, каждый узел дерева имеет два дочерних узла. Для узла формируется правило, которое делит заданное множество примеров (обучающую выборку) на две части: – часть, в которой выполняется правило (потомок - left) и часть, в которой правило не выполняется (потомок - right).

1,если условие выполняется;

аi 0,в противном случае, где аi 1, если условие для правила выполняется.

Структура узла дерева, построенного с помощью этого алгоритма, изображена на рисунке 9.

Рисунок 9 - Дерево, построенное с помощью алгоритма отделения однородных групп Для обучения дерева используется уже классифицированный набор примеров. Для разбиения выборки по узлам предлагается двухэтапный подход, в котором два алгоритма включаются последовательно в зависимости от наличия в классах подгрупп. - на первом этапе от обучающей выборки отделяются однородные подгруппы Gi класса «образование» (алгоритм №1), по некоторым специфическим для них факторам, на втором происходит отделение от оставшейся выборки групп одного класса с минимальной ошибкой (алгоритм №2) (Рисунок 10).

Рисунок 10 - Общая схема работы комбинированного алгоритма.

Алгоритм выполняется до тех пор, пока в выборке не останется наблюдений, которые можно сгруппировать и отделить по определенным факторам. Остановка ветвления осуществляется, если не удается отделить группу наблюдений больше 10 наблюдений с точностью более 97%. Пропущенные значения в выборке переносятся в правую ветку, для дальнейшего анализа по другим факторам.

В основе разбиения по каждому узлу лежит критерий ветвления. Далеко не все критерии ветвления успешно работают на больших объемах данных с пропусками. Например, индекс Gini, реализованный в алгоритме CART на таких данных требует значительного времени на осуществление разбиения:

n Gini(T) 1 pi2, i где pi – вероятность (относительная частота) класса i в выборке T.

В алгоритмах ID3 и С 4.5. критерий ветвления основан на уменьшении энтропии и разбивает данные на множество ветвей по каждой категории выбранного фактора. В алгоритме С 4.5. этот критерий улучшен и позволяет учитывать пропущенные значения:

T U Gain(X ) Info(T) InfoX (T), T где T – множество обучающих примеров и X – проверка по некоторому атрибуту A; U количество неопределенных значений атрибута A.

Info(T ) - оценка среднего количества информации, необходимого для определения класса примера из множества T – энтропия множества Т.

На факторах, у которых более 5 категорий (в медицинских данных часто встречается) разбиение по такому критерию приведет к потере мощности и обобщающей способности, а также на выходе будет трудно интерпретируемая структура дерева.

Таким образом, в качестве критерия ветвления предлагается критерий отделения однородных групп наблюдений. Оценочная функция, базируется на идее отделения как можно более чистой и полной группы наблюдений одного класса или группы по определенной категории фактора. При таком подходе для более полного учета влияния факторов значимость определяется группой категорий выбранного фактора.

Для выбора списка отделяющих категорий используется критерий R:

P(B) R max, const K где B - количество наблюдений отделяемого класса, которое выделяет рассматриваемая категория; A - количество наблюдений отделяемого класса; K – количество наблюдений постороннего класса, соответствующее группе выбранных категорий; P(B) – условная вероятность выделения наблюдений нужного класса категорией fmn:

B P(B) A При нахождении коэффициента R количество ошибочно классифицированных наблюдений отделяемой группы учитывается в параметре K.

K B C Значение критерия зависит от количества ошибочных наблюдений, попавших в группу K, а также от условной вероятности выделения наблюдений данной категорией. Константа const введена в формулу на случай, если в выбранной группе не будет ошибочных наблюдений. В этом случае решающим фактором выбора группы станет вероятность P(B).

Таким образом, вышеописанный алгоритм с помощью критерия отделяет от выборки группы с минимальным количеством ошибочных наблюдений максимального размера по определенному набору категорий. Такое отделение позволяет учесть особенность медицинских данных – группы наблюдений с похожими характеристиками, например случаи различных стадий одного и того же заболевания и т.п. Благодаря такому подходу удается сократить признаковое пространство выборки и упростить интерпретацию результатов врачом.

В четвертой главе на основе предложенных методов и алгоритмов проведена разработка автоматизированной системы диагностики новообразований головного мозга. Представлены результаты экспериментальных исследований.

Разработанная структура автоматизированной системы для диагностики новообразований головного мозга, представлена на рисунке 11.

Рисунок 11 - Структура автоматизированной системы диагностики новообразований головного мозга Основные блоки системы:

1. База данных. Осуществляет хранение информации о предметной области.

2. Информационная подсистема (интерфейс пользователя) предназначена для взаимодействия врача с другими подсистемами. Основные функции:

Регистрация нового пациента и сохранение информации о нем в базе данных;

Поиск и вывод данных о ранее зарегистрированном пациенте;

Объединение всех подсистем в единое целое.

3. Подсистема поддержки принятия решений предназначена для автоматизации процесса диагностики новообразований головного мозга. Функции диагностической подсистемы реализованы в диалоговом режиме – врач имеет возможность влиять на выработку рекомендации системой.

Включает:

Блок предварительной обработки и формализации данных, который осуществляет предобработку поступивших данных для хранения и дальнейшего анализа. Основная функция - нахождение пропусков в данных, их маркировка, а также преобразование данных в числовую форму для хранения в БД.

Блок формирования диагностической модели. Основные функции - формирование ветвей диагностического дерева решений, а также генерация анкеты для занесения признаков патологии в базу данных.

Блок постановки диагноза «опухоль»\ «не опухоль».Основные функции - формирование описания состояния пациента на языке признаков (симптомов),формирование диагностической гипотезы в нечетком виде, вывод диагностического результата на экран в понятной для врача форме, объяснение полученных в ходе логического вывода интерпретаций результатов исследований и диагностического заключения.

4. Подсистема автоматизированного распознавания томограмм. Основные функции - нахождение зоны патологии на томограмме и указание на нее врачу, определение признаков патологической области на томограммах для дальнейшего анализа. Эти функции реализованы в режиме советчика – т.е. врач принимает решение об использовании рекомендаций выданных системой.

Разработано программное обеспечение для решения основных задач диагностической подсистемы и подсистемы выделения патологий:

Обучение и оценка качества функционирования системы проводились на проверочной выборке (200 наблюдений) и обучающей выборке (900 наблюдений). Ошибкой системы является неверно поставленный диагноз относительно «истинного» значения, т.е. известного врачебного диагноза.

Точность классификации на обучающих данных составила 96,64%, на новых данных - 96,53% Алгоритм С4.5, реализованный в системе Deduktor (BaseGroup) на тех же данных, показал результаты 92% на новых данных и 98% - на обучающих. Это подтверждает недостаток алгоритма C4.5 применительно к медицинской диагностике – переобучение. Алгоритм CART (SPSS) показал близкие по точности результаты 98% на обучающих данных и 96% на тестовых, но построение дерева заняло значительно больше времени. При увеличении размера выборки это будет важным фактором.

Оценка точности выделения патологической области на томограмме и ее характеристик проводились группой экспертов на контрольной выборке из серий томограмм головного мозга с различными патологиями.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ В работе получены следующие основные результаты.

1. Проанализированы пути повышения эффективности диагностики опухолей головного мозга, рассмотрен диагностический процесс с точки зрения системного анализа и предложено создание системы поддержки принятия решений, которая позволит повысить точность диагностики и уменьшить время, затраченное на постановку диагноза.

2. Cформирована система признаков новообразований головного мозга, отличающие их от других заболеваний. Рассмотрена возможность автоматизации этих признаков. Создана база данных, содержащая наблюдения значений признаков для каждого пациента.

3. Разработан метод, позволяющий распознавать на томограммах головного мозга область с патологическим изменением сигнала, основанный на анализе распределения гистограммы яркости, а также алгоритм выделения вещества головного мозга от окружающих его тканей черепа, орбит и других, сопутствующих немозговых структур.

4. Реализована группа алгоритмов, позволяющих автоматически выделять признаки и характеристики патологии, такие как форма, размер, характер изменения сигнала на Т1 и Т2 томограммах, наличие субдуральной гематомы, определение полушария, в котором патология расположена, подсчет количества патологий и наличия геморрагии в них.

Pages:     ||
|



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.