WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     || 2 | 3 | 4 |

На правах рукописи

Трусова Юлия Олеговна

Представление предметной области

«Анализ изображений»

в виде специализированного тезауруса

Специальность 05.13.17 – «Теоретические основы информатики»

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

кандидата технических наук

Москва 2009

Работа выполнена в Учреждении Российской академии наук Вычислительный центр им. А.А. Дородницына РАН

Научный руководитель: кандидат физико-математических наук, с.н.с. И.Б. Гуревич

Официальные оппоненты: доктор технических наук,

профессор Ю.Г. Васин

кандидат физико-математических наук, с.н.с. К.В. Воронцов

Ведущая организация: Институт математики им. С.Л. Соболева Сибирского отделения Российской академии наук

Защита состоится 14 мая 2009 г. в 15 часов на заседании диссертационного совета Д002.017.02 Учреждения Российской академии наук Вычислительный центр им. А.А. Дородницына РАН по адресу: 119333, Москва, ул. Вавилова, 40.

С диссертацией можно ознакомиться в библиотеке Учреждения Российской академии наук Вычислительный центр им. А.А. Дородницына РАН.

Автореферат разослан 13 апреля 2009г.

Ученый секретарь

диссертационного совета

доктор физико-математических наук

профессор В.В. Рязанов

Общая характеристика работы

Актуальность темы

Одной из фундаментальных проблем информатики является проблема обработки, анализа, оценивания и понимания информации, представленной в виде изображений. Изображения являются одним из основных средств представления информации в научных исследованиях, медицине, экологии и технике.

Важным направлением ориентированных фундаментальных и прикладных исследований является разработка автоматизированных систем обработки, анализа, оценивания и понимания изображений. Необходимыми предпосылками создания таких систем являются автоматизация: а) выбора метода решения предъявленной задачи; б) выдачи рекомендаций по выбору метода решения для класса задач, к которому относится предъявленная задача; в) синтеза алгоритмических процедур решения предъявленной задачи; г) выдачи рекомендаций по синтезу алгоритмических процедур решения предъявленной задачи.

Необходимым условием достижения указанных целей является систематизация, структуризация и, в некотором смысле, формализация знаний в области обработки, анализа и распознавания изображений. Известно, что одним их эффективных способов представления знаний являются онтологии предметных областей. Онтологии служат для явного формального машинно-интерпретируемого описания семантики данных некоторой области знания и являются подходящим инструментом для представления знаний, используемых для извлечения информации из изображений. Необходимым начальным шагом на пути к созданию онтологии является разработка тезауруса предметной области как логико-понятийной основы этой онтологии. В этом смысле тезаурус должен быть специализированным, т.е. являться средством представления современного состояния рассматриваемой области знания, включать все основные понятия и фиксировать существующие связи между этими понятиями - представлять знания и понятийную структуру соответствующей предметной области.

Диссертационная работа посвящена построению формализованного представления предметной области «Анализ и оценивание информации, представленной в виде изображений». В качестве основных разделов данной предметной области обычно выделяют обработку, анализ, распознавание и понимание изображений, причем для ее определения обычно используется обобщенный термин «Анализ изображений». В качестве способа формализации выбрано построение тезаурусного представления онтологии предметной области, т.е. создание специализированного тезауруса по анализу изображений.

Анализ изображений является чрезвычайно быстро развивающимся разделом информатики, в связи с чем его понятийная структура динамично изменяется. С другой стороны, эффективность исследований в области анализа изображений и решения прикладных задач анализа изображений в существенной степени зависят от стандартизации и формализации используемых описаний как собственно изображений, так и описаний методов их обработки, анализа и распознавания. Тезаурусное представление области анализа изображений можно использовать в качестве инструмента указанных стандартизации и формализации, а также обеспечения доступа квалифицированных и неквалифицированных пользователей, решающих задачи анализа изображений, к знаниям по анализу изображений, в том числе, например, с помощью создания соответствующих интернет-ресурсов. Существенным при этом является то обстоятельство, что тезаурус по анализу изображений и построенная на его основе онтология позволят использовать удобные и эффективные процедуры доступа к стандартизированным и структурированным представлениям этих знаний.

Таким образом, актуальной задачей является построение тезауруса по анализу изображений, необходимого для логической формализации данной предметной области, стандартизации понятийного аппарата, построения общих и частных онтологий предметной области и на этой основе автоматизации обработки, анализа, оценивания и распознавания изображений; для построения баз знаний по анализу изображений; для организации эффективного поиска и навигации в базах знаний по анализу изображений и для построения баз данных изображений.

Анализ литературы и личный опыт участия в ведущих международных конференциях по данной тематике показал, что специализированный тезаурус в области обработки, анализа, понимания и распознавания изображений в настоящее время отсутствует.

Цели и задачи диссертационной работы

Целью диссертационной работы является построение формализованного представления предметной области «Анализ изображений» в виде специализированного тезауруса по анализу изображений и на его основе экспериментальной версии онтологии по анализу изображений, которые: 1) позволят систематизировать плохо структурированный и продолжающий развиваться понятийный аппарат предметной области; 2) будут служить терминологической и понятийной основой для классификации и описания задач и методов обработки, анализа и распознавания изображений в базах знаний для работы с изображениями; 3) обеспечат автоматизацию информационного поиска в базах знаний по обработке, анализу и распознаванию изображений и базах данных изображений. Кроме того, тезаурус будет являться самостоятельным словарем-справочником, который поможет ориентироваться в данной предметной области, и обеспечит возможность создания на его основе информационно-справочного интернет-ресурса по обработке, анализу и распознаванию изображений.

Для достижения заявленной цели поставлены и решены следующие задачи: 1) исследование системы и логики знаний в области обработки, анализа, оценивания и понимания изображений; 2) разработка и обоснование структуры тезауруса по анализу изображений на основе оригинальной классификации задач и методов обработки, анализа и распознавания изображений; 3) отбор терминологии и разработка словника тезауруса по анализу изображений; 4) построение классификации задач обработки, анализа и распознавания изображений; 5) построение классификации методов обработки, анализа и распознавания изображений; 6) разработка базовой версии специализированного тезауруса по анализу изображений; 7) разработка экспериментальной версии онтологии анализа изображений на основе тезауруса по анализу изображений; 8) разработка концепции, архитектуры, функциональной схемы и требований к информационному наполнению информационно-справочного интернет-ресурса по обработке, анализу и распознаванию изображений на основе тезауруса по анализу изображений; 9) разработка метода использования тезаурусов и онтологий при решении задач анализа изображений.

Методы исследования

В диссертационной работе используются математические методы распознавания образов, методы обработки, анализа и распознавания изображений, методы дескриптивной теории анализа изображений, методы структурной лингвистики.

Результаты, выносимые на защиту

  1. Базовая версия тезауруса по анализу изображений.
  2. Экспериментальная версия онтологии анализа изображений на языке OWL.
  3. Концепция, архитектура, функциональная схема и требования к информационному наполнению информационно-справочного интернет-ресурса по обработке, анализу и распознаванию изображений.
  4. Классификация задач обработки, анализа и распознавания изображений.
  5. Метод использования тезаурусов и онтологий при решении задач анализа изображений.

Научная новизна

Основные результаты работы являются новыми и оригинальными. Научная новизна результатов определяется актуальностью работы, поскольку, как уже отмечалось выше, такой инструмент как тезаурус, необходимый для автоматизации анализа изображений, отсутствует. Задача разработки представления предметной области «Анализ изображений» в виде специализированного тезауруса и основанной на нем онтологии поставлена и решена впервые в мировой практике. Предложенный метод использования тезаурусов и онтологий при решении задач анализа изображений иллюстрирует прикладное значение разработанных тезауруса и онтологии. Информационно-справочный интернет-ресурс по обработке, анализу и распознаванию изображений в настоящее время также отсутствует.

Практическая ценность

Основными результатами работы являются специализированный тезаурус по анализу изображений и построенная на его основе экспериментальная версия онтологии рассматриваемой предметной области. Разработанные средства предназначены для использования в системах автоматизации обработки и анализа изображений, системах автоматизации научных исследований, системах автоматизации медицинской диагностики, для лингвистической поддержки мультимедийных баз данных и специализированных баз знаний, коммерческих хранилищ изображений, а также для решения других задач интеллектуализации и автоматизации принятия интеллектуальных решений на основе анализа и оценивания информации, представленной в виде изображений.

Практическая ценность диссертационной работы подтверждается полученными на основании ее результатов 2 патентами Российской Федерации (патент на изобретение и патент на полезную модель) и регистрацией разработок в Государственном регистре баз данных ФГУП НТЦ "Информрегистр"(3 регистрационных свидетельства) и в Федеральной службе по интеллектуальной собственности, патентам и товарным знакам (Роспатент) (2 свидетельства о государственной регистрации баз данных).

Результаты диссертационной работы используются в составе лингвистического обеспечения Государственной системы научно-технической информации (ГСНТИ), в т.ч. следующие средства представления онтологии предметной области информационных систем, разработанные при участии автора в ходе выполнения плановых НИР и зарегистрированные в аналитической службе ведения информационных языков ГСНТИ: 1) Информационно-поисковый тезаурус по анализу изображений (авторы: И.Б.Гуревич, Ю.О. Трусова, Д.М. Мурашов, В.Н. Белоозеров), рег. № 131.06, 31.10.2006; 2) Рубрикатор «Распознавание образов. Анализ изображений» (авторы: И.Б.Гуревич, Ю.О.Трусова, В.Н.Белозеров), рег. № 831.06, 31.10.2006. (на основе данной разработки внесены изменения и дополнения в соответствующий раздел Рубрикатора ВИНИТИ РАН); 3) Тезаурус цитогематологических терминов для системы анализа изображений клеток крови (авторы: И.Б.Гуревич, Ю.О.Трусова, Н.Е.Шкловский-Корди, В.Н.Белоозеров), рег. № 131.06, 31.10.2006.

Полученные теоретические результаты и фактические сведения, содержащиеся в диссертационной работе, используются в ВИНИТИ РАН для систематизации научной и технической литературы по проблеме обработки и анализа изображений.

Апробация полученных результатов

В основу диссертационной работы положены результаты, полученные автором в ходе исследований, проводимых в рамках НИР по проектам ФЦП «Интеграция» (2001-2004гг.), по проектам ФЦНТП "Исследования и разработки по приоритетным направлениям развития науки и техники" на 2002-2006 гг. (проекты №№ 37.011.11.0015, 37.011.11.0016), по проектам Программы фундаментальных исследований Президиума РАН «Математическое моделирование и интеллектуальные системы» (проект № 2.14, 2001-2005 гг.), по проектам Программы Президиума РАН П-14 «Фундаментальные проблемы информатики и информационных технологий» (проект №214, 2006-2008гг.); по проектам Международной Ассоциации содействия сотрудничеству с учеными из новых независимых государств бывшего Советского Союза (проект № 04-77-7067, 2005-2006гг.); по проектам Программы российско-итальянского сотрудничества по Соглашению РАН-НСИ (2005–2007гг.) и по проектам Российского фонда фундаментальных исследований (проекты №№ 01-07-90016, 01-07-90017, 02-01-00182, 03-07-90392, 03-07-06057, 04-07-90187, 04-07-90202, 05-07-08000, 05-01-00784, 06-01-81009, 06-07-89203, 07-07-13545, 08-01-00469, 08-01-90022).

Pages:     || 2 | 3 | 4 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»