WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 | 2 || 4 |

К техническим задачам распознавания изображений можно отнести: 1) приведение изображения к виду, удобному для распознавания: 1а) оценка информативности и адекватности признаков, использованных при построении модели изображения, фрагментов изображения или представленных на нем объектов; 1б) определение и оценивание статистических характеристик признаков изображения, фрагментов изображения или представленных на нем объектов; 1в) оценка адекватности модели изображения, фрагментов изображения или представленных на нем объектов; 2) выбор модели алгоритмов распознавания для использования при решении предъявленной задачи распознавания; 3) выбор алгоритма в выбранной модели алгоритмов; 4) адаптация, обучение и модификация выбранного алгоритма применительно к предъявленной задаче распознавания; 5) комбинирование алгоритмов с целью решения предъявленной задачи распознавания и построение алгоритмической схемы, обеспечивающей решение задачи.

Описанную выше классификацию задач обработки, анализа и распознавания изображений можно использовать в качестве основы для построения базовой непротиворечивой классификации методов, т.е. каждой выделенной задаче необходимо поставить в соответствие группу методов, используемых для ее решения, например, методы фильтрации изображений, методы обнаружения яркостных переходов и т.д. Верхние уровни такой классификации методов зафиксированы в ТАИ. Далее каждый из выделенных классов методов можно разбивать на подклассы, исходя уже из индивидуальных особенностей каждого класса. Такая классификация требует глубокого изучения и детального исследования соответствующих подразделов предметной области и будет проведена в рамках дальнейших исследований.

В разделе 2.2 приводится общая характеристика базовой версии ТАИ.

Базовая версия ТАИ представляет собой тезаурус предметной области «Анализ изображений», содержащий 939 словарных статей. ТАИ обладает следующими характеристиками:

  • Дескрипторы базовой версии ТАИ представлены на английском языке с указанием русскоязычных эквивалентов. Большая часть дескрипторов снабжена определениями понятий (на английском языке) со ссылкой на источник.
  • Базовая версия ТАИ включает 7 тематических разделов: раздел «IMAGE» («Изображение»); раздел «IMAGE PROCESSING» («Обработка изображений»), раздел «IMAGE ANALYSIS» («Анализ изображений»), раздел «IMAGE RECOGNITION» («Распознавание изображений»); раздел «PATTERN RECOGNITION» («Распознавание образов»), раздел «APPLIED PROBLEMS» («Прикладные задачи»); раздел «MATHEMATICS» («Математический аппарат»).
  • В базовой версии ТАИ зафиксированы следующие виды связей между терминами: эквивалентная связь (аббревиатуры и общепринятые сокращения, английские и американские варианты написания терминов, краткие формы терминов), иерархическая связь (отношения типа «род-вид» и «часть-целое») и ассоциативная связь.
  • Количественные характеристики базовой версии ТАИ: общее число словарных статей - 939, в том числе: общее число словарных статей дескрипторов - 468, общее число словарных статей аскрипторов - 471. Общее число словарных статей с определениями - 425. Максимальная глубина иерархии - 6.
  • ТАИ разработан в соответствии с существующими российскими и международными стандартами и реализован в печатном и электронном виде. Печатный вариант ТАИ состоит из 2-х частей: алфавитного перечня всех терминов, включенных в ТАИ, и лексико-семантического указателя - перечня словарных статей, расположенных в алфавитном порядке заглавных дескрипторов. Печатный вариант базовой версии ТАИ приведен в приложениях 1 и 2 к диссертационной работе. Электронный вариант ТАИ представляет собой программный модуль, который может быть использован как в составе баз знаний для работы с изображениями, так и отдельно в качестве самостоятельного словаря-справочника.
  • ТАИ предназначен для решения следующих задач: 1) классификация и унификация понятий предметной области; 2) классификация методов и задач обработки, анализа, понимания и распознавания изображений; 3) построение описаний методов и задач обработки, анализа, понимания и распознавания изображений в базах знаний для поддержки анализа изображений; 4) автоматизация информационного поиска в базах знаний для поддержки анализа изображений; 5) классификация, индексирование и поиск библиографической и справочной информации по данной тематике; 6) автоматизация обучения в области обработки, анализа и распознавания изображений.

В разделе 2.3 описан подход и основные этапы создания онтологии предметной области «Анализ изображений» (ОАИ) на основе разработанного тезауруса.

Введем определения основных понятий, которые будут использоваться далее.

Задачи, связанные с обработкой и анализом изображений, как правило, характеризуются конечной целью, которую необходимо достичь, входными данными и требованиями к результату. Формально определение понятия «задача» выглядит следующим образом.

Определение 1. Задача T(GT, IT, RT, CT,) определяется целью GT, входными данными IT, набором требований RT и контекстом CT, где цель GT - искомый результат решения задачи; IT – описание входных данных; RT - требования к конечному результату; контекст CT - любая информация полезная для решения задачи.

Как правило, для решения одной и той же задачи могут быть использованы разные методы.

Определение 2. Метод – алгоритмическая процедура, набор алгоритмических процедур или алгоритмическая схема, обладающие следующими свойствами: областью применимости - перечнем задач, которые данный метод, позволяет решить; входными и выходными данными; набором подзадач, решение которых необходимо для реализации данного метода (составной метод), или некоторым оператором (простым или составным) (простой метод).

Множество {MT} – множество методов решения задачи T(GT,IT,RT,CT,), если MT: (IT,RT,CT)=>GT, где цель GT - искомый результат решения задачи; IT – описание входных данных; RT - требования к конечному результату; контекст CT - любая информация полезная для решения задачи.

Для представления ОАИ был выбран язык описания онтологий OWL (Ontology Web Language). OWL-онтология состоит из следующих компонентов: классы, свойства классов и индивиды (представители классов или свойств).

В соответствии с определением 1 был введен один из основных классов ОАИ - класс Task (Задача), который описывает задачи, возникающие при работе с изображениями. Данный класс имеет следующие свойства: 1) свойство goal (цель), значением которого является символьная строка, например, «улучшение контраста изображения»; 2) свойство hasSubtask (подзадача), значением которого являются один или несколько элементов класса Task (задача); 3) свойство hasInput (входные данные), значением которого являются элементы класса Data (Данные); 4) свойство hasContext (контекст), значением которого являются элементы класса Context (Контекст); 5) свойство hasRequirements (требования), значением которого являются элементы класса Requirements); 6) свойство isSovedBy (решается с помощью), значением которого являются элементы класса Method.

Экспериментальная версия ОАИ включает следующие подклассы класса Task: класс CompressionTask (задача сжатия), класс DetectionTask (задача выделения), класс EnhancementTask (задача улучшения качества), класс RestorationTask (задача восстановления), класс SegmentationTask (задача сегментации).

Аналогично в соответствии с определением 2 был введен класс Method (Метод) ОАИ, который описывает существующие алгоритмы обработки, анализа и распознавания изображений. Данный класс имеет следующие основные свойства:1) свойство solves (решает), значением которого являются один или несколько элементов класса Task (Задача); 2) свойство useContext (контекст), значением которого являются элементы класса Context (Контекст); 3) свойство hasInput (входные данные), значением которого являются элементы класса Data (Данные); 4) свойство hasResult (результат), значением которого являются элементы класса Data (Данные); 5) свойство isPerformedBy (реализуется с помощью), значением которого являются один или несколько элементов класса Operator (Оператор).

Класс Operator (Оператор) описывает известные операторы изображений.

Иерархия подклассов класса Method (Метод) построена в соответствии с иерархией подклассов класса Task (Задача), например, для класса SegmentationTask (задача сегментации) существует соответствующий класс SegmentationMethod (метод сегментации), содержащий описания существующих методов, используемых для решения задач сегментации изображений. На рис. 2 показана связь между основными классами ОАИ.

Рис.2. Связь между основными классами ОАИ.

Следует отметить, что к настоящему моменту разработана экспериментальная версия онтологии, которая базируется на результатах и подходе к обработке, анализу и распознаванию изображений научной школы академика Ю.И.Журавлева, отражает представление автора о концептуальной основе предметной области и существенно использует структуру и наполнение базовой версии ТАИ. Естественно, что в дальнейшем данная версия онтологии должна послужить основой для разработки более полных, а также специализированных онтологий по обработке, анализу и распознаванию изображений, с учетом точек зрения и экспертной оценки широкого круга ученых и специалистов в данной предметной области.

Третья глава посвящена решению задачи 8 диссертационной работы, связанной с созданием информационно-справочного интернет-ресурса (ИСИР) по обработке, анализу и распознаванию изображений.

Предложенный в рамках данной работы ИСИР на основе тезауруса предметной области обеспечит интеграцию и систематизацию существующих источников информации по рассматриваемой тематике, позволит производить семантически - и тематически-ориентированный поиск необходимых данных в терминах предметной области портала (на русском и английском языках) и обеспечит удобную навигацию.

Предлагаемый ИСИР будет размещаться на сервере в сети Интернет и представлять собой научно-информационный портал знаний, содержащий: 1) специализированный тезаурус по анализу изображений (ТАИ); 2) документально-библиографическую БД с информацией о публикациях и изданиях (статьях, монографиях, журналах, сборниках трудов конференций, диссертациях, научных отчетах), посвященных проблеме обработки, анализа, распознавания и понимания изображений; 3) упорядоченный каталог информационных ресурсов по рассматриваемой тематике (адресно-справочная БД), содержащий информацию по следующим разделам: научные и образовательные интернет-ресурсы; словари и глоссарии; электронные библиотеки; библиографические базы данных; научные семинары и конференции; научные ассоциации и сообщества; научно-исследовательские организации, коллективы и персоналии; научное ПО и научные поисковые системы; 4) средства поиска информации в сети Интернет, обеспечивающие: формирование, уточнение и расширение запроса пользователя на основе и с помощью тезауруса; передачу сформированного запроса на известные поисковые системы; отображение результатов поиска.

ТАИ является не только самостоятельным информационным ресурсом, но и будет выполнять структурообразующую функцию ИСИР. ТАИ является инструментом для классификации, описания и поиска информации, содержащейся в ИСИР. Следует отметить, что в ИСИР будет использоваться расширенная версия ТАИ. Помимо информации, зафиксированной в базовой версии, словарные статьи ТАИ ИСИР будут содержать ссылки на соответствующие публикации и издания из документально-библиографической БД, а также ссылки на другие материалы ИСИР, связанные с тем или иным понятием, описанным в ТАИ. Поиск ресурсов может вестись двумя способами: 1) поиск по ключевым словам; 2) навигация по ТАИ, то есть поиск сначала нужного понятия в ТАИ с последующим запросом ресурсов, соответствующих этому понятию. При поиске ресурсов по ключевым словам поисковая система может, используя ТАИ, расширять результаты поиска и выдавать пользователю не только ресурсы, соответствующие введенным пользователем ключевым словам, но и ресурсы, соответствующие связанным с ними понятиям.

В соответствии с общей концепцией разработаны архитектура и функциональная схема ИСИР. Предложенная архитектура включает 2 основные части: 1) программный комплекс разработки и сопровождения ИСИР; 2) серверная часть.

Программный комплекс разработки и сопровождения ИСИР предназначен для формирования проблемно-ориентированного наполнения БД ИСИР. Основные функции комплекса: 1) наполнение документально-библиографической БД; 2) наполнение адресно-справочной БД; 3) наполнение БД ТАИ. В состав комплекса входят: 1) БД ИСИР, содержащая БД ТАИ, документально-библиографическую и адресно-справочную БД; 2) оконные интерфейсы ввода и редактирования записей БД; 3) интерфейс для экспорта данных в серверную часть; 4) управляющая подсистема, которая обеспечивает взаимодействие и обмен информацией между всеми функциональными модулями комплекса.

Серверная часть ИСИР включает: а) HTML страницы ресурса; б) скрипты функций, программно-генерируемых запросов и страниц-интерфейсов ИСИР; в) БД сервера.

БД серверной части имеет структуру, аналогичную структуре БД ИСИР. Кроме того, в состав БД сервера входят служебные таблицы, предназначенные для администрирования БД ресурса (таблицы содержат перечень пользователей и их права, а также набор стандартных запросов к БД).

Предложенная архитектура ИСИР позволяет модифицировать отдельные компоненты независимо от других элементов ИСИР и в дальнейшем пополнять ресурс новыми функциональными элементами.

Глава четыре посвящена решению задачи 9 диссертационной работы.

В разделе 4.1 описан оригинальный метод использования тезаурусов и онтологий при решении задач анализа изображений, включающий набор условий, необходимых для его применения, и собственно описание итерационных шагов метода.

Pages:     | 1 | 2 || 4 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»