WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     || 2 | 3 |
2 РОСТОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Работа выполнена в НИИ нейрокибернетики им. А.Б. Когана Ростовского государственного университета

На правах рукописи

Научный консультант: доктор биологических наук

, профессор Владимирский Б.М.

Официальные оппоненты: доктор технических наук, ШАПОШНИКОВ ДМИТРИЙ ГРИГОРЬЕВИЧ профессор Божич В.И.

доктор физико-математических наук, кандидат технических наук, с.н.с. Покровский А.Н.

ИССЛЕДОВАНИЕ И МОДЕЛИРОВАНИЕ БИОНИЧЕСКИХ ПРИНЦИПОВ ИДЕНТИФИКАЦИИ И

Ведущая организация: Институт прикладной физики РАН (г. Нижний Новгород) КОНТЕКСТНОГО ОПИСАНИЯ ИЗОБРАЖЕНИЙ 05.13.18 - Математическое моделирование, численные

Защита состоится 26 декабря 2002 г. в 1100 часов на заседании диссертационного совета К.212.208.04 по физико-математическим и методы и комплексы программ техническим наукам при Ростовском госуниверситете по адресу:

344090, г. Ростов-на-Дону, пр. Стачки, 200/1, корпус 2, ЮГИНФО РГУ.

С диссертацией можно ознакомиться в научной библиотеке РГУ по А в т о р е ф е р а т адресу: ул. Пушкинская, 148.

диссертации на соискание ученой степени кандидата технических наук

Автореферат разослан 22 ноября 2002 г.

Ростов-на-Дону 2002

Ученый секретарь диссертационного совета, кандидат физико-математических наук Муратова Г.В.

3 4

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

1988]. Однако на низких уровнях разрешения может происходить потеря специфических деталей изображения. С другой стороны, Актуальность исследования. Важной проблемой при создании алгоритмы, использующие детальное описание каждого фрагмента технических систем обработки визуальной информации является изображения, становятся очень чувствительными к различным инвариантное распознавание изображений по отношению к изменению искажениям и требуют больших вычислительных затрат.

масштаба, повороту, условиям освещения, уровню сигнал-шум и т.д. Данная работа преемственно связана с исследованиями, [Балухто А. Н., Галушкин А. И., 2002; Журавлев Ю.И., 1998; Ben-Arie проведенными ранее в лаборатории нейроинформатики сенсорных и J., Nandy D., 1998; Furmanski C. S., Engel S. A., 2000]. В рамках этой моторных систем НИИ нейрокибернетики им. А.Б. Когана РГУ, в проблемы можно выделить несколько принципиальных аспектов, частности с поведенческой моделью распознавания полутоновых связанных с разработкой алгоритмов, устойчивых к широкому изображений [Гусакова В.И. и др., 1994; Rybak I.A. et al, 1998], и диапазону преобразований изображений, поиском способов для направлена на поиск эффективных алгоритмов идентификации, необходимой и достаточной детализации описания изображений и классификации, описания и распознавания изображений различных минимизацией вычислительных затрат. классов на основе свойств их наиболее информативных областей.

В настоящее время при решении задач сжатия зрительной Особенности подхода, использованного при решении этих информации и инвариантного распознавания изображений интенсивно проблем, состоят в следующем: тесная связь модельных, развивается подход, основанный на разработке вычислительных нейрофизиологических и психофизических исследований;

алгоритмов, имитирующих принципы работы реальных зрительных использование бионических принципов для увеличения эффективности систем (бионический подход), который рассматривается как наиболее распознавания и минимизации вычислительных процедур; применение перспективный. В рамках бионического подхода особое внимание в качестве первичных одних и тех же локальных признаков и их уделяется разработке алгоритмов и методов определения наиболее комбинаций, выделение которых не требует сложных вычислений.

информативных областей (НИО) изображений для детальной Цель и задачи исследования. Целью работы является разработка и обработки, как аналогов биологических механизмов выбора исследование бионических алгоритмов и методов идентификации, перцептуально важных фрагментов при осмотре изображений [Hjelms классификации и контекстного описания информативных областей E., Kee B., 2001; Huang J., Wechsler H., 1999]. Очевидно, что детальная изображений, а также создание модели распознавания образов и обработка не всего изображения, а отдельных его фрагментов, может применение ее в задачах инвариантного распознавания изображений существенно уменьшить вычислительные затраты и увеличить лиц и дорожных знаков.

эффективность распознавания. Однако, имеющиеся в настоящее время В процессе работы решались следующие задачи:

факты и представления о механизмах зрительного восприятия в 1. Разработка алгоритмов идентификации и контекстного описания биологических системах, неполны и недостаточно формализованы для НИО изображений различных типов.

того, чтобы быть детально воспроизведенными в системах 2. Разработка алгоритмов классификации изображений на основе искусственного зрения. Кроме того, известные в литературе методы геометрических свойств НИО.

идентификации НИО не обладают свойством инвариантности и/или 3. Тестирование разработанных алгоритмов в вычислительных требуют большого объема вычислений [Wechsler H., 2002]. Поэтому экспериментах для выбора их параметров и оценки диапазона решение задач поиска эффективных алгоритмов детектирования НИО инвариантности к различным преобразованиям изображений.

для разных типов изображений по-прежнему остается актуальным. 4. Разработка программно-аппаратного стенда и проведение Принципиально важным остается также и поиск алгоритмов, верификационных психофизических экспериментов по исследованию обеспечивающих сжатое и вместе с тем специфичное описание возможных механизмов выбора точек фиксации взгляда.

фрагментов изображений при сохранении инвариантности к 5. Создание модели распознавания образов и ее тестирование на различным трансформациям. Одним из широко используемых методов примере изображений лиц и дорожных знаков.

инвариантного описания является представление изображения на Научная новизна результатов исследования. Разработан комплекс нескольких уровнях разрешения [Schwartz E.L. et al, 1995; Берт П.Д., новых эффективных алгоритмов и методов идентификации НИО и 5 классификации на основе их свойств изображений различных типов. 2002 г (г. Москва, Россия); на семинаре РАСНИ в 2001 г. (г. Москва, Впервые показано, что для НИО характерны специфические Россия); на VIII Всероссийской конференции "Нейрокомпьютеры:

комбинации первичных признаков, таких, например, как разно- разработка и применение" в 2002 г. (г. Москва, Россия); на ориентированные локальные перепады яркости, выделенные на разных конференциях молодых ученых в 1996-1999 г (г.Ростов-на-Дону, уровнях разрешения. Алгоритм классификации в соответствии с видом Россия); на школе-семинаре "Нейроинформатика, нейрокибернетика, изображений, их фрагментов и ракурсом основан на оценке нейрокомпьютеры" по программе "Интеграция" в 1998г. (г.Ростов-нараспределения ориентированных элементов, выделенных в пределах Дону, Россия); на Российско-финской зимней школе-семинаре НИО, и на оценке пространственного расположения этих областей. ”Information transfer, data and bio-organisms: from language to behavior” в Разработана оригинальная модель инвариантного 2000г. (г. Хельсинки, Финляндия); на семинаре Лаборатории распознавания изображений лиц и дорожных знаков, основанная на вычислительного эксперимента в 2002 г. (ЮГИНФО РГУ, г. Ростов-наспецифичном описании НИО в виде признаковых векторов, Дону); на заседании Санкт-Петербургского физиологического формирующихся с помощью пространственно-неоднородного сенсора общества им. И.М. Сеченова в 2002 г. (Институт физиологии им.

с контекстным описанием признаков в каждом узле. И.П.Павлова РАН, г. Санкт-Петербург).

На качественном уровне получено экспериментальное Публикации. По теме диссертации опубликовано 34 работы, из них подтверждение гипотез компьютерного моделирования о наличии в международных журналах, 2 в российских журналах, 18 в тезисах локальной пространственной неоднородности остроты зрительного международных конференций, 9 в тезисах российских и студенческих восприятия в периферическом поле зрения человека. Результаты, конференций, 2 в различных сборниках и 1 депонирована в ВИНИТИ.

полученные в психофизических экспериментах, использованы при Основные 7 публикаций, содержащие наиболее полные результаты, разработке алгоритма контекстного описания изображений. приведены в конце автореферата.

Практическая значимость. Разработанные алгоритмы, модели и Структура диссертации. Работа состоит из введения, четырех глав, программы могут быть использованы для решения различных заключения, списка литературы, двух приложений и изложена на прикладных задач инвариантного распознавания изображений лиц и странице, содержит 28 рисунков и 5 таблиц; список литературы дорожных знаков, в частности, в системах идентификации личности и включает 158 наименований.

системах автоматического управления автомобилем. Положения, выносимые на защиту.

Результаты работы использованы при выполнении гранта 1. Алгоритм признакового описания, состоящий в представлении РФФИ N 98-01-00948 и проекта российско-английского фрагмента изображения в виде вектора локальных признаков, сотрудничества между НИИ нейрокибернетики РГУ и Мидлсексским заполняемого с помощью пространственно-неоднородного сенсора университетом (Великобритания) "Разработка бионических моделей с учетом свойств признаков, выделенных в контекстной области зрения для распознавания реальных изображений". каждого его узла.

По результатам имитационных экспериментов разработаны 2. Каскадный метод идентификации НИО, включающий комплекс рекомендации по модификации геометрических свойств последовательно реализуемых алгоритмов и процедур, основанных предупредительных дорожных знаков. на выделении специфических комбинаций первичных признаков, Апробация работы. Результаты работы представлялись на характерных для этих областей.

Международной конференции по нейронным сетям "IJCNN'99" в 1999 3. Модель распознавания изображений лиц и дорожных знаков, г. (г. Вашингтон, США); на Международном совещании по основанная на идентификации НИО и их контекстном описании с возможностям нейрокомпьютинга в 1999 г. (г. Вашингтон, США); на помощью пространственно-неоднородного сенсора.

двух Международных конференциях по нейрокибернетике в 1999 г. и 2002 г. (г. Ростов-на-Дону, Россия); на 5-й и 6-й Международных СОДЕРЖАНИЕ конференциях "Распознавание образов и анализ изображений" в 2000 г.

и 2002 г. (г. Самара, г. Великий Новгород, Россия); на 1-й, 2-й и 4-й Во введении обоснована актуальность работы, определена цель Всероссийской конференции "Нейроинформатика" в 1999 г, 2000 г и исследований, отмечена новизна результатов, их научная и 7 практическая ценность, сформулированы основные положения, специфичности описания изображений. Анализируются существующие выносимые на защиту. методы и алгоритмы идентификации фрагментов изображения для Первая глава, состоящая из 3-х разделов, посвящена аналитическому детального анализа. Показано, что многие алгоритмы и методы либо обзору литературы по проблеме инвариантного описания и детектируют значительное количество потенциальных "точек распознавания изображений. интереса" вне НИО, либо не обеспечивают инвариантной В первом разделе описываются общие подходы к решению идентификации НИО при изменении ракурса и размера. С другой проблемы инвариантного распознавания изображений. Эти подходы стороны, для алгоритмов, имеющих высокую детекторную точность, можно условно разделить на два основных класса. В подходах первого авторы подчеркивают их вычислительную сложность и необходимость класса решение ищется на пути оптимизации стандартных для систем включения механизмов внимания и обучения как существенных искусственного зрения вычислительных процедур и алгоритмов. К компонент.

данному подходу относятся, известные классические методы: В третьем разделе на основе проведенного аналитического алгебраические, статистические, потенциальных функций, главных и обзора рассматривается постановка задач данного исследования.

независимых компонент, использование масок и пр. Обосновывается необходимость разработки эффективных алгоритмов Проанализированы ограничения стандартных методов при и методов идентификации информативных областей и специфического распознавании изображений, полученных в реальных условиях. описания изображений, полученных в реальных условиях, для решения В основе подхода второго класса лежит разработка проблем инвариантного распознавания.

вычислительных алгоритмов и моделей, имитирующих принципы Вторая глава, состоящая из 3-х разделов, посвящена описанию работы реальных зрительных систем (бионический подход). Эти разработанных алгоритмов контекстного описания изображений, подходы развиваются в нескольких направлениях, различающихся по обеспечивающих специфичное представление фрагментов степени биологической обоснованности, вычислительным алгоритмам, изображения. Приводятся результаты собственных психофизических архитектуре систем и пр. Основным их преимуществом по сравнению экспериментов, позволившие разработать алгоритм контекстного со стандартными методами является резкое уменьшение объема описания признаков фрагментов изображения в каждом узле обрабатываемой информации за счет того, что детально описываются пространственно-неоднородного сенсора.

только информативные фрагменты изображения. Однако по ряду В первом разделе описывается математический аппарат причин известные в настоящее время бионические алгоритмы также не предварительной обработки изображения. Исходное изображение обеспечивают приемлемого решения проблемы. В конце раздела рассматривалось как двумерный массив размера XxY, каждым I(i,j) делается вывод о том, что поиск решения проблемы инвариантного элементом которого является его яркость. Для представления представления и распознавания изображений должен проводиться с изображения на разных уровнях разрешения исходное изображение помощью сочетания эффективных алгоритмов, разработанных в подвергалось стандартной процедуре [Марр Д., 1987; Берт П.Д., 1988] рамках обоих подходов. последовательной фильтрации с помощью преобразования Гаусса:

Pages:     || 2 | 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»