WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 || 3 |

Во втором разделе представлены известные алгоритмы l l - (1) I (i, j) = (g( p,q) I (i + p, j + q)), описания изображений и их отдельных фрагментов. Особое внимание p q уделено алгоритмам пространственно-неоднородного и контекстного описания изображений. В основе этих алгоритмов лежит тот факт, что 1 p 2 + q в реальной зрительной системе плотность фоторецепторов сетчатки g ( p, q) = exp 2 ; p,q = -2,-1,0,1,2; i,j- координаты где максимальна в центральной области (фовеа) и убывает к периферии, в 2 то время как размер рецептивных полей нейронов, напротив, точки изображения; l - уровень разрешения (l=1,2,…m); при этом увеличивается. Сочетание представления изображения на разных исходное изображение рассматривалось как изображение наибольшего уровнях разрешения и контекстного описания отдельных его разрешения.

фрагментов рассматривается в качестве наиболее эффективного Для выделения ориентированных перепадов яркости и построения способа для обеспечения одновременно инвариантности и первичных ориентационных O(i,j) и контрастных E(i,j) карт 9 использовалась разность ориентированных гауссианов со сдвинутыми в микрообласти с высокой остротой сенсорной настройки, могут центрами: являться потенциальными зонами притяжения взгляда.

В третьем разделе предлагается алгоритм разноуровневой и 1 (i - )2 + ( j - a )a контекстной обработки зрительной информации в пределах отдельных G+ (i, j,a) = expфрагментов, основанный на специфической структуре 2 2 пространстввенно-неоднородного сенсора и каждого его узла, а также (2) на данных психофизических экспериментов.

1 (i + )2 + ( j + a )В основе алгоритма контекстного описания фрагментов a G- (i, j,a) = expизображения лежит формирование признаковых векторов в 2 2 соответствии с топологией пространственно-неоднородного сенсора, являющегося модификацией разработанного ранее "окна внимания" 2a 2a где [Rybak I.A. et al, 1998]. Пространственно-неоднородный сенсор a = sin = cos, - параметр a 16 представляет собой структуру, содержащую один базовый (центральный) узел и 48 периферических узлов, расположенных на преобразования Гаусса.

пересечении 3-х концентрических окружностей, имитирующих Ориентация перепадов яркости a определялась с шагом 22.5° и пространственно-неоднородную структуру сетчатки (разные уровни кодировалась как 0,1,….15.

разрешения), и 16-ти лучей, исходящих из центра (рис. 1а). Для каждой Второй раздел главы посвящен описанию результатов точки фиксации сенсора выделяются ориентированные перепады психофизических экспериментов, которые были направлены на яркости в центральной области обрабатываемого фрагмента и в верификацию предположений [Podladchkova L.N. et al, 1997] контекстных областях периферических узлов сенсора, причем имитационных экспериментов о возможных механизмах контекстного выделение этих перепадов осуществляется на разных уровнях кодирования зрительной информации и наличии локальной разрешения, соответствующих расстоянию от центра.

пространственной неоднородности остроты восприятия в периферическом поле зрения. Описаны разработанная методика и программно-аппаратный стенд для проведения психофизических экспериментов по определению пространственной динамики одного из параметров зрительного восприятия - остроты сенсорной настройки - в различных частях периферического поля зрения с шагом 2°. Наряду с известным экспоненциальным падением остроты сенсорной настройки от центра поля зрения к периферии в макромасштабе, обнаружена также ее локальная неоднородность, проявляющаяся в чередовании в периферическом поле зрения областей с высокой и низкой остротой зрительного восприятия с периодом 4°10°. Статистическая оценка полученных результатов показала достоверное (р<0,05) различие между минимумами и максимумами по количеству точек с низкой а б остротой сенсорной настройки.

Рис.1. (а) Структура пространственно-неоднородного сенсора.

Полученные результаты свидетельствуют о локальной Ориентация перепада яркости, доминирующая в контекстной области неоднородности сенсорной настройки в периферическом поле зрения и одного из узлов сенсора, показана в белом круге. (б) Распределение наличии микрозон с различной остротой восприятия. Очевидно, в ориентированных элементов, выделенных в контекстной области микрообластях с низкой остротой сенсорной настройки затруднено данного узла.

восприятие зрительной информации, и они могут игнорироваться при осмотре изображения. Напротив, части изображения, проецирующиеся 11 Фрагмент изображения в каждой точке фиксации сенсора разно-ориентированные контрастные локальные перепады, выделенные на разных уровнях разрешения. Метод включает в себя описывается с помощью признакового вектора F(, ), следующие пять процедур, выполняемых последовательно:

компонентами которого являются ориентация ( =0,1,…15), (1). Выделение ориентированных локальных перепадов яркости, контраст которых превышает порог, равный половине средней имеющая наибольшее ( N ) представительство в контекстной области величины контраста по всему изображению для каждого уровня разрешения.

(рис. 1б), и доля элементов, имеющих эту ориентацию в пределах (2). Построение двух частных признаковых карт.

контекстной области каждого периферического узла. Доля Для получения первой из них по всему изображению N, где - площадь контекстной области оценивается распределение контрастов локальных перепадов, значения определяется как Sk = которых превышают порог, равный удвоенной величине среднего Sk значения контраста. Для получения второй карты в каждом локальном k-го периферического узла, размер которой пропорционален уровню фрагменте изображения размером 5 x 5 с центром в точке (i,j) разрешения и увеличивается в соответствии с расстоянием от центра.

оценивается количество перепадов, ориентация которых в некотором Такой способ описания фрагментов изображения учитывает диапазоне углов отличается от ориентации центрального перепада в признаки, выделенные в контекстном окружении каждого данном фрагменте. По результатам вычислительных экспериментов периферического узла, что обеспечивает специфичность представления был определен оптимальный диапазон изменения относительной данного фрагмента, сжатие исходной информации, в среднем, в 25 раз ориентации периферического перепада яркости (от 90° до 270°), при и инвариантность к позицированию в диапазоне, зависящему от котором коэффициент избирательности частной угловой карты был размера контекстной области на выбранном уровне разрешения.

максимален (в среднем 0.55). Коэффициент избирательности Разработанная структура пространственно-неоднородного сенсора с определялся как отношение количества "точек интереса", контекстным описанием признаков в каждом периферическом узле расположенных в пределах НИО, к общему количеству выделенных использовалась при обработке всех тестовых изображений.

точек.

Третья глава посвящена описанию методов и алгоритмов (3). Построение итоговой карты распределения "точек интереса" на инвариантного детектирования и идентификации информативных изображении.

областей на примере изображений лиц и дорожных знаков.

В процессе получения итоговой карты, для каждого уровня Тестирование разработанных процедур проводилось с использованием разрешения две частные признаковые карты совмещались "точка в изображений лиц из базы ORL1 (n=400) и базы изображений точку". Затем полученные промежуточные карты для разных уровней стандартных дорожных знаков Великобритании (n=100), объединялись по области 3 x 3 для учета возможных смещений сканированных из книги правил дорожного движения High Way Code.

первичных признаков, выделенных на разных уровнях разрешения.

Глава состоит из двух разделов.

Описанные процедуры получения итоговой карты обеспечивали В первом разделе описан каскадный метод идентификации относительно высокий коэффициент избирательности (в среднем, 85% НИО, базирующийся на экспериментальных исследованиях траекторий "точек интереса" было расположено в пределах НИО) для каждого из осмотра изображений лиц, в которых было показано, что НИО трех ракурсов изображения (т.е. детектировали НИО инвариантно являются области глаз, носа и рта [Ярбус А.Л., 1965]. Метод основан ракурсу). Примеры итоговых карт распределения "точек интереса" для на предположении [Головань А.В. и др., 2001], что НИО имеют изображения одной и той же персоны в трех ракурсах иллюстрирует специфические комбинации первичных признаков, привлекающие ряд 1 на рис. 2.

зрительное внимание. В качестве первичных признаков были выбраны (4). Группирование "точек интереса" и прореживание по плотности заполнения "областей интереса".

Для группирования строились распределения проекций "точек База изображений лиц ORL создана в Кембридже (Великобритания) и широко интереса" по координатным осям. Координаты максимумов по осям X применяется при тестировании различных алгоритмов анализа и распознавания изображений (http://www.cam-orl.co.uk/facedatabase.html) 13 и Y давали грубую оценку одноименных координат центров "областей Второй раздел третьей главы посвящен алгоритмам и интереса", а координаты двух ближайших к каждому максимуму процедурам идентификации НИО на изображениях дорожных знаков.

минимумов – грубые оценки одноименных координат границ области. Очевидно, что для данного типа изображений существенной Затем в пределах полученных границ уточнялись координаты центра и информативной областью, наряду с внутренней частью знака, является размеры каждой из "областей интереса" с помощью метода и внешний контур. Определение цвета и границы внешнего контура "ближайшего соседа" [Павлидис Т., 1986]. Прореживание по плотности дорожного знака на изображении проводилось с помощью оценки заполнения "точками интереса" позволяло исключить из рассмотрения соотношения цветовых (RGB) компонент (рис.3). Алгоритм "области интереса" с малым их количеством, что увеличивало определения формы внешнего цветового контура основан на оценке коэффициент избирательности до 0,9. гистограмм ориентированных элементов, выделенных вдоль границы (5). Определение типа "областей интереса". знака. Показано, что "круглые" знаки имеют равновероятное Процедура основана на сравнении гистограмм распределения представительство элементов разных ориентаций, тогда как для ориентированных перепадов яркости, выделенных в пределах каждой "прямоугольных" характерно доминирование элементов имеющих "области интереса", с усредненными гистограммами каждой НИО, горизонтальную и вертикальную ориентацию (в сумме 75% от общего предварительно полученными при участии оператора. Это числа выделенных элементов), а для "треугольных" сумма элементов, обеспечивало разделение "областей интереса" на НИО (глаза, нос, рот) имеющих характеристическую ориентацию, составила более 85%. Для и на области, не относящиеся к информативным (уши, воротник, стандартной базы изображений знаков гистограммный метод элементы прически) и увеличение коэффициента избирательности до обеспечивает безошибочную классификацию в каждой цветовой 0,95 (ряд 2 рис.2 ). группе на подгруппы по форме внешнего контура.

Рис.3. Примеры определения центра и границы внешнего контура (слева) знака для базовых изображений (верхний ряд) и реальных изображений (нижний ряд).

Алгоритм нахождения центра информативной части знака основан на определении геометрического центра цветовых элементов Рис.2. Результаты обработки изображения одной и той же персоны в внешнего контура. Он обеспечивает необходимую точность разных ракурсах (колонки а-в) с помощью последовательных процедур детектирования центра (± 3 пикселя), нормализацию размера знаков и каскадного метода идентификации НИО. Ряд 1 – распределение "точек выделение “чистых” знаков (без внешнего фона) из изображений в интереса", ряд 2 – распределение "областей интереса", ряд 3 – схема реальной среде (рис.3, нижний ряд).

определения ракурса.

Четвертая глава описывает общую структуру разработанной бионической модели распознавания образов и ее модификации для 15 задач распознавания изображений лиц и дорожных знаков. Глава данной подгруппы базы эталонов, индекс rw – изображению, состоит из трех разделов.

предъявляемому для распознавания; - доля доминирующего перепада В первом разделе приводится схема разработанной модели, яркости в контекстной области.

состоящая из трех основных блоков. Первый блок реализует Программная реализация модели была выполнена в процедуры нижнего уровня обработки информации (получение операционной среде Windows 95/98/NT на языке Visual C++, версия изображения на разных уровнях разрешения, выделение первичных 6.0.

признаков и детектирование информативных областей) и Во втором разделе главы приводится описание модификаций нормализации изображений. Во втором блоке выполняются концептуальной модели для разработки системы распознавания процедуры, отнесенные к среднему уровню обработки визуальной изображений лиц. Для идентификации областей глаз, носа и рта информации, в частности – классификация изображений на основе применялся каскадный метод, подробно описанный в первом разделе геометрических свойств детектированных информативных областей.

третьей главы. В качестве характеристики взаимного расположения Третий блок обеспечивает формирование полного специфического НИО были выбраны длины отрезков между центрами выделенных описания изображений на основе детектированных НИО с помощью областей, нормированные на расстояние между центрами областей набора признаковых векторов, заполняемых в топологии глаз, и углы между отрезками, соединяющими центры НИО (ряд пространственно-неоднородного сенсора с контекстным описанием рис.2). Это позволяло с высокой вероятностью (p = 0,96) определять признаков, выделенных в окрестности каждого узла.

ракурс лица на изображении. После идентификации НИО и Модель предусматривает два режима работы – запоминание и классификации изображений по ракурсу пространственнораспознавание изображения. Независимо от режима работы модели, неоднородный сенсор позицировался в центре каждой из 3-каждое изображение подвергается всем процедурам обработки. В выделенных информативных областей. В режиме запоминания первом режиме формируется база эталонов, которая для каждого изображения классифицировались на три группы – фронтальный запоминаемого изображения содержит информацию о взаимном ракурс, левый и правый полупрофиль. Тестирование системы расположении информативных фрагментов, типе каждой НИО и о проводились с использованием части изображений базы ORL для признаковых векторах, описывающих каждую выделенную область.

Pages:     | 1 || 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»