WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 || 3 |

Первый метод (эллиптической деформации) использует деформируемую контурную модель /5/, форма которой задается эллипсом. Вдоль границы модели расположены области (называемые “щупами”), в которых происходит оценка плотности пикселей, близких по цвету к коже. Модель инициализируется вблизи ожидаемого положения лица на изображении, деформация модели производится по шагам. Для каждого “щупа” производится расчет плотности пикселей кожи во внутренней и внешней окрестности границы модели. В зависимости от полученных плотностей “щуп” перемещается пер(а) (б) Рис. 2. Иллюстрации к предлагаемым методам обнаружения лица. (а) Метод эллиптической деформации. (б) Метод статистических моментов пендикулярно границе модели. После того, как на каждом шаге все “щупы” занимают свое новое положение, набор точек центров “щупов” аппроксимируется эллипсом, после чего центры “щупов” проецируются на его границу.

Столь простая схема алгоритма гарантирует возможность получения быстрой программной реализации. Несмотря на простоту, она обладает высокой устойчивостью к различным исходным данным и не требует высокой точности начального приближения. Кроме того, она обладает большой гибкостью и позволяет с легкостью встраивать дополнительные условия и ограничения на возможную форму выделяемых областей (пропорции, положение, ориентации эллипса).

Задача отслеживания перемещения лица в видеопотоке обладает определенным особенностями по сравнению с обнаружением лица на статическом изображении - во-первых, известно положение лица на предыдущем кадре, и во-вторых, требуется быстрая сходимость метода. Учитывая эти особенности, предлагается метод статистических моментов отслеживания перемещения лица. Метод основан на вычислении статистических моментов множества пикселей цвета кожи, попадающих в эллипс большего размера, чем область лица на предыдущем кадре. Для пересчета новых параметров эллипса используются координаты центра масс пикселей с высокой вероятностью кожи µx, µy и центральные моменты второго порядка µ11, µ20, µ02. По ним вычисляются координаты нового центра эллипса (µx, µy), вектор направления его главной оси (µ11, µ20 - µ02 + (µ20 - µ02)2 + 4µ2 ) и длины его осей.

Сравнение предложенных методов с существующими показало, что предлагаемые автором методы обладают существенно более высокой устойчивостью к зашумленным исходным данным и ошибкам цветовой сегментации, сохраняя простоту программной реализации и высокую скорость работы, позволяющую использовать разработанные алгоритмы в системах реального времени.

Рис. 3. Примеры выделения областей лиц на изображениях с помощью предложенных методов Вторая глава посвящена описанию системы автоматического распознавания антропометрических точек лица (контуров глаз, зрачков, бровей, носа, подбородка, рта) на фронтальных изображениях для построения трехмерной модели головы человека по набору фотографий.

Для автоматизированного создания 3D модели по фотографии необходимым является распознавание антропометрических точек лица для последующей адаптации трехмерной модели к индивидуальным особенностям лица.

Большинство существующих систем автоматизированного построения модели головы по фотографиям используют ручное выделение антропометрических точек лица на изображениях. Алгоритмы, разработанные автором, и построенная на их основе система распознавания антропометрических точек лица позволяет в значительной степени автоматизировать этот процесс.

Для обнаружения области лица на изображении используются мето(а) (б) (в) (г) Рис. 4. Типичные примеры выделения антропометрических точек.

ды, описанные в первой главе. Следующим шагом в распознавании является обнаружение положения глаз на изображении. Обнаружение положения глаз производится с помощью поиска областей резкого изменения интенсивности красного канала путем фильтрации красного канала изображения функцией специального вида:

Vn(x, y) = I(r) - I(p) (0.1) |Rn,x,y| |Pn,r| rRn,x,y pPn,r Здесь I - красный канал исходного изображение, p и r обозначают координаты пикселей, Rn,x,y - прямоугольник размера (n 7), с центром в точке (x, y) а Pn,r - эллипс с размерами осей (nn/3), ориентированный по осям изображения, с центром в точке r. Коэффициент и масштаб фильтра n - параметры фильтрации. Использование красного канала сохраняет резкий контраст между интенсивностями пикселей радужной оболочки и ее окружения даже для светлых глаз (голубых, зеленых).

После обнаружения приблизительного положения глаз производится поиск координаты центра зрачка. В случае доминирующего фронтального освещения производится обнаружение пикселей, принадлежащих блику в центре зрачка. В случае освещения, близкого к равномерному, производится свертка изображения функцией, подчеркивающей круговые области темных пикселей.

sin((x2 + y2)/c) W (x, y, c) = (0.2) (x2 + y2)/c Параметр c контролирует радиус фильтра и выбирается исходя из соотношения размеров лица и радиуса радужной оболочки. Центр масс наиболее темных пикселей изображения после свертки берется в качестве приблизительного центра зрачка.

Вычисление радиуса радужной оболочки r и точных координат центра зрачка (xc, yc) производится с помощью следующей функции:

f(xc, yc, r) = R(xc + r cos, yc + r sin )d (0.3) где R(x, y) - красная компонента пикселя (x, y), = [-/4, /6] [5/6, 5/4]. Для заданных координат центра (xc, yc) наиболее вероятными значением радиуса радужной оболочки r будет величина, d соответствующая максимальному значению f. После обнаружения точdr ного положения центров глаз производится нормализация изображения (поворот и масштабирование). Отрезок, соединяющий центры глаз, делается горизонтальным, его длина приравнивается к фиксированной величине.

Обнаружение точного контура глаза производится путем поиска точек, являющихся локальными минимумами яркости в области границы глаза. Эксперименты показали, что в отличие от часто используемых точек резкого изменения яркости, точки локальных минимумов являются более устойчивыми признаками для распознавания контуров глаз. Как видно из рисунка 5, области значительных минимумов с высокой вероятностью соответствуют границе глаза и кожи. Обнаружение точек минимума производится отдельно для каждой строки изображения, рассматривая яркость изображения вдоль строки как одномерную функцию fy(x). Для того, чтобы снизить случайные флюктуации fy(x), перед поиском минимумов производится низкочастотная фильтрация функции.

Для обнаружения прямоугольника, ограничивающего область губ, применяется анализ статистики цветов области лица. На основе результатов обнаружения кожи строится гистограмма цветов кожи, попавших внутрь уточненного прямоугольника лица. Используя полученную гистограмму, внутри прямоугольника лица в районе ожидаемого положения губ выделяются пиксели нехарактерных для кожи данного человека цветов. Для вычисления прямоугольника используется итерационный алгоритм, основанный на вычислении центра масс и вторых центральных моментов области пикселей с низкой кожной вероятностью.

Рис. 5. Точки значительных локальных минимумов яркости для обнаружения контуров век Для обнаружения контуров носа используется векторное поле градиента яркости изображения. Для обнаружения границ ноздрей используется метод контурных шаблонов, представляющих собой типичную форму крыльев носа.

Критерий согласия шаблона и изображения вычисляется следующим образом:

GoF (q) = F it(p) (0.4) pS(q) - - I(r)·a(p) 1, если r (p) : 0.9, |I(r)| > T1;

- - F it(p) = (0.5) |I(r)||a(p)| 0, иначе;

Где p, q и r - координаты пикселей изображения, S(q) - множество точек шаблона, (p) - окрестность точки p, I(r) - градиент яркости изображения в точке r, a(p) - вектор касательный к кривой шаблона в точке p. T1 задает минимальную абсолютную величину градиента. F it(p) является индикаторной функцией, проверяющей наличие точек с достаточной абсолютной величиной градиента и направлением, близким к направлению касательной к кривой шаблона в окрестности точки шаблона p. Для обнаружения наиболее вероятной пары анализируются пары координат шаблона с высокими значениями критерия согласия в левой и правой части лица. Вычисление кривых формы носа производится, исходя из полученных координат крыльев носа, контуров глаз и априорных знаний о пропорциях черт лица.

Обнаружение контура лица (линии щек и подбородка) осуществляется с помощью деформируемой контурной модели. Как и в случае с контуром носа, обычно признаками обнаружения границы лица служили точки резкого изменения яркости, вычисляемые на основе абсолютной величины градиента яркости изображения. Как показали тесты описанных в литературе методов, использование такой информации в большом количестве случаев недостаточно для устойчивого распознавания. Во-первых, фон изображения, или его отдельные фрагменты, могут слабо отличаться по яркости от области лица.

Во-вторых, для устойчивого обнаружения границы лица требуется рассматривать также и направление наибольшего изменения яркости и цвета. Для обнаружения контура лица была разработана методика обнаружения величины и направления резкого изменения цвета - “цветовых краев” изображения.

Деформируемая модель, применяемая для обнаружения контура подбородка, инициализируется внутри области лица и расширяется в сторону границ лица до тех пор, пока не встретит достаточное количество пикселей с резким изменением цвета или яркости.

Реализация разработанных алгоритмов используется в системе автоматического построения моделей головы по двум фотографиям (фронтальной и профильной). Результаты работы алгоритмов представлены на рисунке.

Третья глава описывает систему, реализующую управление передвижением курсора и срабатыванием кнопки “мыши” при помощи движений головы и мимики пользователя, регистрируемых видеокамерой. Разработка системы велась совместно с факультетом психологии МГУ им. М.В. Ломоносова. Сотрудник факультета психологии, к.ф.-м.н., д.ф.н. А.Н. Кричевец занимался разработкой общей концепции системы, необходимых требований к работе системы и характеру перемещения курсора в зависимости от действий пользователя. Перед автором стояла задача разработки и реализации алгоритмов определения движений головы и мимики пользователя в видеопотоке, а также трансляции движений головы в сигналы перемещения курсора.

Система предназначена для инвалидов, которые не могут справиться с клавиатурой и мышью - в первую очередь для детей, страдающих церебральным параличом. Этот недуг затрагивает прежде всего двигательный аппарат, однако подвижность головы в значительной степени сохраняется, что позволяет использовать движения головы для управления компьютером. Существует и другой тип управления, использующий распознавание направления взгляда для указание положения курсора на экране. Однако, как показывают исследования, проведенные в ряде лабораторий по разработке человеко-машинного интерфейса, взгляд используется человеком для обозначения области его фокуса внимания, а не для совершения действий. Движения глаз часто происходят неосознанно, и использование направления взгляда, как инструмента для управления курсором, ведет к заметному дискомфорту. Движения головой значительно лучше поддаются сознательному контролю со стороны пользователя.

Существующие коммерческие системы опираются на использование подсветки в инфракрасном диапазоне для облегчения обнаружения маркеров, располагаемых на лице или голове пациента. Цена систем, по функциональности аналогичных разработанной, колеблется от 900 до 15,000 долларов и требует инфракрасных источников света и видеокамер, чувствительных в ИК диапазоне. Разработанная система использует в качестве дополнительного оборудования бытовую видеокамеру стоимостью около двадцати долларов (дешевизна оборудования является необходимым условием для внедрения системы в отечественных медицинских центрах). Изображения, получаемые с нее, характеризуются низким разрешением (около 320x240 пикселей), высоким уровнем шума и низкой четкостью. Система должна функционировать на компьютере невысокой вычислительной мощности, оставляя достаточно вычислительных ресурсов для работы пользовательских приложений.

Для выполнения строгих требований к устойчивости распознавания в условиях низкого качества изображения, а также использования небольших вычислительных ресурсов, в системе используется реперная конструкция (шлем) с контрастными маркерами для облегчения задачи распознавания движения головы.

Положение маркеров на изображении, получаемом с видеокамеры, транслируется в сигналы перемещения курсора мыши. В системе используются три маркера - два расположены с левой и правой стороны головы, примерно на одинаковом удалении от камеры. Третий расположен примерно по центру между ними, на меньшем удалении от камеры. После обнаружения положений маркеров в текущем кадре производится вычисление координат центрального маркера в системе координат, связанной с двумя боковыми маркерами. Положение точки начала координат O вычисляется как среднее арифметическое координат боковых маркеров. Длины проекций вектора, соединяющего точку O с центральным маркером, на прямую, проходящую через центры боковых маркеров и на перпендикуляр, проходящий через точку O, дают координаты центрального маркера u и v в системе координат, связанной с боковыми маркерами. Такой выбор координатной системы делает алгоритм нечувствительным к повороту головы в плоскости изображения и позволяет отслеживать только наклон и повороты головы вне плоскости изображения.

Рис. 6. Маркеры, используемые для распознавания движений головы.

В соответствии с рекомендациями психологов, в системе предусмотрено два различных способа трансляции поворота головы в движения курсора - по скорости (аналогично манипулятору типа “джойстик”) и по положению (аналогично манипулятору типа “мышь”). Первый тип управления означает, что поворот головы на определенный угол влечет перемещение курсора в соответствующем направлении со скоростью, пропорциональной углу поворота.

Во втором типе управления положение курсора напрямую зависит от угла поворота головы. Система позволяет комбинировать два вида управления в зависимости от задания, стоящего перед пользователем, и его персональными предпочтениями и возможностями. На основе вычисленных координат u и v перемещение курсора мыши вычисляется по следующим формулам:

Pages:     | 1 || 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»