WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 || 3 |
  • объект находится в зоне наблюдения значительное время, на протяжении которого может как перемещаться, так и оставаться неподвижным;
  • перемещение различных частей объекта на изображении согласовано, но может происходить с различными скоростями, например, из-за различного расстояния от элементов объекта до датчика изображения;
  • поскольку наблюдение ведется в реальных условиях, в том числе ночью, алгоритм выделения должен успешно работать при отсутствии информации о цвете, то есть по черно-белому изображению.

Выделение объекта включает два этапа: классификацию пикселей изображения по принадлежности фону или объектам, а также селекцию объектов по характерным признакам (размеры, форма, направление движения, время нахождения в зоне наблюдения), позволяющую выделять только те специфические объекты, для контроля которых предназначена интеллектуальная система. Например, в системе дистанционного осмотра грузового подвижного состава железных дорог объектом интереса выступает состав, движущийся по определенному пути в определенном направлении, тогда как другие объекты (люди, животные, а также поезда, идущие по соседним путям) являются помехами.

В основе предложенного алгоритма выделения лежит идея сравнения поступающего сигнала со статистической моделью фона, сформированной тем или иным способом. Важными свойствами такого подхода являются возможность выделять как подвижные, так и неподвижные объекты, а также отсутствие ограничений на форму и текстуру объекта. При этом сигналы от объекта и фона должны быть статистически различимыми.

Во многих известных алгоритмах при моделировании фона пренебрегают корреляцией между соседними отсчетами изображения, что существенно упрощает вычисления. Показано, что точность сегментации в этом случае резко падает, если значительная часть пикселей объекта совпадает по яркости с фоном. Для протяженных объектов такая ситуация типична. Повышение точности выделения может быть достигнуто введением в модель фона статистической связи между яркостью соседних пикселей. В этом случае фрагмент изображения фона рассматривается как N-мерный случайный вектор x с гауссовой условной плотностью вероятности

где µ - вектор средних значений, оценка которого может быть получена на основе авторегрессионного моделирования, – ковариационная матрица процесса. Величина N выбирается исходя из размеров окрестности, в пределах которой предполагается наличие корреляционных связей, и составляет не менее 64 (фрагмент 88 пикселей). Преобразование двумерного массива отсчетов в вектор осуществляется путем развертки по столбцам.

Такой способ моделирования фона малопригоден в системах реального времени из-за существенных вычислительных затрат (требуется многократное вычисление и обращение заполненной ковариационной матрицы). Эффективным способом понижения размерности модели является применение линейных преобразований. С точки зрения концентрации энергии сигнала в небольшом количестве коэффициентов обобщенного спектра оптимальным является преобразование Карунена-Лоэва, коэффициенты которого вычисляются как

,

где – собственные векторы ковариационной матрицы входного сигнала:.

Предложено использовать для приближенного вычисления преобразования Карунена-Лоэва рекуррентный вариант метода главных компонент, позволяющий в реальном масштабе времени вычислять базисные функции для каждого участка изображения фона и строить модель на их основе. Вычисления осуществляются с помощью однослойной линейной нейронной сети с обратной связью. Выходной сигнал сети определяется выражением

,

где w – коэффициенты прямой связи, a – коэффициенты обратной связи, M – число главных компонент. Подстройка коэффициентов выполняется по формулам

,,

где – норма обучения. Малая величина нормы обучения гарантирует сходимость коэффициентов w к координатам собственных векторов ковариационной матрицы входного сигнала. Совокупность базисных функций и коэффициентов разложения входного сигнала образует модель невысокой размерности (показано, что для блоков 1616 пикселей достаточно использовать 6-8 главных компонент). Базисные векторы автоматически адаптируется при медленных изменениях входного сигнала. Для адаптации коэффициентов разложения используется линейное предсказание.

Ошибка предсказания участков фона по сформированной модели представляет собой малую случайную величину, некоррелированную со входным сигналом:

Статистический анализ ошибки предсказания позволяет оценить ее дисперсию, которая мало зависит от характера изображения и определяется, в основном, отношением сигнал-шум. Выделение объекта происходит на тех участках изображения, где ошибка предсказания выходит из доверительного интервала. Показано, что на сложном фоне имеет дисперсию на порядок меньше, чем соответствующая ошибка предсказания по авторегрессионной модели, что позволяет снизить порог обнаружения объекта.

Эксперименты с изображениями реальных и синтезированных сцен, содержащими протяженные объекты, позволяют сделать вывод о том, что для таких изображений, при наличии сложного нестационарного фона, использование алгоритма на основе метода главных компонент более эффективно по сравнению с рядом существующих алгоритмов адаптивной компенсации фона. Вероятность правильной классификации пикселей изображения по принадлежности объекту и фону составила более 99% при вероятности ложной тревоги 4% и пиковом отношении сигнал-шум выше 34 дБ. Заключительным этапом выделения является селекция объектов по характерным признакам. Для протяженных объектов это могут быть площадь и направление движения.

В третьем разделе рассматривается алгоритм оценки скорости протяженного объекта по телевизионному изображению. Информация о скорости перемещения объекта в пространстве важна как для определения размеров объекта, так и для выявления нештатных ситуаций. Информация о скорости перемещения различных частей объекта на изображении необходима для построения панорамной проекции, являющейся способом отображения протяженных объектов при наблюдении небольшим числом камер.

Первичными данными для измерения скорости являются оценки межкадровых смещений на телевизионном изображении, полученные в каждом кадре. В качестве метода оценки смещений выбран широко известный метод сопоставления блоков, обладающий высокой помехоустойчивостью при низкой вычислительной сложности. В заданном диапазоне смещений объекта по горизонтали и по вертикали вычисляется мера расхождения двух телевизионных кадров:

,

где M и N – высота и ширина прямоугольного фрагмента кадра, в котором производится поиск вектора смещения, k, q – координаты его левого верхнего угла. Координаты минимума функции рассогласования являются оценкой межкадрового смещения.

В случае определения скорости железнодорожного состава поиск смещений производится только в горизонтальном направлении; в качестве области поиска выбирается вертикальная полоса в центре кадра, которую состав гарантированно пересекает во время своего движения.

Непосредственно использовать измеренные смещения в качестве оценки скорости невозможно (рис. 1), так как значительная часть результатов измерения подвержена аномальной погрешности.

Рис. 1. Последовательность векторов смещения: цифрами отмечены истинные (1), нулевые (2) и аномальные (3) векторы

Для приближенной оценки вероятности появления аномальных результатов Pан использован один из существующих методов робастной регрессии – метод наименьшей медианы квадратов. Данный метод является альтернативой традиционному методу наименьших квадратов, который неустойчив к аномальным выбросам. Построены зависимости Pан от ширины блока W (рис. 2, а).

С увеличением ширины блока число аномальных выбросов уменьшается, но вычислительная сложность поиска (число элементарных операций) растет пропорционально квадрату W. Для снижения числа аномальных результатов предложено использовать иерархический подход, который заключается в измерении смещений при пониженном в несколько раз разрешении с последующим уточнением на более высоких уровнях. Показано, что за счет подавления шумов на низких уровнях разрешения вероятность появления аномальных результатов снижается. Вычислительная сложность иерархического алгоритма растет пропорционально логарифму ширины блока, что является его дополнительным преимуществом.

Дальнейшее снижение вероятности появления аномальных результатов при оценке смещений возможно за счет более детального анализа функции рассогласования блоков (рис. 2, б).

Рис. 2. Зависимость вероятности появления аномальной погрешности измерения скорости от ширины блока (а) и пример функции рассогласования, при которой возникает аномальная погрешность (б)

Установлено, что во многих случаях при возникновении аномальной погрешности функция имеет локальный минимум, соответствующий истинному смещению, замаскированный ложным глобальным минимумом. Поиск и сохранение в памяти нескольких локальных минимумов позволяют восстановить значение межкадрового смещения с использованием апостериорной оценки смещения объекта. На практике достаточно запоминать 4-5 экстремальных значений. Совместное использование алгоритма иерархического поиска смещений и многоальтернативной оценки минимума функции рассогласования позволяют снизить вероятность появления аномальной погрешности с 38% до 22% при пиковом отношении сигнал-шум в телевизионном сигнале 30 дБ и выше.

Первичные вектора движения нуждаются в дополнительной обработке с целью получения оценки скорости, наиболее точно отражающей перемещение объекта в сцене. К этой оценке предъявляются следующие требования:

  • сглаживание колебаний оценки, вызванных нормальной погрешностью измерения;
  • устойчивость к аномальной погрешности, в том числе к пакетам аномальных ошибок;
  • отслеживание резких изменений скорости объекта (разгон и торможение вплоть до полной остановки).

Применение линейной калмановской фильтрации для получения устойчивой оценки скорости затруднено необходимостью предварительной отбраковки аномальных данных (например, по методу наименьшей медианы квадратов). Кроме того, к фильтру предъявляются противоречивые требования – с одной стороны, обеспечить сглаженную оценку, с другой – реагировать на достаточно быстрое изменение скорости объекта. Эксперименты подтвердили, что фильтр Калмана при решении поставленной задачи неустойчив к пакетам аномальных ошибок.

Для повышения устойчивости рекурсивного оценивающего устройства предложен нелинейный преобразователь, функция которого заключается в блокировании процесса адаптации фильтра при больших рассогласованиях между входными данными и текущей оценкой. Выходной сигнал устройства оценки в этом случае описывается выражением

,

где W – характеристика нелинейного преобразователя с параметрами k и b, быстро убывающая с ростом аргумента. Разработана процедура расчета параметров нелинейного преобразователя на основе допустимых значений ускорения объекта и нормальной погрешности измерения смещений.

Показано, что в случае использования нелинейного фильтра алгоритм оценки скорости устойчив к одиночным и пакетным аномальным выбросам. Тем не менее, существует вероятность потери сходимости при быстром разгоне или торможении объекта.

С целью устранения недостатков, присущих линейному и нелинейному фильтрам, предложен алгоритм оценки скорости на основе кластерного анализа межкадровых смещений. Основанием для применения кластерного анализа является то, что результаты измерения смещений в последовательности кадров содержат данные из нескольких генеральных совокупностей:

  • векторы, отражающие движение объекта интереса в пространстве;
  • посторонние векторы, вызванные движением отдельных частей объекта или посторонних объектов, подвижных или неподвижных;
  • ложные векторы, не соответствующие движению каких-либо объектов в кадре и вызванные свойствами изображения или метода измерения.

Кластеризация с использованием гауссовой смеси позволяет строить статистическую модель распределения составной выборки

,

где K – число компонентов, - набор параметров i-го распределения, - весовой коэффициент i-го компонента модели, являющийся также вероятностью появления образцов соответствующего кластера, - базовое распределение (нормальное). Наблюдаемый процесс не является стационарным, поэтому параметры модели обновляются в реальном масштабе времени.

Распределение значений в каждом кластере моделируется нормальным законом, причем параметры распределений в каждой группе мало влияют друг на друга. Параметры гауссовой смеси определяются по рекуррентному алгоритму, использующему критерий максимального правдоподобия для ограниченной выборки результатов измерения. При изменении структуры выборки векторов смещения кластеры могут автоматически добавляться и исключаться из модели, а их параметры непрерывно корректируются (рис. 3). Текущей оценкой скорости является центр кластера с наибольшей выборочной вероятностью.

Рис. 3. Гистограмма векторов смещения и сформированная на их основе модель распределения (кластеры пронумерованы в порядке убывания вероятности)

Предложенный алгоритм оценки скорости устойчив к пакетам аномальных ошибок: в начале пакета автоматически создается кластер, в который попадают аномальные векторы, при этом параметры основного кластера не изменяются. После завершения пакета ошибок созданный кластер удаляется (спустя промежуток времени, являющийся параметром алгоритма определения параметров модели). При быстром изменении скорости объекта происходит «перемещение» основного кластера и не происходит потери сходимости, как в случае с нелинейным преобразователем. Инерционность алгоритма определения параметров гауссовой смеси обеспечивает уменьшение дисперсии нормальной составляющей погрешности измерения смещений в 7-9 раз.

В разделе также рассмотрены способы субпиксельной оценки смещений с целью дальнейшего снижения погрешности оценки скорости. Предложено использовать увеличение временного интервала между кадрами, в которых происходит совмещение блоков, по мере уменьшения скорости объекта. При выборе интервала учитывается устойчивая оценка скорости, полученная на этапе кластерного анализа. Такой подход позволяет стабилизировать относительную погрешность измерения скорости на уровне 2,5% и ниже в широком диапазоне скоростей объекта без дополнительных вычислительных затрат. Проведено исследование методов интерполяции для повышения точности измерения смещений. При пиковом отношении сигнал-шум выше 36 дБ алгоритм четырехкратной линейной интерполяции обеспечивает среднюю абсолютную погрешность измерения межкадровых смещений не более 0,12 пикселей.

Pages:     | 1 || 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»