WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 || 3 |

Особое внимание в обзоре обращено на методы, которые используют вейвлет-преобразование. Показано, что такие важные при кодировании изображений свойства, как масштабирование и ориентация, пространственно-частотная локализация, ортогональность, возможность создания быстрых алгоритмов вычислений, в полной мере присущи именно вейвлет-преобразованию. Отмечается, что вейвлет-преобразование осуществляет декорреляцию сигнала и позволяет упаковать информацию о сигнале в малое число коэффициентов. Для целей обработки изображений наиболее распространены так называемые разделимые вейвлеты. В этом случае для получения каждой субполосы вейвлет-декомпозиции выполняется свертка с двумя одномерными фильтрами (горизонтальным и вертикальным) и децимация по каждой из координат.

При высокой степени компрессии метод сжатия с потерями на основе вейвлет-преобразования вносит искажения, зачастую имеющие вид ряби вблизи резких границ. Такие артефакты меньше бросаются в глаза наблюдателю, чем, скажем, «мозаика», создаваемая блочным алгоритмом JPEG. Кроме того, метрики, применяемые для анализа качества изображений, показывают преимущество вейвлет-сжатия в сравнении с алгоритмом JPEG. Единственным стандартом для сжатия изображений, использующим вейвлет-преобразование, является JPЕG2000. Существует ряд нестандартизованных алгоритмов, использующих пространственное упорядочивание вейвлет-коэффициентов (такие, как EZW, SPIHT - Set Partitioning Into Hierarchical Trees и др.). Зачастую, такие иерархические методы являются более эффективными с точки зрения характеристик сжатие/качество и вычислительной сложности, чем JPЕG2000. В отличие от данного стандарта, приведенные методы свободно распространяются. Указанные выше причины обусловили выбор в качестве метода сжатия видеоданных в пользу вейвлет-преобразования и иерархического алгоритма, допускающего компрессию видеопоследовательностей в его модификации 3D-SPIHT.

Современные методы построения неразделимых банков фильтров, разработанные Чобану М.К. и другими авторами, позволяют синтезировать системы с некоторыми дополнительными свойствами. Например, неразделимые фильтры позволяют выделять произвольные двумерные пространственные частоты, тогда как разделимые – только горизонтальную и вертикальную составляющие. Поэтому реализация неразделимых систем сжатия представляет особый интерес.

Во второй части обзора приводятся методы и стандарты, предназначенные для организации радиоканала для передачи видеоданных. В частности, подробно рассматриваются наиболее распространенные промышленные стандарты беспроводной связи Wi-Fi (IEEE 802.11b и 802.11g), Bluetooth (IEEE 802.15.1) и ZigBee (IEEE 802.15.4). Перечисленные стандарты радиосвязи удовлетворяют заданному набору требований. Однако предельная скорость, определяемая стандартом ZigBee (250 Кбит/с), существенно ограничивает пропускную способность и недостаточна для передачи четкого изображения, скорость Bluetooth (1 Мбит/сек) является достаточной и оставляет возможность наращивания функциональности. Показано, что в части затрат на реализацию стандарт Wi-Fi довольно избыточен, поскольку предусматривает реализацию сетевого взаимодействия по модели ISO/OSI. Это придает удобство в работе с устройством на основе стандарта Wi-Fi, но существенно увеличивает его стоимость. При рассмотрении физических принципов передачи сигнала отмечается, что стандарт Bluetooth использует принцип скачкообразной перестройки частоты (FHSS), что повышает уровень защиты от несанкционированного доступа и обеспечивает бльшую помехоустойчивость по сравнению с Wi-Fi.

Таким образом, при проектировании системы видеонаблюдения был выбран стандарт Bluetooth, как наиболее удовлетворяющий требованиям к реализуемым системам реального времени.

По результатам проведенного обзора поставлена задача разработки и исследования иерархических методов и алгоритмов сжатия видеоданных, передаваемых по каналам радиосвязи в реальном масштабе времени. Обоснована программная реализация разработанных алгоритмов на специализированных процессорах цифровой обработки сигналов.

Во второй главе рассматриваются предлагаемые методы и алгоритмы покадрового сжатия данных, которые базируются на двумерных и трехмерных вейвлетах и на иерархическом алгоритме сжатия типа SPIHT.

В работе предложены методы и алгоритмы, обеспечивающие двумерное сжатие отдельных кадров видеонаблюдений на основе разделимых банков фильтров; производится оптимизация алгоритма SPIHT. Отмечена эффективность данного алгоритма как с точки зрения достигаемой степени сжатия, так и с точки зрения скорости вычислительных процедур. Для сравнения рассмотрены принципы функционирования алгоритмов сжатия изображений, в которых карта значений вейвлет-коэффициентов имеет древовидную структуру: алгоритм Льюиса и Ноулеса, алгоритм вложенного нуль-дерева (EZW), алгоритм пространственно ориентированных иерархических деревьев (SPIHT).

Рассмотрена реализация неразделимых систем кодирования видеосигналов. Отмечено, что при работе с неразделимым вейвлет-преобразованием, нечетные уровни декомпозиции имеют непрямоугольную форму (см. рис. 1). Процесс построения деревьев с переходом от прямоугольников к параллелограммам неоправданно сложен и трудоемок.

Рис. 1. Два уровня вейвлет-декомпозиции (неразделимые фильтры, 3-хканальный случай)

В диссертации предлагается относительно простое и эффективное решение этой проблемы. Если для более удобной обработки и хранения нужно искажать сигнал, то аналогичным образом можно исказить импульсную характеристику фильтра, при этом сохранив все нужные соотношения для правильного вычисления свертки. Тогда сдвиг отсчетов будет иметь место только визуально, с точки зрения результата фильтрации все будет вычисляться правильно. Перед вейвлет-декомпозицией из исходных фильтров дополнительно формируются два фильтра для нечетных и четных строк. При такой организации сигнал визуально искажается только на нечетных уровнях декомпозиции, там, где необходимо не ромбическое, а прямоугольное представление. На четных же уровнях сигнал сохраняет форму и обрабатывается стандартными фильтрами. На полученном разложении иерархический алгоритм строит свою работу аналогично разделимому варианту, используя подобие высокочастотных субполос вейвлет-декомпозиции (см. рис. 2).

Рис. 2. Пример вейвлет-декомпозиции с использованием неразделимых фильтров, выполненной по разработанной методике (показана инверсия сигнала)

Для эффективного сжатия видеосигнала целесообразным является использование межкадровой избыточности информации. Одним из вариантов сжатия является применение трехмерного алгоритма 3D-SPIHT для сжатия последовательности изображений. Однако для каналов с низкой пропускной способностью техническая реализация классического алгоритма 3D-SPIHT в реальном масштабе времени практически невозможна при известных ограничениях на аппаратурные затраты. В связи с этим возникает необходимость оптимизации алгоритма 3D-SPIHT с целью получения быстрых вычислительных процедур. В работе получен алгоритм, который ускоряет процесс оценки значимости всего дерева вейвлет-коэффициентов при анализе текущего кадра. Перед применением собственно SPIHT-алгоритма вычисляется информационная матрица дерева (ИМД). Элементами aijk матрицы являются максимальные значения всех вейвлет-коэффициентов потомков дерева D(i,j,k), чей корень (родитель) находится в трехмерном пространстве с координатами i, j, k, а ветви принадлежат субполосе вейвлет-декомпозиции более мелкого масштаба. В процессе сортировки вейвлет-коэффициентов по алгоритму SPIHT значимость всего дерева определяется только одним сравнением ИМД с порогом.

Для реализации системы обработки видеоданных с использованием сигнального процессора необходимо оптимизировать алгоритм по следующим критериям: время кодирования/декодирования; используемая память; вычислительная сложность выполняемых операций. Важным является выбор языка программирования (ориентация на язык высокого уровня С, С+, С++ стандарта ANSI C, 1992). В ходе исследования были разработаны оригинальные алгоритмические и программные решения по оптимизации алгоритма SPIHT. В частности, в процессе анализа элементов списка незначащих множеств LIS (List of Insignificant Sets), кодер должен просматривать все дерево в поисках значимых коэффициентов. Этот процесс, неоднократно повторяясь, занимает значительную часть вычислительных ресурсов. Для ускорения процесса кодирования в алгоритм была введена новая структура - матрица значимости (MS). Размер матрицы MS равен размеру вейвлет-декомпозиции. Под каждый элемент отводится один байт памяти. Матрица MS формируется таким образом, что значение каждого ее элемента (i,j) равно числу бит, занимаемому максимальным по модулю коэффициентом дерева, выстроенного из точки (i,j) с учетом корня. Имея в распоряжении такую структуру для анализа элемента типа А (элемент необработанных деревьев), достаточно рассмотреть только точки с координатами «детей», обращаясь при этом к матрице MS. Анализируя же элементы типа В (элементы частично обработанного дерева), необходимо рассмотреть только точки с координатами «внуков» в структуре MS. Это относительно простое решение позволяет значительно сократить время работы кодера и делает возможным его применение в системах, критичных к скорости кодирования, например, при обработке видеосигналов в реальном времени. В результате разработан алгоритм формирования матрицы MS, позволяющий за один проход по коэффициентам вейвлет-декомпозиции собрать в матрице значимости информацию по всем деревьям.

Предложено заменить операции логарифмирования и возведения в степень на логические операции с использованием массива степеней двойки. Большинство операций умножения заменено сдвиговыми операциями, операции с вещественными числами полностью исключены. Таким образом, был разработан кодер, позволяющий выполнять все необходимые операции с вейвлет-коэффициентами, оперируя непосредственно битами их 32-разрядного представления. Алгоритм реализован на языке C, без использования библиотечных функций, и является самостоятельной программной единицей (исполняемым файлом).

Оптимизированный алгоритм сравнивался с существующими реализациями по времени кодирования (Time) и по качеству, критерием которого выступает отношение пикового сигнала к шуму (PSNR) (см. рис.3). Оба параметра Time и PSNR вычислялись для набора битовых скоростей кодирования в диапазоне от 0.1 до 2 бит/пиксель (bpp).

В сравнении с классической реализацией (без использования матрицы значимости и битовой арифметики) оптимизированный алгоритм показывает значительное увеличение быстродействия, что можно видеть на графике рис. 3.а. График на рис. 3.б. показывает, что процесс оптимизации не ухудшил качество сжатия, а даже улучшил. Таким образом, оптимизированный алгоритм способен конкурировать с общепризнанными реализациями.

а) б)

Рис. 3. Время и качество кодирования: SPIHT 1 - классическая реализация;

SPIHT 2 - оптимизированный алгоритм.

На рис. 4-5 приведен сравнительный тест реализованного алгоритма с алгоритмом JPЕG2000. На графиках видно, что работа SPIHT-кодера в значительной мере зависит от используемого банка фильтров. Тесты также показали эффективность алгоритма SPIHT для изображений с малым числом контуров и резких переходов, то есть для таких изображений, которые хорошо аппроксимируются вейвлетами, например для изображения Lena256Gray (см. рис. 4). В этом случае SPIHT-кодер, имея намного более простую структуру, дает результат, сравнимый с JPЕG2000. Для изображений с большим числом контуров (Bridge256Gray) алгоритм JPЕG2000 показывает некоторое преимущество.

Рис. 4. Кодирование тестовых изображений JPЕG2000-кодером (j2k) и разработанным алгоритмом с применением различных банков фильтров

а)

б)

в)

Рис. 5. Сравнительный тест: исходное изображение и его фрагмент (а), обработанные JPЕG2000 (б); реализованным алгоритмом SPIHT (в). Степень сжатия 1:30.

Третья глава посвящена решению задачи подавления шумов в неподвижных изображениях и видеосигналах.

Рассматриваются источники мультипликативного шума и математические модели изображений, искаженных таким шумом. Приводится обзор методов и алгоритмов удаления из изображений мультипликативного шума, основанных на применении локальных статистик.

Показано, что применение вейвлет-преобразования и пороговой обработки вейвлет-коэффициентов позволяет эффективно решить задачу подавления шума. Основная идея заключается в использовании особенности проявления действия мультипликативного шума для ряда приложений. Зашумленное изображение содержит точки как зашумленные, так и точки относительно неискаженные. Если применить к изображению вейвлет-преобразование и пороговое ограничение вейвлет-коэффициентов, а затем восстановить изображение по полученным коэффициентам, то "чистые" точки будут искажены, поскольку при фильтрации обрабатываются все точки изображения. При этом может оказаться, что искажения будут больше, чем остаточный шум для зашумленных данных, т.к. величина порога рассчитывается по всему изображению. Поэтому необходимо определить множества зашумленных и неискаженных точек в изображении и затем подобрать величину порога таким образом, чтобы суммарная среднеквадратическая ошибка (СКО) была минимальной. Сохранение "чистых" точек неискаженными (или искаженными в меньшей степени) позволяет уменьшить сглаживание контуров объектов и тем самым повысить четкость (резкость) объектов изображения после обработки. Таким образом, основу алгоритмов, описанных ниже, составляет процедура классификации точек изображения. В диссертации приводится алгоритм такой классификации и результаты применения предложенного алгоритма на практике.

Рис. 6. Блок-схема классификации точек изображения

На рис. 6 представлена блок-схема процесса классификации отсчетов изображения. Пусть используется мультипликативная модель для описания наблюдаемого изображения yij:

,

где gij - отсчеты шума, xij - отсчеты неискаженного изображения. Мультипликативный шум имеет экспоненциальную плотность распределения вероятностей со средним 1 и дисперсией. После логарифмического преобразования мультипликативный шум становится аддитивным:

,

где z обозначает ln (y), s = ln (x) и x = ln (g).

Pages:     | 1 || 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»