WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 | 2 ||

Таким образом, качество идентификации при соответствующем выборе варьируемых параметров модели и голосовых сообщений оказывается достаточно высоким (вероятность ошибки составляет 5 – 6 %). Вероятность ошибки систем идентификации голоса, рассмотренных в обзоре, составляет 1 – 3%. Однако разработанная модель оказывается более быстродействующей (время идентификации на ЭВМ с частотой процессора 1,60 ГГц и объёмом оперативной памяти 896 МБ для разработанной модели составляет менее 1 секунды, для систем, рассмотренных в обзоре, – 3 – 5 секунд при длительности фразы 3 секунды). Кроме того, в отличие от существующих разработок, присутствует возможность настройки модели и предложен метод и комплекс программ, позволяющий тестировать разработанную модель.

В заключении приводятся основные результаты и выводы диссертационной работы.

Выводы по результатам диссертации

В ходе решения поставленной задачи были получены следующие результаты:

  1. Проанализирован процесс речеобразования и исследована работа артикуляторного аппарата человека, в результате чего выработаны пути построения модели идентификации голосового сообщения.
  2. Произведён обзор и анализ методов, которые могут использоваться при идентификации голосового сообщения – нейросети, частотные цифровые фильтры, Фурье-анализ, кепстральный анализ, методы машинного обучения, векторное квантование, гауссовы смеси и вейвлет-анализ. Показана предпочтительность выбора Фурье-анализа как основы построения модели.
  3. Построена структурная схема модели идентификации голосового сообщения по фонемной составляющей и индивидуальным характеристикам голоса.
  4. Предложена двоичная и троичная логика принятия решения о равенстве голосовых сообщений.
  5. Разработан математический аппарат деления голосового сообщения на фонемы, построения образа фонемы и сравнения образов двух фонем. Предложен метод матричного анализа сравнений образов фонем голосовых сообщений.
  6. Определены варьируемые параметры модели, которые позволяют производить её настройку под различные условия применения.
  7. Разработан комплекс программ, реализующий предложенную модель идентификации голосового сообщения. Время идентификации составляет менее 1 секунды при длительности фразы 3 секунды на ЭВМ с частотой процессора 1,60 ГГц и объёмом оперативной памяти 896 МБ.
  8. Спроектирована структура базы данных голосовых сообщений для тестирования и статистической оценки качества работы предложенной модели.
  9. Предложен метод и разработан комплекс программ для тестирования модели идентификации голосового сообщения. Вероятность ошибки идентификации модели составляет 5 – 6 %.
  10. Получена статистическая оценка качества работы предложенной модели в зависимости от значений трёх выбранных варьируемых параметров этой модели.
  11. Получена статистическая оценка качества работы предложенной модели в зависимости от параметров фраз. Выработаны рекомендации по выбору фраз, используемых при идентификации.
  12. Исходя из доступной информации, был произведён сравнительный анализ системы идентификации голоса, основанной на предложенной модели, и разработок ведущих компаний в этой области (Центр речевых технологий, компания «Речевые технологии», компания «Voice Security Systems Inc.», компания «Nuance» и компания «Agnitio»). Было показано, что разработанная модель близка по достоверности идентификации, но обладает рядом преимуществ – более высоким быстродействием, возможностью настройки и наличием средства тестирования модели.

Список публикаций по теме диссертации

  1. Балакирев Н.Е., Малков М.А. Метод идентификации голосового сообщения // Информационные технологии. 2008. № 12. С. 66-68.
  2. Малков М.А. Идентификационные признаки голоса // Научные труды ХХХII Международной молодёжной научной конференции “Гагаринские чтения” в 8 т. Т. 6. М.: МАТИ, 2006. С. 163-164.
  3. Балакирев Н.Е., Малков М.А. Выделение звуков из непрерывного речевого сигнала // Новые материалы и технологии (НМТ-2006). Материалы Всероссийской научно-технической конференции. В 3 т. Т. 2. М.: ИЦ МАТИ, 2006. С. 129-130.
  4. Балакирев Н.Е., Малков М.А. Выделение звуков из непрерывного речевого сигнала // Материалы X Санкт-Петербургской международной конференции «Региональная информатика – 2006». СПб.: СПИИРАН, 2006.
  5. Малков М.А. Выделение звуков из непрерывного речевого сигнала // Научные труды ХХХIII Международной молодёжной научной конференции “Гагаринские чтения” в 8 т. Т. 6. М.: МАТИ, 2007. С. 239-240.
  6. Балакирев Н.Е., Малков М.А. Распознавание речи на основе артикуляторной характеристики звуков // Сборник трудов VIII Международной научно-методической конференции «Информатика: проблемы, методология, технологии» в 2 т. Т. 1. Воронеж: ВГУ, 2008. С. 56-59.
  7. Малков М.А. Построение огибающей цифрового сигнала с помощью интерполяционного многочлена в форме Лагранжа // Научные труды ХХХIV Международной молодёжной научной конференции “Гагаринские чтения”. Т. 6. М.: МАТИ, 2008. С. 197-198.
  8. Малков М.А. Матричный метод сравнения двух голосовых сообщений, предварительно разделённых на фонемы // Компьютеры в учебном процессе. 2008. № 6. С. 49-54.
  9. Малков М.А. Статистическая оценка качества работы метода идентификации голоса // Компьютеры в учебном процессе. 2008. № 9. С. 15-24.
  10. Балакирев Н.Е., Малков М.А. Программный комплекс для идентификации голосового сообщения // Материалы XI Санкт-Петербургской международной конференции «Региональная информатика – 2008». СПб.: СПИИРАН, 2008.
  11. Балакирев Н.Е., Малков М.А. Расширение программного комплекса идентификации голосовых сообщений // Новые материалы и технологии (НМТ-2008). Материалы Всероссийской научно-технической конференции. В 3 т. Т. 2. М.: ИЦ МАТИ, 2008. С. 149-150.
Pages:     | 1 | 2 ||






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»