WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     |
|

На правах рукописи

ЛА Суан Тханг

МЕТОДЫ РАСПОЗНАВАНИЯ РУКОПИСНЫХ ТЕКСТОВ В СИСТЕМАХ АВТОМАТИЗАЦИИ ДОКУМЕНТООБОРОТА НА ПРОМЫШЛЕННЫХ ПРЕДПРИЯТИЯХ

Специальность 05.13.06 – Автоматизация и управление технологическими процессами и производствами (промышленность)

Автореферат

диссертации на соискание ученой степени

кандидата технических наук

Москва - 2008

Работа выполнена в Московском автомобильно-дорожном институте (государственном техническом университете)

Научный руководитель

Заслуженный деятель науки РФ,

доктор технических наук, профессор

Николаев Андрей Борисович

Официальные оппоненты

Доктор технических наук, профессор Строганов Виктор Юрьевич

профессор МГТУ им.Н.Э.Баумана

Кандидат технических наук

Лукащук Петр Иванович, генеральный директор ООО «Спецстрой-бетон-200»,

Ведущая организация: Российский научно-исследовательский институт информационных технологий и систем автоматизированного проектирования (Рос НИИ ИТ и АП), г.Москва.

Защита состоится 16 сентября 2008г. в 10 часов на заседании диссертационного совета Д.212.126.05 при Московском автомобильно-дорожном институте (государственном техническом университете) по адресу:

125319, ГСП А-47, Москва, Ленинградский пр., д.64.

С диссертацией можно ознакомиться в библиотеке МАДИ(ГТУ)

Текст автореферата размещен на сайте Московского автомобильно-дорожного института (государственного технического университета): www.madi.ru

Автореферат разослан 09 июля 2008г.

Отзыв на автореферат в одном экземпляре, заверенный печатью, просим направлять в адрес совета института

Ученый секретарь

диссертационного совета,

кандидат технических наук,

доцент

Михайлова Н.В.

Общая характеристика работы

Актуальность проблемы

Управленческая, производственная, хозяйственная деятельность предприятия тесно связаны с обработкой и хранением значительных объемов документов: руководящих, отчетных, информативных и т.д. По этой причине особую актуальность приобретает использование на предприятиях систем электронного документооборота (СЭД), позволяющих значительно сократить временные и финансовые затраты предприятия на организацию бизнес-процессов документооборота, а также, в большинстве случаев, разработать и легко осуществить мероприятия по их оптимизации.

В 2007 году рынок СЭД в России превысил 170 млн. долларов США. Рынок демонстрирует стабильную динамику роста. CAGR 2005/2004 составлял более 50%, а 2006/2005 - несколько ниже, в 2007 году темп роста составил 20%.

В составе систем автоматизации документооборота обязательно присутствуют средства ввода бумажных документов, естественно, путем сканирования. Задача распознавания произвольного рукописного текста является актуальной сегодня, и проблема не будет закрыта в ближайшие десятилетия. Задача распознавания рукописных текстов (PPT) как научная проблема и как информационная технология находится на подъеме, благодаря большому интересу к этой области в коммерческих кругах, среди компьютерных компаний, в научном сообществе.

Предметом исследования являются система электронного документооборота (СЭД) на промышленных предприятиях, а также ее составляющая - система автоматического ввода данных.

Цель и основные задачи исследования

Целью работы является повышение эффективности функционирования СЭД на промышленных предприятиях за счет создания методики комплексного анализа, внедрения СЭД, а также усовершенствования системы ввода данных в СЭД.

Для достижения данной цели в работе решаются следующие задачи:

    1. Сравнительный анализ систем документооборота в России.
    2. Исследование методов распознавания рукописных текстов.
    3. Разработка модели нейронной сети распознавания рукописных символов.
    4. Разработка алгоритма для ускоренного обучения нейронной сети.
    5. Разработка программы для распознавания рукописных цифр.
    6. Методы выбора и внедрения систем документооборота на промышленных предприятиях среднего размера.

Методы исследования

При разработке формальных моделей компонент в диссертации использовались модели нейронных сетей, градиентные методы обучения нейронной сети, методы математического программирования, теория вероятностей и др.

Научная новизна работы состоит в разработке методов, моделей, алгоритмов и стратегий построения системы распознавания рукописных текстов в качестве системы автоматического ввода данных для СЭД, а также методики комплексного анализа и внедрения СЭД на промышленных предприятиях.

На защиту выносятся:

  • Методика сравнительного анализа систем документооборота

по функциональности, стоимости и др.

  • Модели интеграционных корпоративных информационных систем, систем электронного документооборота и жизненного цикла документов на предприятии.
  • Результаты классификации и исследования методов обработки документов.
  • Модель нейронной сети для распознавания рукописных текстов.
  • Алгоритм ускоренного обучения нейронных сетей с большим количеством весовых коэффициентов.
  • Разработанная программа распознавания рукописных текстов и результаты экспериментов.

Достоверность научных положений, рекомендаций и выводов

Обоснованность научных положений, рекомендаций и выводов определяется предварительным анализом работы системы распознавания рукописных цифр, согласованностью результатов предложенных модели нейронной сети и алгоритма обучения сети. Достоверность положений и выводов диссертации подтверждена положительными результатами внедрения положений работы на крупном промышленном предприятии, занимающимся производством продуктов быстрого приготовления.

Практическая ценность и реализация результатов работы

Научные результаты, полученные в диссертации, доведены до практического использования. Они представляют непосредственный интерес в области распознавания и системной интеграции. Методы и алгоритмы, а также программные средства могут быть использованы при решении задач построения систем автоматического ввода данных. Разработанные методы и алгоритмы прошли апробацию и внедрены для практического применения на предприятиях ТД «Роллтон», ЗАО «DocsVision», а также используются в учебном процессе на кафедре АСУ МАДИ(ГТУ).

Апробация работы

Содержание отдельных разделов и диссертации в целом было доложено и получило одобрение:

  • на заседании кафедры АСУ МАДИ (ГТУ);
  • на конференциях в области автоматизации документооборота (2006г.-2008г.).

Содержание работы

Структура работы соответствует списку перечисленных задач, содержит описание разработанных методов, моделей и алгоритмов.

Во введении обосновывается актуальность работы. Ставятся цели и задачи исследований. Приводится краткое содержание глав диссертации.

В первой главе проведены классификация СЭД и подробный сравнительный анализ систем автоматизации документооборота.

С каждым годом спрос на СЭД значительно повышается. По этой причине становится важной задача оценки и выбора системы автоматизации документооборота в условиях конкретного предприятия.

Для сравнительного анализа СЭД в диссертации выделяются решения от ведущих компаний-разработчиков систем электронного документооборота. В диссертации проанализированы СЭД по функциональности (см. Табл.1). Для этого были выбраны наиболее объективные критерии функциональности и, в зависимости от того удовлетворяет система данному критерию или нет, в соответствующую ячейку ставился либо плюс, либо минус. В диссертации также проанализированы решения СЭД по стоимости (пример таб. 2). Это необходимо для объективной оценки ситуации, при которой организации, использующей СЭД, пришлось бы приобрести всю предлагаемую функциональность для каждого рабочего места.

Таблица 1.

Наимено-вание
СЭД

Номенклату-ра дел

Номенклату-ра проектов

Типы клиентов /контрагент-ов

Вариан-ты ввода документов в СЭД: Создание

Варианты ввода документов в СЭД: Прикрепление

Варианты ввода документов в СЭД: Сканирование

CORPORATE BUSINESS

(+)
Иерархическая структура

(+)
Иерархическая структура

(+)
Иерархическая структура

(+)

(+)

(+)

DocsVision

(+)
Иерархическая структура

(+)
Иерархическая структура

(+)
Список

(+)

(+)

(+)

LanDocs

(+)
Список

(+)
Иерархическая структура

(+)
Иерархическая структура

(+)

(+)

(+)

БОСС-Референт

(+)
Иерархическая структура

(+)
Иерархическая структура

(+)
Список

(+)

(+)

(+)

Таблица 2.

Наименование
СЭД

Стоимость лицензий, $

Стоимость внедрения,
$/час

Стоимость обучения,
$/час

Стоимость технической поддержки
за 1 год, $ (от)

Стоимость обновления системы, $

Стоимость заказных доработок,
$/час

Всего, $

МОТИВ

2 300

33,05

21

968,65

550

30

3 902

CORPORATE BUSINESS

3 499

30

30

360

200

25

4 144

PayDox

5 000

40

40

0

2 500

30

7 610

СУПеР

5 995

40

40

0

1 600

40

7 715

Effect Office

6 295,36

17

17,86

1 259

1 573

18

9 182

ДЕЛО

10 245

37

27

Pages:     |
|



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.