WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ РАСПОЗНАВАНИЕ СТРУКТУРИРОВАННЫХ ДОКУМЕНТОВ НА ОСНОВЕ МАШИННОГО ОБУЧЕНИЯ С.В. Голубев, аспирант кафедры «Распознавание изображений и

обработки текста» Московского физико-технического института.

Адрес: Московская область, г. Долгопрудный, Институтский пер., д. 9.

E-mail: sergey_g@abbyy.com.

В работе рассматривается задача распознавания структурированных документов на осно ве методов структурного распознавания образов. Предлагается система распознавания форм, включающая графовую модель документа для описания структуры печатных форм и метод построения обобщенной модели на основе обучающих примеров.

Ключевые слова: распознавание форм, машинное обучение, графовая модель документа.

1. Введение образов представляет построение соответствую щей модели документа. В некоторых случаях для развитием информационных технологий решения этой проблемы применяются методы ма и систем электронного документооборота шинного обучения, позволяющие строить модель С важной задачей становится преобразование документа на основе некоторого количества изо информации с бумажных носителей в электронную бражений, размеченных вручную [11, 12, 13].

форму. Такое преобразование успешно осущест В данной работе рассматривается система распо вляется системами оптического распознавания знавания форм ABBYY FlexiLayout [15], в которой символов. Однако часто посимвольное преобразо используется специализированная модель доку вание является недостаточным, и для перевода ин мента (структурное описание). Модель описывает формации в электронное представление требуется атрибуты структурных элементов, метрические и распознавание логической структуры документа, что особенно важно при распознавании так назы- порядковые отношения между ними и с этой точ ваемых форм — анкет, бланков, различных финан- ки зрения сходна с графовыми моделями [2, 3]. Од совых документов. нако структурное описание FlexiLayout имеет ряд особенностей, в частности, для описания структу В настоящее время для распознавания структу ры используется специализированный язык, по рированных документов успешно применяются методы, основанные на структурном распознава- зволяющий вычислять параметры модели в про нии образов [1, 2, 3, 4, 9, 10]. Заметную трудность в цессе распознавания документа на основе текущих применения методов структурного распознавания результатов. Это позволяет лучше адаптировать БИЗНЕС-ИНФОРМАТИКА №2(16)–2011 г.

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ модель к различным типам документов, в том чис- распознавания структурированных документов со ле со сложной структурой и наличием структурных стоит в том, чтобы, имея изображение документа вариаций (подробнее модель описана в разделе 3). (как правило, полученное в результате сканирова ния), определить локализацию требуемых данных Существенным недостатком системы FlexiLayout (в случае форм это поля).

является необходимость построения модели до кумента вручную, что весьма трудоемко и требует Жесткие формы имеют фиксированное располо высокой квалификации пользователя. В данной жение полей, поэтому их распознавание не требует работе предлагается метод построения структурных серьезного анализа структуры и текста. Достаточно описаний для системы FlexiLayout путем обучения исправить искажения, полученные при сканирова на примерах. Использование машинного обучения нии и использовать шаблон, в котором заданы ко позволяет упростить процесс построения структур- ординаты полей.

ного описания документа, а использование в ка Полужесткие формы являются аналогом жестких честве модуля распознавания системы FlexiLayout форм, в которых сняты некоторые ограничения, дает возможность легко доработать результат обу налагаемые на разметку. Примером таких докумен чения вручную для повышения точности распозна тов являются формы, заполняемые в электронном вания документов со сложной структурой.

виде с последующей распечаткой, которые позво На этапе обучения используется промежуточная ляют сдвигать последующие поля, если требуется графовая модель документа, которая после обобще дополнительное место для данных в текущем поле.

ния преобразуется в структурное описание FlexiLay В гибких формах имеются значительные вариа out. В статье рассматривается графовая модель и ме ции в расположении полей и статических элемен тод ее обобщения. Для обобщения графовой модели тов. Однако, как правило, для каждого поля можно вводится специальная мера сходства графов. В раз выделить связанный с ним локальный контекст, деле 2 рассмотрена задача распознавания структури который может содержать заголовок поля, несколь рованных документов, их основные разновидности ко разделительных линий и т.п. При этом располо и методы распознавания. В разделе 3 описывается жение поля относительно контекста меняется мало.

модель документа FlexiLayout, используемая при Наконец, самой общей категорией являются до распознавании, и графовая модель, используемая на кументы произвольной структуры. Сложность их этапе обучения. В разделе 4 рассматривается метод распознавания может достаточно сильно отличать построения обобщенного (шаблонного) графа на ся, в сложных случаях может требоваться анализ основе обучающих примеров. В разделе 5 приводится естественного языка.

экспериментальная оценка точности распознавания.

Для распознавания форм успешно применяются методы на основе структурного распознавания об 2. Распознавание разов. Широкое распространение получила графо структурированных документов вая модель документа, в которой текстовые блоки и Выделяют четыре основных класса структуриро- разделительные линии образуют узлы графа, а ребра ванных документов [16]: графа соответствуют отношениям между ними [1, 2, 3, 4]. Распознавание в данном случае состоит в сопо Жесткие формы ставлении модельного графа и графа, полученного Полужесткие формы по изображению документа. Простые варианты гра Гибкие формы фовых моделей — графы отношений соседства или Документы произвольной структуры порядка достаточно просты, чтобы их можно было Нужно отметить, что значительную часть струк- построить автоматически. Модели с метрически турированных документов составляют так называе- ми отношениями задают взаимные ограничения на мые формы. Характерной особенностью форм яв- координаты структурных элементов, что приводит ляется структура, состоящая из статической части, к более предсказуемым результатам распознавания.

представленной заголовками, разделительными Для придания большей гибкости по нескольким линиями и т.п., и внесенных в форму данных, кото- экземплярам определяются средние расстояния, а рые будем называть полями. Примерами форм мо- возможные отклонения задаются со значительным гут служить анкеты, финансовые документы типа запасом. Дальнейшим развитием графовых моделей счетов-фактур, платежных поручений и т.п. Задача с метрическими отношениями являются модели на БИЗНЕС-ИНФОРМАТИКА №2(16)–2011 г.

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ KeywordElement DateHeader SearchText: "Invoicedate: | Invoicedate";

MaxGapInLine: 50 * dot;

EndOfElement DateElement Da te DateFormat: DayMonthYear;

Language: "English";

MinDate: "14/09/1752";

MaxDate: "31/12/9999";

let Header = InvoiceGroup.DateHeader;

if not Header.IsNull then { let r ect1 = Rect (Header.Rect.Right, Header.Rect.Top -20dt, PageRect.Right, Header.Rect.Bottom+20dt);

let rect2 = Rect (Header.Rect.Left - 200dt, Header.Rect.Bottom, Header.Rect.Right + 150dt, Header.Rect.Bottom+200dt);

RectArray ar;

ar = RectArray( rect1 );

ar.Add( rect2 );

RestrictSearchArea( ar );

} else { Above: P ageRect.Top + PageRect.Height/2;

} EndOfElement KeywordElement InvoiceHeader SearchText: "Invoice";

MaxGapInLine: 50 * dot;

NearestY: PageRect.Top;

Above: SearchElements.InvoiceGroup.DateHeader, 0 * dot;

Exclude: SearchElements.InvoiceGroup.DateHea der;

EndOfElement LetterChainElement InvoiceNumber MaxGapInLine: 30 * dot;

Alphabet: "0123456789", 1, true;

MaxErrors Count: 0.2;

TotalChainLength:

-7, 3, 5, 15;

Nearest: Header;

let Header = InvoiceGroup.InvoiceHeader;

if not Header.IsNull then { let rect = Rect (Header.Rect.Right, Header.Rect.Top -20dt, PageRect.R ight, Header.Rect.Bottom+20dt);

RestrictSearchArea( rect );

} else { Above: PageRect.Top + PageRect.Height/2;

} EndOfElement INVOICE 10560 Client Invoice date: 10 - 09 - статические элементы поля Рис. 1. Фрагмент платежного документа.

БИЗНЕС-ИНФОРМАТИКА №2(16)–2011 г.

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ основе случайных [5] и нечетких графов [6]. В пер- ментов в виде порядковых и метрических отношений, вом случае в модели задаются распределения веро- отношений соседства и т.д., при этом могут быть зада ятностей для атрибутов вершин и ребер и при распо- ны как обычные, так и нечеткие отношения. В случае знавании вычисляется вероятностная оценка графа, использования обычных отношений модель схожа с полученного по изображению, которая определяет графом метрических отношений. Для описания от степень его соответствия модели. В случае нечетких ношений и характеристик структурных элементов графов вместо диапазонов значений атрибутов на используется специализированный язык, который ребрах и вершинах используются нечеткие множе- предоставляет достаточно широкие возможности в ства значений. Использование нечетких множеств задании свойств элементов и их взаимного располо жения. Для каждого элемента описание содержит позволяет лучше описывать возможные вариации интерпретируемый код инициализации параметров атрибутов структурных элементов и их взаимного и отношений, который исполняется во время рас расположения.

познавания. За счет этого достигается возможность Следует отметить методы для распознавания та вычисления характеристик структурных элементов бличных документов. Для их идентификации приме и отношений между ними «на лету» в процессе со няются различные способы сегментации таблицы на поставления модели документа и изображения. На ячейки, по которым затем определяется логическая пример, допустимое расстояние между элементами структура [7, 8]. Для описания структуры таблиц так может быть вычислено по размерам одного из них, же могут применяться графовые модели [9, 10].

и, следовательно, будет различным для разных эк Помимо графовых моделей, для описания струк земпляров документа (например, если используется туры документов применяются системы логиче шрифт разного размера).

ских правил [11, 13]. В этом случае для обучения В качестве примера приведем структурное описа системы могут использоваться существующие ние для фрагмента формы, изображенной на рис. 1:

системы логического вывода, например система Однако на этапе обучения работать непосредствен INTHELEX [11].

но с моделью FlexiLayout не очень удобно, в частно Кроме методов на основе структурного распозна сти из-за его текстового вида, поэтому желательно вания образов следует отметить также системы рас использовать более простую модель документа. В познавания, основанные на статистическом подходе качестве промежуточного представления структуры [12, 13, 14].

документа используется граф метрических отно шений. Это позволяет опираться на уже известные 3. Модель документа методы работы с данными, представленными гра фами [17, 18, 19]. Множество вершин модельного В качестве модуля распознавания применяется графа соответствуют графическим объектам в случае система ABBYY FlexiLayout. Данная система основа описания изображения или элементам логической на на методах структурного распознавания образов.

структуры в случае обобщенного описания.

Однако, в отличие от систем на основе графовых мо делей, в этой системе используется специализиро- Вершины графа имеют метки вида lV = I,D, где:

( ) ванная модель документа (структурное описание), I — идентификатор объекта или структурного позволяющая достичь большей гибкости по сравне элемента, определяющий его логическую роль в нию с простыми графовыми моделями (подробнее документе, который может принимать значения из о структурных описаниях можно прочесть в работе множества R,S,F1,F2,…,FN, где:

{} [15]). Модель FlexiLayout описывает множество струк Fi — идентификаторы полей. Поскольку при со турных элементов, соответствующих реквизитам до ставлении обучающей выборки множество полей кумента. Для каждого элемента задается множество известно (определяется типом документа) и рас допустимых значений его атрибутов, позволяющее положение полей указывается в обучающих приме локализовать структурный элемент на изображении.

рах, то для графических объектов, представляющих При этом в отличие от других систем отсутствует поля, известны уникальные идентификаторы.

априорное выделение структурных элементов для по R — метка текстового объекта.

строения графа документа. Вместо этого структурные S — метка разделительной линии.

элементы выделяются непосредственно в процессе распознавания на основе структурного описания. D — описание множества графических объектов, Также в модели задается взаимное расположение эле- которыми элемент логической структуры представ БИЗНЕС-ИНФОРМАТИКА №2(16)–2011 г.

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ ляется на изображении. Существует несколько спо- Построение шаблонного графа будем проводить, собов описания элемента логической структуры:

последовательно обобщая его на документы из обу чающей выборки. Чтобы обобщить шаблонный Множество, состоящее из одного графического объекта. граф GT на граф документа GD, необходимо по строить отображение подмножества вершин ша Множество фраз из одного или нескольких p1,…,pn, где pi — { } блонного графа на подмножество вершин графа до слов. Описание имеет вид:

символьные строки. кумента: Y :V GT V GD, где V GT V GT, ( ) ( ) ( ) ( ) V GD V GD, такое, что Iv = Iv. После этого ( ) ( ) Множество строк, состоящих из символов метки вершин из множества V GT должны быть заданного алфавита или нескольких алфавитов ( ) a1,…,an, где ai = s1,…,sm,P, — символы, обобщены с метками вершин из множества V GD si ( ) { } { } ) ( P — максимальная доля символов алфавита в строке.

так, чтобы заданные метками на вершинах множе Множество фрагментов текста, имеющих опре- ства графических объектов включали новые объек деленные характеристики: число строк, ширину и ты, описанные метками на вершинах V GD. Ана ( ) высоту фрагмента, наибольший пробел между сло- логично, интервалы расстояний на ребрах графа GT вами в строке, допустимое расстояние между стро должны быть обобщены с интервалами на образах ками, выравнивание.

этих ребер из графа GD, соответствующие интерва Множество разделительных линий с опреде- лы при этом объединяются:

ленными размерами.

1 1 2 2 1 2 1 dmin,dmax dmin,dmax = min dmin,dmin,max dmax,dmax Ребра графа соответствуют метрическим отноше- ( ) ( ) ( ) ( ) ().

ниям между объектами. Метки ребер имеют вид:

lE = dx,dy, где dx,dy — расстояние между пря ( ) Очевидно, что может быть построено большое моугольниками по горизонтали и вертикали в виде число таких отображений и соответственно ша интервалов dmin,dmax. Расстояния измеряются по () блонных графов. Необходимо ввести критерий, по ближайшим точкам, при этом если прямоугольни зволяющий выбирать наиболее подходящий граф.

ки пересекаются, то соответствующее расстояние Следует отметить, что рассмотренное отображение равно нулю. Расстояние может быть как положи вершин представляет собой путь редактирования тельным, так и отрицательным, и зависит от поряд (edit path) [17]. В общем случае для оценки пути ка вершин, т.е. ребра являются направленными.

редактирования может быть применена вероят Рассмотренная модель позволяет описывать как ностная оценка [20], однако в данном случае более конкретное изображение (экземпляр документа) предпочтительно использование специальной эм так и его обобщенную структуру. В первом случае пирической оценки, соответствующей предметной будем говорить о графе документа, а во втором – о области.

шаблонном графе или обобщенном графе.

Введем оценку качества отображения вершин и соответствующего обновленного шаблонного гра 4. Обобщение модели документа фа GT :

Введем следующее определение. Будем считать, что граф документа GD описывается шаблон- Q = ( ) () V Q vi uj QU (V (GT )\V (GT )) ным графом GT, если существует отображение QU V GD \V GD ( ) ( ) (), X:V GT V GD, где V GD V GD такое, что ( ) ( ) ( ) ( ) для любых вершин v и u и их образов v и u выпол где QV — оценка пары вершин из отображения Y, няются условия:

QU — оценка вершин из множеств V GT \V GT ( ) ( ) 1. Iv=Iv, т.е. идентификаторы вершин совпадают.

и V GD \V GD, то есть вершин, оставшихся без ( ) ( ) v, входит в множе 2. Объект, заданный вершиной образа или прообраза. Поскольку при отображении ство объектов, заданное описанием D метки вер вершин идентификаторы вершин сохраняются, шины v.

то соответствие между полями документа задано 3. Метка l ребра e = v,u является обобщением мет- однозначно, поэтому в оценке шаблонного графа ( ) ки l ребра e = v,u, в том смысле, что интервалы следует учитывать только вершины с метками тек ( ) dx dy и dy метки l входят в интервалы dx и метки l. стовых объектов и разделительных линий.

БИЗНЕС-ИНФОРМАТИКА №2(16)–2011 г.

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ вершину vi на вершину uj, либо оставить вершину vi без образа.

Для каждого нетерминального узла и соответ ственно пути в дереве введем частичную оценку Qp, которая, в отличие от Q, не учитывает нерас где QE ei — оценка i-го ребра, выходящего из ( ) смотренные вершины первого графа и не имеющие вершины v графа GT, полученной в результате прообраза вершины второго. Т.е. будем учитывать отображения вершины v графа GT на вершину u в QU V GT \V GT только рассмотренные вер ( ) ( ) () графа GD ;

i 1, NF ;

NF — число полей в данном [ ] шины шаблонного графа, а QU V GD \V GD ( ) ( ) () типе документа;

— эмпирический коэффициент, опустим. Не сопоставленные вершины будем учи вводящий зависимость оценки не только от оценки тывать только для конечных узлов дерева перебора, наилучшего ребра, но и от средней оценки.

соответствующих построенному отображению Y.

Оценка QU зависит от числа вершин в соответ Перебор дерева производится в порядке умень |V | ствующих множествах и имеет вид: QU V = U, ( ) шения качества вершин. Поскольку при спуске по т.е. за каждую не отображенную вершину назнача дереву оценка не может увеличиваться, то оценка ется фиксированный штраф U.

текущей вершины одновременно является оценкой Оценка ребра имеет вид:

сверху всех продолжений данного пути, таким об 2 разом, порядок перебора соответствует алгоритму x + y + 4 - x - y +16 Дейкстры для дерева.

( ) QE e = max(0;

1- ), ( ) Рассмотренным образом шаблонный граф обоб щается последовательно на экземпляры докумен та из обучающей выборки. Затем графовая модель где = dmax - dmin /W, dmin,dmax — интервал () () преобразуется в структурное описание FlexiLay dx или dy метки ребра ei, W — характерная шири out. По вершинам графа строятся описания струк на интервала порядка размера страницы.

турных элементов. При этом, поскольку метки на вершинах были специальным образом подобраны, Данная эмпирическая оценка выбрана из следую описания структурных элементов получаются на щих соображений. Во-первых, изолинии функции прямую из меток на вершинах.

должны быть вогнутыми, т.е. оценка ребра с ин Ребра, описывающие отношения, проходят не тервалами шириной (для примера) x = 1, y = сколько фильтраций перед преобразованием в от должна быть выше, чем для ребра с интервала- ношения структурного описания. Дело в том, что 1 модельный граф является полным, и при перено ми шириной x =, y =. Во-вторых, оценка 2 се всех заданных в нем метрических отношений в должна быть близка к 1 для ребра, полученного в структурное описание, последнее окажется перегру результате правильного сопоставления объектов женным, а кроме того не будет обладать достаточной (x и y при этом существенно меньше 1), и замет гибкостью (аналог переобучения). Чтобы этого не но снижаться при приближении значений x и y произошло, отбираются только наиболее важные от к 1. В данном случае изолиниями являются гипер- ношения. Для каждого поля выбираются несколько статических элементов, относительно которых поле болы вида y = - a, a 1,2.

[ ] x + a локализуется наиболее надежно. С выбранными График функции оценки ребра в области элементами строятся метрические отношения, огра x 0,1, y 0,1 представляет собой поверх [ ] [ ] ничивающие положение поля. Ребра, связывающие ность, полученную «скольжением» гиперболы статические элементы друг с другом, преобразуются в отношения порядка (поскольку метки на ребрах y = -1, z = 0 по параболе z = 1- x2, x = y.

x + задают диапазоны расстояний с соответствующим Для поиска отображения вершин с наилучшей знаком, то по такой метке можно построить как ме оценкой применяется следующий метод:

трическое отношение, так и отношения порядка).

Будем последовательно выбирать пары для Задание таких отношений позволяет повысить точ вершин первого графа, используя дерево перебо- ность распознавания по сравнению с поиском толь ра. Узел дерева соответствует решению отобразить ко на основе локального контекста.

БИЗНЕС-ИНФОРМАТИКА №2(16)–2011 г.

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ После того как структурное описание построено обучающей выборки длины n усреднялось. На рис. оно тестируется на обучающей выборке. Проверка показана зависимость среднего процента ошибок от необходима, поскольку некоторые структурные эле- числа документов, на которых проводилось обучение.

менты могут распознаваться неоднозначно. Напри Рассмотренная модель документа и основанная на мер, одно и то же ключевое слово может встречаться ней система распознавания позволяют с достаточ в нескольких местах страницы. На основе анали ной точностью извлекать информацию из жестких за таких ложных объектов в структурное описание и полужестких форм. Также система может исполь вносятся необходимые изменения. Во-первых, зоваться для распознавания форм с гибкой структу может быть изменен порядок поиска структурных рой, однако в этом случае требуется больший размер элементов с тем, чтобы в первую очередь были рас обучающей выборки, а процент ошибок достаточно познаны наиболее надежные статические элементы.

высок. Однако в этом случае возможна доработка Во-вторых, в описание могут быть добавлены до полученного автоматически структурного описания полнительные метрические отношения между ста вручную оператором. Такая доработка возможна тическими элементами, а так же некоторые допол благодаря тому, что модель FlexiLayout изначально нительные ограничения.

предназначалась для построения вручную. Суще ствует специализированная программа для ее ре 5. Экспериментальная дактирования, включающая набор необходимых для оценка и выводы этого средств и инструментов. Даже с условием руч ной доработки использование системы машинного Оценка обобщающей способности предложенно обучения позволяет существенно сократить время и го метода распознавания документов проводилась трудоемкость создания структурного описания.

методом скользящего контроля при нарастающей Для документов произвольной структуры, в кото длине обучающей выборки. Множество изображе рых нельзя выделить статическую часть, например ний документов сортировалось в случайном порядке.

писем, данная система имеет ограниченное приме На каждой итерации в качестве обучающей выборки нение. Однако она может применяться для неко использовались первые n изображений, а в качестве торых документов, не относящихся к формам, на контрольной — (n+1) - е изображение. При этом определялось число ошибок, т.е. число полей, лока- пример контрактов, где некоторые ключевые слова лизация которых была определена неверно. Проверка (заказчик, адрес, телефон, поставщик и т.п.) могут проводилась на нескольких различных сортировках быть использованы в качестве опорных элементов исходного множества, после чего число ошибок для для локализации необходимых полей.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 Размер обучающей выборки Рис. 2. Черный график — полужесткая форма, серый график — гибкая форма.

БИЗНЕС-ИНФОРМАТИКА №2(16)–2011 г.

Среднее число ошибок, % МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ Литература 1. Farrow G.S.D. et al, Model Matching in Intelligent Document Understanding, Proc. of ICDAR’95, c. 293-296, 1995.

2. Ishitani Y., Flexible and robust model matching based on association graph for form image understanding, Pattern Analysis and Application, т. 3, с. 104–119, 2000.

3. Yuan J., Tang Y.Y., Suen C.Y., Four Directional Adjacency Graphs (FDAG) and Their Application in Locating Fields in Forms, Proc. of ICDAR’95, 1995.

4. Bayer, Th. A. and H. U. Mogg-Schneider, A Generic System for Processing Invoices, Proc. of ICDAR’97, 1997.

5. Bagdanov A. and Worring M., Fine-Grained Document Genre Classification Using First Order Random Graphs, Proc. of ICDAR’2001, с. 79-85, 2001.

6. Chan K. P., Learning Templates from Fuzzy Examples in Structural Pattern Recognition, IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics, 26(1), с. 118-123, 1996.

7. Hirayama Y., Analyzing Form Images by Using Line-Shared-Adjacent Cell Relations, Proc. of IAPR’96, 1996.

8. Ramel J., Crucianu M., Vincent N. and Faure C., Detection, Extraction and Representation of Tables, Proc. of ICDAR’03, с. 374-379, 2003.

9. Hurst M., A Constraint-Based Approach to Table Structure Derivation, Proc. of ICDAR’03, с. 911-916, 2003.

10. Amano A. and Asada N., Graph Grammar Based Analysis System of Complex Table Form Document, Proc. of ICDAR’03, с. 916-921, 2003.

11. Esposito F., Ferilli S., Basile T. and Di Mauro N., Machine Learning for Digital Document Processing: from Layout Analysis to Metadata Extraction, Machine Learning in Document Analysis and Recognition, с. 105 108, Springer-Verlag, 2008.

12. Laven K., Roweis S. and Leishman S., A Statistical Learning Approach to Document Image Analysis, Proc. of ICDAR’05, с. 357-362, 2005.

13. Ceci M., Berardi M., and Malerba M., Relational Learning Techniques for Document Image Understanding:

Comparing Statistical and Logical Approaches, Proc. of ICDAR’05, с. 473-478, 2005.

14. Minagawa A., Fujii Y., Takebe H., and Fujimoto K., Logical Structure Analysis for Form Images with Arbitrary Layout by Belief Propagation, Proc. of ICDAR’07, с. 714-719, 2007.

15.Tuganbaev D., Pakhchanian A., and Deryagin D. Universal Data Capture Technology from Semi-structured Forms, Proc. of ICDAR’05, c. 458-463, 2005.

16.Wnek J., Machine Learning of Generalized Document Templates for Data Extraction, Lecture Notes in Computer Science, Vol. 2423/2002, c. 627-635, 2002.

17. Cook D., Holder L., Mining Graph Data, Wiley-Interscience, 2006.

18.Kuramochi M., Karypis G., An efficient algorithm for discovering frequent subgraphs, Tech. Rep. 02- Minneapolis, University of Minnesota, 2002.

19. Yan X., Han J., gSpan: Graph-Based Substructure Pattern Mining, Proc. of IEEE International Conference on Data Mining (ICDM’02), Los Alamitos, 2002.

20.Neuhaus M. and Bunke H., A probabilistic approach to learning costs for graph edit distance. Proceedings of 17th International Conference on Pattern Recognition, Vol. 3, 2004.

БИЗНЕС-ИНФОРМАТИКА №2(16)–2011 г.




© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.