WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 | 2 || 4 |

В процессе распознавания полей формы на вход системы подаются рукопечатные символы. На первом уровне с помощью самого быстрого (и соответственно самого простого) алгоритма М1 определяется принадлежность входных символов к одному из известных классов. Затем по определенным классам выполняют поиск по соответствующему альтернативному ключевому полю в БД. Если удается найти уникальную запись, то результатом распознавания принимается значение точного поля, и на этом процесс распознавания прекращается. В противном случае, когда не удается найти уникальную запись или найдется несколько записей, то результаты распознавания передаются на второй уровень. Здесь с помощью более «тонких» методов и алгоритмов делается попытка точно определить символы внутри класса и, как и в предыдущем уровне, выполняется поиск в БД по распознанным символам, но по другому альтернативному ключевому полю, соответствующему этому уровню. Если опять не удается найти нужную запись, то результаты распознавания передаются на следующие уровни более глубокой обработки и т.д.

В последнем уровне, если поиск не дает результатов, то поле формы отмечается как нераспознанное и нуждающееся в ручной проверке со стороны оператора, а процесс распознавания прекращается (рис.1.). Очевидно, что эффективность всей системы РРФ будет существенно зависеть от полноты БД, которая может пополняться для конкретной предметной области.

Алгоритм построения скелета или алгоритм «утоньшения» представляет собой итеративный процесс. На каждой итерации последовательно просматриваются все точки изображения, и те из них, которые принадлежат границе области черных точек, удаляются, т.е. помечаются как 0 (рис. 3). Исключение составляют точки, нарушающие 8-связность области черных точек и концы линий толщиной в одну точку. Процесс заканчивается, если на некоторой итерации не удалось удалить ни одной точки.

Решение об удалении той или иной точки принимается на основе значений соседних точек, т.е. изображение сканируется окном 33. Существует несколько вариаций критерия удаления точки p; здесь мы рассмотрим один из наиболее используемых критериев. Пронумеруем соседние точки, как показано в табл.2., и обозначим множество всех соседей x1, x2, x3, x4, x5, x6, x7, x8 как N(p). Количество черных точек в N(p) обозначим как b(p).

Таблица

2.

Сканированное окно

X6

X7

X8

X5

P

X1

X4

X3

X2

Для удаления точки необходимо выполнение следующих условий.

  • Точка принадлежит границе области единичных точек, что равносильно условию – среди 4-связных соседей есть белые точки. Данное условие можно записать как x1x3x5x7 = 0.
  • Удаление точки не нарушает 8-связность области, что равносильно условию – количество 8-связных областей черных точек в N(p) равно 1.
  • Точка не является концом линии черных точек. Данное условие можно записать как b(p)>1.
  • Для предотвращения «разрушения» области черных точек белыми точками необходимо также условие b(p)<7.

В третьей главе диссертации ставится и решается задача формализации моделей экспертного опроса и оценки качества экспертизы с учетом оценки компетентности самих экспертов.

Подбор экспертов необходимо проводить из соображений:

  • много экспертов - плохо, так как больше вероятность привлечения некомпетентных специалистов;
  • мало - тоже плохо, так не будет достаточной статистики согласования мнений экспертов.

При этом необходимо учитывать основные показатели качества эксперта, а именно, профессиональные качества (компетентность), способность решать задачи, метод решения которых полностью или частично неизвестен (креативность), способность выявлять неочевидные проблемы (эвристичность), способность угадывать решение без его обоснования (интуиция), способность предсказать будущее решение (предикатность), способность противостоять большинству (независимость), способность видеть проблему с разных точек зрения (всесторонность).

Кроме того, должны быть разработаны формальные оценки качества экспертиз и механизмов выбора рациональных решений, основанные на предположениях 1-7.

1. Условие наследования (H):

X’X C(X’)C(X)X’.

(17)

Если рассмотреть выбор из произвольного множества и выбор из некоторого его подмножества, то все альтернативы, которые были выбраны из исходного множества и вошли в рассматриваемое подмножество будет выбраны также из этого подмножества.

2. Условие независимости от отвергнутых альтернатив (О):

C(X)X’X C(X’)=C(X).

(18)

Если рассмотреть произвольное подмножество X’, содержащее все альтернативы, выбранные из X, то выбор из X’ будет совпадать с выбором из исходного множества, в частности C(C(X))=(X).

3. Условие согласия (С):

.

(19)

Альтернативы, которые были выбранные из каждого Xi, будут выбраны и из их объединения.

4. Условие Плотта (квазисумматорности)– независимость выбора от пути (KC):

C(X1X2)=С(C(X1)C(X2)).

(20)

Условие Плотта требует, чтобы выбор из объединения множеств совпадал с выбором из объединения выборов, сделанного из каждого в отдельности.

5. Условие сумматорности (СМ):

C(X1X2)=C(X1)C(X2).

(21)

Условие сумматорности предполагает, что выбор из объединения множеств равен объединению выборов из каждого множества в отдельности.

6. Условие мультипликаторности (МП):

C(X1X2)=C(X1)C(X2).

(22)

7. Условие монотонности

X1X2 C(X1) C(X2).

(23)

Смысл условия заключается в том, что выбор из более широкого подмножества будет более широкий.

В ряде случаев при подборе экспертов используются некоторые численные оценки, характеризующие их квалификацию. Такие статистические оценки носят экспертный характер, и их применение возможно только тогда, когда эксперт достаточно часто привлекался для решения задач экспертизы одного типа. Примером может служить определение экспертами качества продукции в отделе технического контроля. Численные оценки могут быть использованы для улучшения состава экспертной группы и повышения достоверности результирующей оценки.

Целью анализа является получение весов экспертов i. Пусть после многократного оценивая набрана статистика относительно ошибок i-го эксперта в j-ой экспертизе. Значения ошибок вычисляются на основании соотношения:

,

(24)

где Tфj – фактическое значение, полученное после реализации проекта;

Tij – оценка, данная i-ым экспертом.

Тогда веса формируются на основании соотношения:

,

(25)

где kj – количество оценок, которые дал i-ый эксперт.

Для повышения точности классификации экспертов и идентификации ситуаций по показателям технологического процесса в диссертации разработана модель кластеризации на основе методов латентно-структурного анализа, в которой предполагается, что каждый латентный класс является однородным относительно любых оценочных величин. Требуется, чтобы каждый латентный класс был достаточно однородным по отношении к любой латентной величине, так чтобы все единичные высказывания внутри класса были статистически независимы. Эта независимость внутри классов выражается следующими уравнениями:

pljk = plkplj, p2jk = p2kp2j, …, pqjk = pqkpqj,

pljkl = plkpljpll, p2jkl = p2kp2jp2l, …, pqjkl = pqkpqjpql,

(26)

Преобразование уравнений в соответствии с требованиями однородности групп приводит к системе уравнений:

n=n1+ n2+…+ nq

nj=n1p1j+ n2p2j +…+ nqpqj

njk=n1plkplj+ n2p2kp2j +…+ nqpqkpqj

njkl=n1 p2kp2jp2l + n2 p2kp2jp2l +…+ nq pqkpqjpql

и т.д.

(27)

Все наблюдаемые совместные частоты выражаются через (q+sq) латентных параметров, q объемов классов и q латентных вероятностей (p1j, p2j, …, pqj) для каждого из s признаков анкеты экспертной карты. Последовательные ступени эмпирических частот насчитывают соответственно 1, s, s(s-1)/2 и т.д. членов, являющихся коэффициентами бинома (а+b)s. Складывая их, получаем 2s уравнений, связывающих наблюдаемые и латентные величины в этой модели.

Задача, как и в факторном анализе, заключается в решении основных уравнений относительно неизвестных латентных параметров. Большинство из известных решений не используют совместные частоты с повторяющимися индексами (njj, njjk, njjj, njjkl и т. д.). В анализе латентной структуры (рис.2.) они рассматриваются как аналоги общих факторных дисперсий факторного анализа, которые нам неизвестны. В диссертации доказано, что представление их в виде эквивалентов, соответствующих смешанным частотам более низкой ступени без повторяющихся индексов (то есть njj=nj, njjk=njk, и т. д.) дает аналог использования равных единиц корреляций в факторном анализе.

Гипотетическая диаграмма рассеяния

Рис.

2.

В работе предполагается, что имеется набор s количественных измерений, таких, как баллы карт экспертизы в выборке из п экспертов. По некоторому правилу каждый член этой выборки приписывается одной, и только одной, из q подгрупп. Тогда размер выборки, суммы баллов и суммы произведений баллов для всей выборки выражаются через соответствующие статистики для подгрупп следующим образом:

n=n1+ n2+…+ nq

и т.д.

(28)

Все суммирования в (26) проводятся по экспертам. Суммирования слева проводятся по всей выборке, а справа — по экспертам различных подгрупп; величина Хij есть балл эксперта i по экспертизе j, и она может быть дана в единицах стандартного отклонения или в каких-либо других единицах. То же самое относится и к Хik, Хil и т. д.

Проведена апробация процедуры экспертного оценивания и классификации ситуаций, возникающих в ходе технологического процесса.

Таблица

3.

Решение латентного профиля

для гипотетического примера трех классов

Номер карты

Латентный класс

I

II

III

Средние по классам

1

-1,50

0,50

0,50

2

-1,50

0,50

0,50

3

-1,00

0,00

1,00

4

-0,50

-0,50

1,50

5

-0,50

-0,50

1,50

Размеры класса

0,25

0,50

0,25

Линия регрессии тестов на латентном континууме

для гипотетического случая двух классов

Рис.

3.

Pages:     | 1 | 2 || 4 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»