WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


На правах рукописи

Зацман Игорь Моисеевич

ОСНОВЫ КОМПЬЮТЕРНОГО ПРЕДСТАВЛЕНИЯ ЭКСПЕРТНЫХ ЗНАНИЙ ДЛЯ МОНИТОРИНГА ПРОГРАММНО-ЦЕЛЕВОЙ ДЕЯТЕЛЬНОСТИ

Специальность 05.13.17 «Теоретические основы информатики»

Автореферат диссертации на соискание ученой степени доктора технических наук

Москва 2011

Работа выполнена в Учреждении Российской академии наук Институт проблем информатики РАН

Официальные оппоненты: доктор технических наук, профессор Антопольский Александр Борисович;

доктор филологических наук, профессор Гиляревский Руджеро Сергеевич;

доктор технических наук, профессор Дулин Сергей Константинович.

Ведущая организация: Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации

Защита диссертации состоится _____________ в ___ часов на заседании диссертационного совета Д002.073.01 при Учреждении Российской академии наук Институт проблем информатики РАН (ИПИ РАН) по адресу: 119333, Москва, ул. Вавилова, 44, корп. 2.

С диссертацией можно ознакомиться в библиотеке ИПИ РАН.

Отзывы в одном экземпляре, с заверенной подписью, просим направлять по адресу: 119333, Москва, ул. Вавилова, 44, корп. 2, в диссертационный совет.

Автореферат разослан « ___» _______ 2011 г.

Ученый секретарь диссертационного совета Д002.073.доктор технических наук, профессор С.Н. Гринченко - 3 -

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность исследования. Новые условия и предпосылки, которые определяют актуальность диссертационного исследования, сформулированы в Концепции реформирования бюджетного процесса в РФ в 2004-2006 годах, одобренной Постановлением Правительства РФ от 22 мая 2004 года № 249 «О мерах по повышению результативности бюджетных расходов» (далее – Постановление 249). В процессе реформирования бюджетного процесса программно-целевая деятельность становится доминирующей во всех сферах, финансируемых за счет бюджетных средств. Согласно данной Концепции осуществляется переход на реализацию долгосрочных программ с явным описанием их целей, задач, ресурсов и ожидаемых результатов, а также с использованием индикаторов для мониторинга и оценивания полученных результатов, эффективности и результативности программно-целевой деятельности.

Реализация долгосрочных целевых программ и применение в новых условиях индикаторов, которые традиционно использовались при статистическом наблюдении и принятии решений по бюджетированию до реформирования бюджетного процесса, выявили нерелевантность и неполноту традиционно используемых наборов индикаторов. Принятие решений в новых условиях сформировало спрос на разработку программно-ориентированных индикаторов.

Их разработка сопряжена с созданием новых концептуальных подходов, методов и алгоритмов вычисления значений индикаторов.

Целенаправленное формирование знаний, ориентированное на создание новых концептуальных подходов и методов, стало актуальной проблемой в разных сферах деятельности, что нашло отражение в официальных документах.

Так, разработка новых методов индикаторного оценивания научной деятельности включена в тематическое направление «29. Системы автоматизации, CALSтехнологии, математические модели и методы исследования сложных управляющих систем и процессов» Программы фундаментальных научных исследований РАН на 2008 - 2012 годы, утвержденной Распоряжением Правительства РФ от 27 февраля 2008 г. № 233-р (далее – Распоряжение 233).

Принятие Постановления 249 и Распоряжения 233 определило основную область применения результатов диссертационного исследования:

проектирование систем информационного мониторинга и индикаторного оценивания программно-целевой деятельности. В Концепции реформирования бюджетного процесса в России предусматривается создание систем информационного мониторинга и оценивания, которые должны развиваться по мере накопления опыта применения новых методов бюджетного планирования.

При этом с развитием этих систем сферу применения новых методов программноцелевого планирования предполагается расширять.

В настоящее время спектр исследований процессов целенаправленного формирования новых знаний и их компьютерного представления образует в информатике новое научное направление, результаты которого в будущем найдут свое применение в различных сферах, финансируемых на программно-целевой - 4 основе. На становление этого научного направления оказал существенное влияние процесс разработки 7-ой Рамочной программы Европейского Союза (ЕС), принятой на период 2007-2013 годы, в частности, подготовка в рамках этой программы концептуальных и конкурсных документов для тем и проектов по созданию информационно-коммуникационных технологий (ИКТ) нового поколения.

В этих документах определен широкий спектр актуальных исследований и разработок, включая исследование возможностей существующих и разработку новых поколений ИКТ, обеспечивающих представление в информационных системах формируемых (генерируемых) знаний человека в их динамике и целенаправленное влияние на процесс их формирования. Ключевая роль ИКТ в проблематике формирования и представления новых знаний послужила основанием для включения этой проблематики в тематические исследовательские программы 7-ой Рамочной программы ЕС по ИКТ.

Степень разработанности проблематики. Цели формирования новых или развития существующих систем знаний во многом зависят от предметной области, в рамках которой формируются или развиваются системы знаний.

Известная в настоящее время спиральная модель формирования знаний, которая описана в работах Нонака и Такеучи1, и ее обобщение, предложенное в работах Вежбицки и Накамори2, не зависят от целей формирования, предметной области и с этой точки зрения они являются универсальными. Поэтому спиральная модель формирования знаний и ее обобщение Вежбицки и Накамори были выбраны в качестве исходной позиции для диссертационного исследования.

Опыт применения ИКТ, разработанных в институте JAIST (Japan Advanced Institute of Science and Technology) для поддержки процесса формирования научных знаний, позволяет утверждать следующее: несмотря на то, что модели формирования знаний, предложенные Нонака и Такеучи, Вежбицки и Накамори, уже используются на практике, имеется ряд нерешенных проблем и задач, ограничивающих сферу применения этих моделей.

Перечислим четыре таких задачи: 1) в моделях не фиксируются изменения состояния формируемых личностных знаний человека в зависимости от времени, 2) не определены объекты интерпретации, являющиеся источниками новых знаний человека, 3) не выделены структурные элементы формируемых знаний, соответствующие объектам интерпретации, и 4) не фиксируется момент времени генерации каждого нового структурного элемента. Комплексное решение поставленной в диссертации проблемы, включающей четыре перечисленные По данным Google Scholar на 17.06.2011 общее число цитирований следующих двух работ равно 22344: 1) Nonaka I. The knowledge-creating company // Harvard Business Review. 1991. Vol. 69. N. 6. - Pp. 96–104; 2) Nonaka I., Takeuchi H. The knowledge-creating company. – Oxford; N.Y.: Oxford University Press, 1995.

Wierzbicki A.P., Nakamori Y. Basic Dimensions of Creative Space. In: Creative space:

Models of Creative Processes for Knowledge Civilization Age. / Ed. by A.P. Wierzbicki and Y. Nakamori. – Springer Verlag: Berlin-Heidelberg, 2006. – Pp. 59-90; Wierzbicki A.P., Nakamori Y. Knowledge sciences: Some new developments // Zeitschrift fr Betriebswirtschaft. 2007. Vol. 77. No. 3. – Pp. 271-295.

- 5 - задачи, на основе единой модели формирования и компьютерного представления личностных и коллективных знаний в настоящее время отсутствует.

В связи с вышесказанным актуальными являются исследования, направленные на создание концептуальных основ формирования и компьютерного представления формируемых знаний человека в динамике их направляемого развития.

Предлагаемые в диссертации концептуальные основы формирования и компьютерного представления экспертных знаний представляют собой существенное развитие спиральной модели формирования знаний и ее обобщения, предложенного Вежбицки и Накамори. При этом в диссертации получено комплексное решение проблемы, включающей четыре перечисленные задачи, на основе единой модели формирования и компьютерного представления экспертных знаний, которая позволяет фиксировать изменения личностных и коллективных знаний во времени применительно к мониторингу и индикаторному оцениванию программно-целевой деятельности.

В процессе исследования использовались результаты работ Г.Б. Клейнера, Е.Б. Козеренко, К.К. Колина, И.П. Кузнецова, Н.В. Лукашевич, Г.С. Поспелова, Д.А. Поспелова, Ю.И. Шемакина, Ю.А. Шрейдера, B.C. Brooks, J. Farradane, P. Ingwersen, F. Machlup, S. Gorn и многих других.

Целью работы является разработка концептуальных основ и моделей компьютерного представления экспертных знаний, формируемых для мониторинга и индикаторного оценивания программно-целевой деятельности, а также отображения динамики формирования личностных и коллективных знаний экспертов.

Для достижения поставленной цели необходимо было решить следующие задачи.

1. Сформулировать проблему компьютерного представления знаний, формируемых экспертами для мониторинга и оценивания программно-целевой деятельности.

2. Разработать концептуальные основы компьютерного представления экспертных знаний об индикаторах в динамике их формирования, включая описание используемой системы терминов.

3. Разработать модели компьютерного представления экспертных знаний, которые описывают процесс формирования программно-ориентированных индикаторов и фиксируют изменения формируемых знаний об индикаторах во времени.

4. На основе моделей компьютерного представления экспертных знаний в динамике их формирования разработать архитектуру лингвистического обеспечения систем информационного мониторинга и индикаторного оценивания программно-целевой деятельности, а также провести ее экспериментальное исследование.

Объектом исследования являются долгосрочные целевые программы, которые реализуются в интересах удовлетворения научных, образовательных, технологических, культурных, экономических и иных общественно значимых - 6 потребностей, и для которых определены объекты мониторинга и индикаторного оценивания, включая цели, задачи, ресурсы и ожидаемые результаты программ.

Предметом исследования являются мониторинг и оценивание долгосрочных целевых программ с помощью программно-ориентированных индикаторов, формируемых экспертами.

Методы исследования. Проводимые в работе теоретические и практические исследования базируются на методах системного анализа, семиотики, теории алгоритмов, искусственного интеллекта и технологии программирования.

Научная новизна. Основной результат диссертационной работы состоит в постановке и решении проблемы компьютерного представления экспертных знаний, формируемых для мониторинга и индикаторного оценивания программно-целевой деятельности. При этом впервые получены следующие научные результаты:

- предложена система терминов, включающая новые понятия «формокода» и «семокода», которые используются в описании способов кодирования смыслового содержания (концептов) программно-ориентированных индикаторов и их названий (имен);

- предложено развитие понятия креативного пространства по Вежбицки и Накамори, которое в отличие от определенного ими пространства с двумя измерениями (социальным и эпистемологическим) включает третье средовое измерение этого пространства;

- определено новое понятие неактуального концепта для номинативной шкалысоциального измерения креативного пространства Вежбицки и Накамори, которое дает возможность на любом этапе формирования индикаторов зафиксировать то их подмножество, которое на этом этапе эксперты исключили из рассмотрения;

- креативное пространство дополнено денотатами4, на основе концептуализации которых формируются экспертные знания для мониторинга и оценивания программно-целевой деятельности, что отличается от подхода Вежбицки и Накамори, в котором источники генерации знаний не определены;

- разработана стационарная семиотическая модель компьютерного кодирования, отображающая треугольник Фреге, вершины которого имеют разную природу (ментальную, социально-коммуникационную, цифровую или материальную), на цифровой семиотический треугольник, принадлежащий полностью цифровой среде5; в отличие от существующих моделей стационарная семиотическая модель дает возможность назначать компьютерные коды од Номинативная шкала социального измерения креативного пространства Вежбицки и Накамори включает индивидуальные, коллективные и конвенциональные знания.

В рассматриваемой проблеме денотат представляет собой совокупность программы вычисления значений индикатора, данных, используемых программой для определения значений этого индикатора, а также его значений, вычисленных этой программой.

Цифровая среда – сочетание элементов цифровой вычислительной техники и средств телекоммуникации, иных цифровых средств ввода, хранения, поиска, передачи дискретных сигналов и других процессов их обработки.

- 7 - новременно стабильным объектам интерпретации, соответствующим структурным элементам знаний, формируемых экспертами, и их названиям;

- определено пространство Фреге, включающее ось времени и несколько осей компьютерных кодов для объектов интерпретации, соответствующих структурных элементов знаний, формируемых экспертами, и для их названий (имен); в отличие от креативного пространства Вежбицки и Накамори пространство Фреге дает возможность отображать одновременно динамику изменений денотатов, соответствующий процесс генерации экспертных знаний и процесс назначения названий (имен) структурным элементам знаний, формируемых экспертами;

- разработана нестационарная семиотическая модель компьютерного представления экспертных знаний, которая описывает процесс формирования программно-ориентированных индикаторов; в отличие от существующих моделей нестационарная семиотическая модель дает возможность описать объекты интерпретации и соответствующие им структурные элементы знаний об индикаторах в динамике их формирования;

- разработана архитектура лингвистического обеспечения систем информационного мониторинга для компьютерного представления экспертных знаний, формируемых для мониторинга и оценивания, которая в отличие от существующих архитектур включает полиструктурную динамическую классификацию индикаторов и проективный словарь программно-ориентированных индикаторов, разрабатываемых экспертами.

Теоретическая значимость работы состоит в постановке и решении проблемы компьютерного представления знаний, формируемых экспертами для мониторинга и оценивания программно-целевой деятельности. Решение этой проблемы включает в себя:

- разработку концептуальных основ компьютерного представления экспертных знаний в динамике их формирования, представляющих собой дальнейшее развитие обобщенной спиральной модели формирования знаний Вежбицки и Накамори;

- построение стационарной и нестационарной семиотических моделей представления личностных и коллективных знаний экспертов в системах информационного мониторинга;

- разработку принципов проектирования лингвистического обеспечения для компьютерного представления экспертных знаний об индикаторах в динамике их формирования, разрабатываемых для мониторинга и оценивания программно-целевой деятельности.

В диссертации предложен новый подход к разработке моделей компьютерного представления экспертных знаний в динамике их формирования.

Его суть заключается в явном определении объектов интерпретации и выделении соответствующих им структурных элементов знаний, формируемых экспертами, а также в использовании нескольких осей компьютерных кодов для многомерного отображения изменений денотатов, процессов формирования соответствующих им структурных элементов знаний и их имен.

- 8 Практическая значимость работы заключается:

- в построении и апробации системы терминов, которая была использована в разработке концептуальных основ компьютерного представления экспертных знаний;

- в создании концептуальных основ и семиотических моделей компьютерного представления личностных и коллективных знаний, формируемых экспертами, которые используются при разработке индикаторов оценивания программно-целевой деятельности;

- в разработке архитектуры лингвистического обеспечения, включающего проективный словарь индикаторов, разрабатываемых группой экспертов, и использовании созданного лингвистического обеспечения для компьютерного представления экспертных знаний (включение проективного словаря в состав лингвистического обеспечения дало возможность разрабатывать новые алгоритмы для программно-ориентированных индикаторов, фиксируя этапы формирования их смыслового содержания, различия в трактовке и степень согласованности их понимания между экспертами);

- в совершенствовании технологии автоматизированного формирования аналитических отчетов по целевым программам в сфере науки, включающих программно-ориентированные индикаторы, разработанные экспертами.

Достоверность и обоснованность результатов исследования подтверждена:

- опытом практической реализации результатов исследования и их использованием в научных исследованиях, имеющих государственную регистрацию (НИР «Разработка методов и принципов создания информационных технологий для оценивания результатов влияния фундаментальных исследований», выполняемая с 2010 года в ИПИ РАН в соответствии с Программой фундаментальных научных исследований РАН на 2008-2012 годы, номер госрегистрации темы 01201000917);

- использованием теоретических результатов работы в проектах по грантам Российского фонда фундаментальных исследований (№09-07-00156а, №0607-07001ано) и Российского гуманитарного научного фонда (09-02-00006а, №06-02-04043a, №05-03-03230а, № 05-03-12328в);

- совпадением результатов исследования с данными проведенных экспериментов;

- сопоставлением результатов исследования с данными зарубежного и отечественного опыта;

- обсуждением результатов диссертационного исследования на международных и всероссийских научных мероприятиях.

Соответствие диссертации паспорту научной специальности.

Проблематика диссертации соответствует следующим положениям формулы специальности 05.13.17 «Теоретические основы информатики»: создание и исследование информационных моделей, моделей данных и знаний, методов работы со знаниями, методов обнаружения новых знаний.

- 9 - Результаты диссертационного исследования соответствуют следующим положениям п. 4 паспорта специальности: разработка средств представления знаний, отражающих динамику процессов, концептуальных и семиотических моделей предметных областей.

Апробация результатов диссертации. Основные положения и результаты работы докладывались и обсуждались на следующих 34 международных и всероссийских научных мероприятиях:

1. Семинары "Компьютерная лингвистика и ее приложения" Диалог-99, (Таруса, 1999), Диалог-2000 (Протвино, 2000), Диалог-2001 (Аксаково, 2001), Диалог-2002 (Протвино, 2002);

2. Конференции "Компьютерная лингвистика и интеллектуальные технологии" Диалог-2003 (Протвино, 2003), Диалог-2005 (Звенигород, 2005), Диалог-20(Бекасово, 2006), Диалог-2007 (Бекасово, 2007), Диалог-2008 (Бекасово, 2008);

3. 20ty International Cartographic Conference (Пекин, 2001);

4. 3-я, 4-я, 7-я, 8-я, 9-я и 10-я Всероссийские конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (Петрозаводск, 2001), (Дубна, 2002), (Ярославль, 2005), (Суздаль, 2006), (ПереславльЗалесский, 2007), (Дубна, 2008);

5. 5-я и 6-я Всероссийские конференции “Технологии информационного общества - Интернет и современное общество” (Санкт-Петербург, 2002), (СанктПетербург, 2003);

6. 5th International Interdisciplinary Symposium "Picture language - visualization - diagrammatics" (Вена, 2002);

7. 8th, 9th, 10th Congresses of International Association of Semiotic Studies (Лион, 2004), (Хельсинки-Иматра, 2007), (Ла-Корунья, 2009);

8. The international conference "Innovation and Reproduction in Cultures and Societies" (Вена, 2005);

9. Atlanta Conference on Science, Technology and Innovation Policy (Атланта, 2007);

10. 10th, 11th International Conferences on Science and Technology Indicators (Вена, 2008), (Лейден, 2010);

11. 9-й Международный Форум «Высокие технологии 21-го века» (Москва, 2008);

12. Information and Brokerage Conference on Information and Communication Technologies in the EU's 7th Framework Programme (Москва, 2008);

13. Atlanta Conference on Science and Innovation Policy (Атланта, 2009);

14. The World Congress in Computer Science, Computer Engineering, and Applied Computing (Лас-Вегас, 2009);

15. 7th Framework Programme Information and Communication Technologies Proposers' Day (Будапешт, 2009);

16. XII International Conference «Cognitive Modelling in Linguistics» (Дубровник, 2010);

17. 3rd European Network of Indicators Designers Conference (Париж, 2010);

18. 7th Conference of the Nordic Association for Semiotic Studies (Лунд, 2011).

- 10 Под руководством автора и по тематике исследования защищена кандидатская диссертация по специальности 05.13.17 «Теоретические основы информатики» по теме «Технология разработки семантического словаря системы информационного мониторинга».

Публикации. Основные результаты исследования опубликованы в работах, в том числе, в 1 монографии, 2 книгах и 14 статьях в журналах, входящих в Перечень журналов ВАК.

Структура диссертации. Диссертационная работа состоит из Введения, глав, Заключения, списка литературы, 49 рисунков, 7 таблиц, 5 приложений.

Основное содержание работы

изложено на 252 стр. Список литературы включает 228 наименований.

СОДЕРЖАНИЕ РАБОТЫ

Во Введении обоснована актуальность исследования, сформулированы цель и задачи исследования, показана научная новизна, теоретическая и практическая значимость результатов работы.

В первой главе диссертации сформулирована проблема компьютерного представления знаний, формируемых экспертами для мониторинга и оценивания программно-целевой деятельности, показана ее актуальность и современное состояние.

Необходимость формирования экспертами новых или развития существующих систем знаний в той или иной предметной области может определяться по-разному, например, в процессе анализа и сопоставления новых социально-экономических, технологических и других потребностей общества с уже имеющимися теориями, методами, способами и средствами их удовлетворения. В диссертации рассматриваются вопросы формирования и компьютерного представления тех экспертных знаний, которые используются для мониторинга и индикаторного оценивания программно-целевой деятельности (ПЦД), которая понимается как совокупность целевых программ, объединенных по некоторому признаку. Так, объединяемые программы могут относится к некоторой предметной области. Целенаправленно формируемые системы знаний для мониторинга и индикаторного оценивания одной программы или ПЦД в целом предлагается называть целевыми (далее по тексту – целевые системы знаний или ЦСЗ).

Наиболее известные работы Нонака и Такеучи по созданию моделей процессов формирования знаний относятся к последнему десятилетию прошлого века и рубежу веков. В этих работах была предложена спиральная модель формирования знаний или SECI-модель6.

Обобщение этой модели было предложено в работах Вежбицки и Накамори, в которых было введено понятие креативного пространства для описания процессов формирования знаний.

Аббревиатура SECI образована первыми буквами английских названий процессов socialization (социализация), externalization (экстернализация), combination (синтез) и internalization (интернализация).

- 11 - Важно отметить, что в классической и обобщенной моделях отсутствует количественная ось времени (поэтому неизвестно, за какое время происходят изменения в системе знаний) и не определены объекты смысловой интерпретации, связанные с процессом порождения новых структурных элементов систем знаний, формируемых экспертами.

Для создания ИКТ, обеспечивающих поддержку процессов целенаправленного формирования знаний, недостаточно разработанных к настоящему времени моделей и методов, так как в них не фиксируются изменения состояния формируемых личностных и коллективных знаний во времени, не определены объекты интерпретации и не выделены соответствующие им структурные элементы знаний, формируемых экспертами.

Вопросы разработки новых методов и моделей целенаправленного формирования систем знаний с использованием возможностей ИКТ рассматривались приглашенными экспертами при подготовке 7-й Рамочной программы ЕС в рамках семинара «Knowledge Anywhere Anytime: “The Social Life of Knowledge”» (Брюссель, 29–30 апреля 2004 г.). Материалы этого семинара использовались при формировании программ работ по ИКТ 7-й Рамочной программы ЕС. В них отмечается, что сегодня исследование процессов целенаправленного формирования новых и развития существующих систем знаний является актуальной проблематикой. Участники семинара определили четыре актуальных направления исследований в рамках этой проблематики, которые описаны в диссертации.

Анализ этих направлений позволяет утверждать, что участники этого семинара отметили ключевую роль ИКТ в решении проблемы формирования новых и развития существующих систем знаний. При этом они существенно расширили границы предметной области целенаправленного формирования и представления знаний. Расширенная предметная область исследований включает в себя, в дополнение к традиционным вопросам представления знаний, следующие три проблемы:

- формирование и компьютерное представление в цифровой среде личностных и согласованных концептов7 как структурных элементов ЦСЗ, формируемой экспертами – проблема представления ЦСЗ;

- анализ и оценивание степени релевантности разных вариантов ЦСЗ социальным, экономическим, технологическим и другим общественно значимым потребностям, в интересах которых они были сформированы – проблема релевантности ЦСЗ;

- целенаправленное влияние средствами ИКТ на формирование и эволюцию ЦСЗ, необходимое для получения запланированных результатов – проблема направляемого развития ЦСЗ.

Область исследования диссертации относится к первой из трех перечисленных проблем, то есть к проблеме представления ЦСЗ. Эта В описаниях направлений исследований приглашенные эксперты семинара «Knowledge Anywhere Anytime: “The Social Life of Knowledge”» трактуют концепт как структурный элемент системы знаний человека.

- 12 поставленная в диссертации проблема исследуется, в основном, с точки зрения создания систем информационного мониторинга и индикаторного оценивания ПЦД, в интересах которого необходимо формировать ЦСЗ о программноориентированных индикаторах.

В проблеме формирования ЦСЗ об индикаторах мониторинга и оценивания ПЦД ключевыми являются процессы интерпретации и концептуализации, т.е.

формирование смыслового содержания индикаторов в процессе их разработки экспертами. Понятия интерпретации и концептуализации являются ключевыми в постановке и решении проблемы представления ЦСЗ.

Концептуализация определена в диссертации как итерационный процесс формирования экспертом в течение некоторого периода времени концепта (смыслового содержания) нового индикатора. Концепт индикатора как структурный элемент знаний эксперта является результатом содержательного анализа алгоритма изменяемой экспертом компьютерной программы и данных, используемых для определения значений этого индикатора, а также его значений, вычисленных этой программой.

Предполагается, что в течение любой отдельно взятой итерации (этапа) формирования концепта нового индикатора, компьютерная программа и данные, используемые этой программой для определения значений индикатора, остаются неизменными. Изменения могут происходить только между этапами содержательного анализа алгоритма, данных и значений индикатора.

Для обозначения объекта концептуализации, который состоит из компьютерной программы, данных и вычисленных значений индикатора, в диссертации используется термин «денотат индикатора» или просто «денотат».

Интерпретация определена в диссертации как один из этапов концептуализации денотата индикатора, в течение которого программа определения значений индикатора и данные, используемые этой программой, остаются неизменными.

Эксперты, разрабатывающие новые индикаторы и формирующие их концепты, руководствуются явно заданными целями генерации ЦСЗ о программно-ориентированных индикаторах. Между любыми двумя последовательными этапами концептуализации эксперты могут вносить изменения в алгоритмы компьютерных программ и в данные, используемые для определения значений индикаторов.

Если на некотором этапе концептуализации денотата экспертом был сгенерирован концепт нового индикатора, а затем между двумя последовательными этапами он изменил алгоритм и/или данные (будем называть это получением нового состояния денотата), то на следующем этапе концептуализации им может быть сгенерирован другой концепт разрабатываемого индикатора как результат интерпретации нового состояния денотата.

Постановка проблемы представления ЦСЗ. Предположим, что перед группой экспертов поставлена задача формирования ЦСЗ о новых программноориентированных индикаторах, предназначенных для мониторинга и оценивания ПЦД, используя заданную систему классификации индикаторов.

- 13 - Процесс формирования ЦСЗ об индикаторах состоит из серии этапов концептуализации денотатов. Каждое состояние денотата (как зафиксированный в цифровой среде объект смысловой интерпретации) представляет собой совокупность трех следующих компонентов, которые не изменяются в процессе интерпретации:

- программы определения значений нового индикатора;

- данных, которые обрабатываются программой определения его значений;

- значений нового индикатора, которые получены в результате выполнения программы.

Между этапами эксперты имеют возможность изменять программы и данные, которые обрабатываются программой. Эксперт может написать новую (изменить существующую) программу определения значений индикатора и/или подготовить (изменить) данные, которые обрабатываются этой программой, затем выполнить этот вариант программы и получить результаты вычислений. На каждом этапе концептуализации эксперт анализирует алгоритм программы, использованные данные и полученные значения с целью формирования на этом этапе его личностного концепта (смыслового содержания) варианта нового индикатора.

Каждый этап концептуализации денотата индикатора необязательно завершается формированием концепта индикатора (например, эксперт изменил алгоритм и/или данные, но не смог интерпретировать полученное состояние денотата). В случае формирования концепта эксперт выражает свое личностное понимание индикатора сначала в виде позиции (рубрики) в заданной системе классификации индикаторов, а затем дефиницией. Также он может присвоить индикатору имя.

Кроме того, он начинает процесс согласования полученного им личностного концепта, дефиниции и имени индикатора с другими экспертами группы. Цель процесс согласования - убедить других экспертов в корректности построения и правильности своей интерпретации индикатора, представленной в виде позиции в заданной системе классификации и дефиниции, а также обосновать выбор имени индикатора.

Если он получит согласование еще хотя бы одного эксперта, то концепт этого индикатора получает статус согласованного концепта (вопрос степени согласованности индикатора в пределах группы экспертов рассматривается в Главе 4 диссертации).

Каждый этап концептуализации денотата индикатора может завершиться одним из следующих четырех результатов:

- написана новая (изменена существующая) программа вычисления значений варианта нового индикатора и/или подготовлены (изменены) данные, которые обрабатываются этой программой, и получены результаты вычислений, но личностный концепт не сформирован (получено новое неинтерпретированное состояние денотата, но его понимание отсутствует);

- сформирован личностный концепт и определена его позиция (рубрика) в заданной системе классификации, но отсутствуют дефиниция и имя для полученного варианта нового индикатора (первый уровень выражения концепта);

- 14 - дополнительно сформулирована дефиниция и выбрано имя для нового индикатора (второй уровень выражения концепта);

- личностный концепт, дефиниция и имя нового индикатора согласованы с одним или несколькими экспертами группы.

На следующем этапе концептуализации эксперт может сформировать новый денотат (изменить состояние существующего денотата) и повторить перечисленные операции или продолжить процесс согласования ранее созданных индикаторов с другими экспертами группы. В последнем случае, если согласование состоялось, то результатом будет изменение степени согласованности индикаторов. Предполагается, что задан некоторый пороговый уровень степени согласованности, при достижении которого индикатор получает статус сформированного.

При перечисленных исходных условиях и определенном выше регламенте формирования индикаторов требуется:

- определить многомерное пространство кодов состояний денотатов индикаторов, их концептов и имен, включающее ось времени, для отражения в этом пространстве результатов концептуализации денотатов;

- разработать модели компьютерного представления экспертных знаний для описания процессов формирования индикаторов в многомерном пространстве кодов состояний денотатов, концептов и имен индикаторов;

- разработать архитектуру лингвистического обеспечения систем информационного мониторинга для компьютерного представления экспертных знаний о формируемых программно-ориентированных индикаторах.

Разработанный вариант архитектуры лингвистического обеспечения предназначен одновременно для формирования и последующего использования индикаторов мониторинга и оценивания ПЦД.

Существенной особенностью сформулированной проблемы является представление в многомерном пространстве результатов концептуализации. Сама постановка проблемы представления ЦСЗ говорит о том, что в ней охватываются сущности трех разных сред: ментальной (концепты индикаторов), социальнокоммуникационной (имена индикаторов, присвоенные экспертами) и цифровой (компьютерные коды концептов, имен и состояний денотатов, присвоенные системой информационного мониторинга).

В приведенной постановке проблемы рассматриваются денотаты, компонентами которых являются программы, обрабатываемые ими данные и вычисленные значения индикаторов, т.е. эти компоненты относятся к цифровой среде. В диссертации на примерах из гидрологии и переводоведения показано, что разработанные модели могут также применяться для денотатов материальной и социально-коммуникационной природы.

Позиционируем проблематику диссертации в рамках классификации подходов к представлению знаний согласно МакГиннесс8 (см. Рисунок 1). В McGuinness D.L. Ontologies come of age. In: Fensel D., Hendler J., Lieberman H., Wahlster W. (Eds). Spinning the Semantic Web: Bringing the World Wide Web to Its Full Potential. - Cambridge, MA: MIT Press, 2003. - Pp. 171–194.

- 15 - рамках этой классификации проблематика диссертации и предлагаемые решения по созданию лингвистического обеспечения систем информационного мониторинга ближе всего к словарям терминов, тезаурусам и неформальным таксономиям.

Предлагаемые в диссертации концептуальные основы представления знаний, формируемых экспертами, базируются на следующих положениях:

- средовой принцип разделения предметной области информатики согласно структуре научных исследований, предложенный К.К. Колиным, - определение сферы незнания как сферы мысленно представляемого, но еще не познанного, через ее противопоставление со сферой знания, предложенное В.Л. Макаровым и Г.Б. Клейнером, - разграничение между знаковой информацией и данными по источнику их генерации, предложенное Ю.И. Шемакиным: человек как генератор знаковой информации и внешние по отношению к человеку технические цифровые измерительные системы как генераторы данных, - соотнесение объектов предметной области информатики со средами (ментальной, социально-коммуникационной, цифровой) по признаку принадлежности рассматриваемых объектов (концепты, информация и коды) к этим средам, - разграничение личностных, согласованных (коллективных) и общепринятых (конвенциональных) знаний согласно обобщенной спиральной модели формирования знаний Вежбицки и Накамори.

Произвольные Каталоги на логические основе утверждения о идентифиФормальные Фреймы Тезаурусы концептах каторов таксономии Словари Неформальные Формальные Ограничения терминов таксономии экземпляры на значения свойств Рисунок 1. Классификация подходов по степени формальности представления знаний Во второй главе диссертации дано краткое описание спиральной модели формирования знаний, ее обобщения и сформулированы девять направлений развития модели. Эти направления развития являются концептуальными основами разработки моделей компьютерного представления экспертных знаний (концептуальными решениями).

- 16 В классической спиральной модели формирования знаний или SECI-модели, Нонака и Такеучи определили две категории знаний: индивидуальные (личностные) знания человека и коллективные знания группы людей. Каждая из этих категорий разделена на два вида: выраженные и невыраженные знания (или выражаемые и невыражаемые знания). Всего классическая SECI-модель включает следующие четыре понятия:

1) индивидуальные невыраженные знания, 2) коллективные невыраженные знания, 3) индивидуальные выраженные знания, 4) коллективные выраженные знания.

Обобщение SECI-модели, разработанной Нонака и Такеучи, было предложено в работах Вежбицки и Накамори. В основном, это обобщение было связано с разделением знаний, не на две категории, как в работах Нонака и Такеучи, а на три: индивидуальные знания человека, коллективные знания и, дополнительно, конвенциональные знания. Деление на эти три категории Вежбицки и Накамори назвали социальным измерением креативного пространства формирования знаний.

С учетов деления каждой из трех категорий на два вида (выраженные и невыраженные знания) Вежбицки и Накамори добавили к четырем перечисленным понятиям Нонака и Такеучи два новых понятия:

5) конвенциональные невыраженные знания 6) конвенциональные выраженные знания.

Деление перечисленных понятий на выраженные и невыраженные знания Вежбицки и Накамори назвали эпистемологическим измерением креативного пространства формирования знаний.

В SECI-модели, кроме четырех понятий, определены следующие четыре процесса9:

- социализация индивидуальных невыраженных знаний – ‘socialization’ – обозначает процесс передачи невыраженных знаний от одного экспертаразработчика индикаторов к другим участникам совместной деятельности, например, путем предъявления им программ и данных, используемых для вычисления значений индикаторов, а также самих полученных значений;

- экстернализация коллективных невыраженных знаний – ‘externalization’ – обозначает процесс порождения коллективных выраженных знаний, например, в виде дефиниций индикаторов, на основе коллективных невыраженных знаний;

- синтез индивидуальных выраженных знаний – ‘combination’ – обозначает процесс образования экспертом его индивидуальных выраженных знаний на основе коллективных выраженных знаний с целью решения стоящих перед ним задач разработки индикаторов;

- интернализация индивидуальных выраженных знаний – ‘internalization’ – обозначает процессы формирования экспертом его индивидуальных невыраженных знаний на основе его индивидуальных выраженных знаний, исполь В автореферате описание процессов дано на примере разработки индикаторов.

- 17 - зуемых им в процессе решения стоящих перед ним задач разработки индикаторов.

Используя четыре перечисленных термина, Нонака и Такеучи ввели метафорическое понятие спирали формирования знаний, каждый виток которой включает последовательность процессов: социализация экстернализация синтез интернализация социализация (как начало следующего витка спирали).

Описание предлагаемых концептуальных решений, являющихся основой разработки моделей компьютерного представления знаний, формируемых экспертами для мониторинга и оценивания ПЦД, начинается в диссертации с определения нового, третьего, измерения креативного пространства формирования знаний, которое назовем средовым измерением.

В диссертации средовое измерение креативного пространства определяется номинативной шкалой10 для трех категорий знаний: индивидуальные, коллективные и конвенциональные знания. При этом невыраженные знания всех трех категорий относятся только к ментальной среде.

Таким образом, средовое измерение креативного пространства по определению включает следующие три среды (см. Рисунок 2):

- ментальная среда знаний, к которой относятся выражаемые и невыражаемые знания всех трех категорий;

- социально-коммуникационная среда, к которой относятся формы представления только выраженных знаний (индивидуальных, коллективных или конвенциональных);

- цифровая среда, к которой относятся коды представления выражаемых знаний (индивидуальных, коллективных или конвенциональных) и коды форм представления выраженных знаний.

Предлагаемое средовое измерение является первым направлением развития обобщенной спиральной модели формирования знаний (у креативного пространства Вежбицки и Накамори появляется третье измерение).

Еще одно направление развития модели связано с дополнением креативного пространства денотатами, на основе концептуализации которых формируются экспертные знания для мониторинга ПЦД, а также с определением в некоторый дискретный момент времени объекта интерпретации как состояния денотата, изменяемого в процессе концептуализации. Предложенное дополнение креативного пространства денотатами и определение объекта интерпретации как состояния денотата являются вторым направлением развития обобщенной спиральной модели формирования знаний.

Кроме объектов интерпретации, в диссертации определяются структурные элементы экспертных знаний, каждый из которых является результатом интерпретации некоторого состояния денотата. Определение структурных элементов новых знаний экспертов на каждом из этапов концептуализации является третьим направлением развития обобщенной спиральной модели Номинативная шкала средового измерения креативного пространства включает ментальную, социально-коммуникационную и цифровую среды.

- 18 формирования знаний. Это дает возможность фиксировать по завершении каждого этапа (в частном случае, витка спирали) прирост экспертных знаний в виде новых структурных элементов, сгенерированных только на этом этапе.

В диссертации предлагается регистрировать на оси времени период выполнения каждого этапа концептуализации и случаи появления на этом этапе новых структурных элементов знаний, чтобы описать в динамике весь процесс формирования и развития экспертных знаний. Введение в креативное пространство оси времени является четвертым направлением развития обобщенной спиральной модели формирования знаний.

Для дальнейшего развития обобщенной модели в диссертации используется перечень из девяти процессов, включая четыре процесса классической SECIмодели (т.е. социализация, экстернализация, синтез и интернализация), которые Вежбицки и Накамори определили в креативном пространстве. Среди пяти процессов, которые используются только в обобщенной спиральной модели, есть процесс перехода от индивидуальных (личностных) невыраженных знаний к выраженным (enlightenment). Выделим два уровня для этого процесса перехода и соотнесем эти уровни с формами выражения знаний.

В диссертации определены два вида форм выражения структурных элементов знаний: 1) в виде позиции (рубрики) в некоторой системе классификации (классификационная форма) и 2) в вербальной, образной или вербально-образной формах. Сначала, на первом уровне перехода от индивидуальных невыраженных знаний к выраженным, определяется позиция (рубрика) для каждого нового структурного элемента знаний в некоторой системе классификации, а затем, на втором уровне перехода, определяется вербальная, образная или вербально-образная форма представления этого элемента. Введение двух уровней для процесса перехода от индивидуальных (личностных) невыраженных знаний к выраженным является пятым направлением развития обобщенной спиральной модели формирования знаний.

Вышеупомянутое разделение модальностей (вербальной, образной и вербально-образной) форм выражения структурных элементов знаний является шестым направлением развития обобщенной спиральной модели.

Седьмым направлением развития является определение в креативном пространстве процесса концептуализации в виде повторяемых изменений денотатов и процессов интерпретации состояний измененных денотатов.

Восьмым направлением развития является описание четырех возможных вариантов завершения процесса интерпретации:

- личностный концепт не сформирован (индивидуальное понимание объекта интерпретации экспертом отсутствует);

- сформирован личностный концепт и определено его место в заданной системе классификации (первый уровень перехода от индивидуальных невыраженных знаний к выраженным);

- новый структурный элемент знаний выражен в вербальной (естественноязыковой), образной или вербально-образной формах (второй уровень перехода от индивидуальных невыраженных знаний к выраженным);

- 19 - - полученный личностный концепт и формы его выражения согласованы с одним или несколькими экспертами группы (переход от индивидуальных выраженных знаний к коллективным).

В обобщенной спиральной модели формирования знаний отсутствует упомянутый процесс перехода от индивидуальных выраженных знаний к коллективным. Добавление этого процесса в креативное пространство является девятым направлением развития модели. Этот процесс перехода назовем согласованием индивидуальных выраженных знаний с другими участниками совместной деятельности, в данном случае, с экспертами мониторинга и оценивания ПЦД.

Рассмотренные девять направлений развития обобщенной спиральной модели формирования знаний, определенной Вежбицки и Накамори, и разработанная система терминов (см. Рисунок 2) представляют собой концептуальные основы разработки моделей компьютерного представления экспертных знаний.

В третьей главе диссертации дано описание разработанных автором семиотических моделей компьютерного представления знаний об индикаторах, формируемых экспертами, в системах информационного мониторинга.

Лингвистическое обеспечение этих систем включает в себя проективный словарь, состоящий из дескрипторов новых индикаторов. Дескриптор описывает концепт, фиксирует название (имя) и состояние денотата индикатора.

Каждый дескриптор, который строится экспертом в целях описания формируемого им индикатора, включает три уникальных идентификатора:

- семантический идентификатор, который в диссертации назван кодом первой категории, предназначенный для компьютерного представления значения (смысла) дескриптора, т.е. концепта индикатора;

- информационный идентификатор, который назван кодом второй категории, предназначенный для компьютерного кодирования названия (имени) индикатора;

- объектный идентификатор, который назван кодом третьей категории, предназначенный для кодирования состояния денотата индикатора.

Дескриптор включает в себя набор связей, фиксирующих его положение внутри словаря, и набор внешних связей с компонентами видов обеспечения системы информационного мониторинга.

В целях построения семиотических моделей компьютерного представления экспертных знаний в диссертации для каждого дескриптора определено новое понятие семокода как совокупности концепта дескриптора и уникального семантического идентификатора дескриптора в словаре. Концепт дескриптора отражается набором внутренних связей дескриптора в словаре, его дефиницией и набором внешних связей дескриптора с видами обеспечения систем информационного мониторинга.

Аналогично для каждого дескриптора определено новое понятие формокода как сочетания названия (имени) индикатора, для которого построен дескриптор, и уникального информационного идентификатора дескриптора.

- 20 Кроме построения этих двух новых понятий, в диссертации для описания семиотических моделей сформирована система терминов, включающая следующие понятия с явным отнесением каждого из них к одной трех сред (см.

Рисунок 2):

– знания - результаты познавательной и креативной деятельности человека, носителем которых может быть только человек и в которых могут быть выделены отдельные «кванты» знаний (ментальная среда);

– концепты - элементарные единицы или сочетания элементарных единиц плана содержания, выраженные в рамках некоторого естественного языка (в общем случае, в рамках той или иной знаковой системы); концепты делятся на личностные, согласованные группой экспертов и конвенциональные концепты (ментальная среда);

– ментальные образы - структурные единицы невыраженных знаний человека, соответствующие сенсорно воспринимаемым данным и не являющиеся концептами (ментальная среда);

– информация - авторские, коллективные или общепринятые формы эксплицитного (явного) и отчужденного от человека представления его знаний, предназначенные для передачи, непосредственного сенсорного восприятия и понимания их другими людьми (социально-коммуникационная среда);

1) Знания, 12) Ментальные Ментальная среда 2) концепты, образы сенсорно 3) личностные, 4) согласованные и воспринимаемых 5) конвенциональные данных концепты 6) Информация, 11) Данные как формы Социально7) знаковая информа- представления цифрокоммуникация и 8) информацион- вых данных в соц.ционная среда ные объекты комм. среде 9) Три категории ко10) Цифровые Цифровая среда дов (концептов, их данные форм и денотатов) Рисунок 2. Термины для описания семиотических моделей и их распределение по трем средам третьего измерения креативного пространства – знаковая информация - результат процесса представления концептов человеком в плане выражения некоторой знаковой системы в любой отчужденной форме, которая является сенсорно воспринимаемой другими участниками коммуникаций и содержательно интерпретируется ими в рамках этой знаковой системы (социально-коммуникационная среда);

– коды - компьютерные эквиваленты двоичных цифр (или их последовательностей), которые могут представлять собой в цифровой среде намагничен- 21 - ность или ее отсутствие, наличие электрического тока или его отсутствие, способность к отражению света или ее отсутствие; в интересах описания моделей выделяются три категории кодов: коды первой категории для концептов, коды второй категории для имен и коды третьей категории для состояний денотатов индикаторов (цифровая среда);

– цифровые данные - компьютерные эквиваленты двоичных цифр, которые в описании семиотических моделей не соотнесены в явном виде с тремя категориями кодов (цифровая среда);

– данные - формы представления цифровых данных в социальнокоммуникационной среде (социально-коммуникационная среда).

Рисунок 2 содержит 12 терминов11, пронумерованных против часовой стрелки. Эти термины распределены по шести прямоугольникам. В качестве критериев для их распределения использовались средовой принцип, предложенный К.К Колиным, определение сферы незнания, предложенное В.Л. Макаровым и Г.Б. Клейнером, разграничение между знаковой информации и данными по источнику их генерации, предложенное Ю.И. Шемакиным, и разграничение личностных, коллективных и общепринятых знаний, предложенное Вежбицки и Накамори. На основе перечисленных критериев в диссертации сформулированы следующие пять положений, которые позиционируются как исходные данные для разработки семиотических моделей.

Положение 1. Согласно средовому принципу 12 терминов разделены на три группы в зависимости от природы обозначаемых ими сущностей: ментальной, социальной или цифровой.

Кроме трех сред, при построении семиотических моделей в диссертации рассматривается также сфера материальных объектов и явлений в тех случаях, когда речь идет о денотатах материальной природы.

Положение 2. В диссертации рассматриваются денотаты цифровой, материальной и социально-коммуникационной природы. Денотатами цифровой природы в семиотических моделях компьютерного представления экспертных знаний являются совокупности компьютерных программ вычисления значений индикаторов, данных, используемых этими программами, и вычисленных значений индикаторов.

Положение 3. Перечисленные термины семиотических моделей разделены на два класса. Первый класс терминов на рисунке 2 обозначен прямоугольниками с белым фоном (слева), второй класс – серым фоном (справа). Разделение терминов на уровне ментальной среды основано на определение сферы незнания.

Разделение терминов на уровне социально-коммуникационной среды основано на идее разграничения знаковой информации и данных по источнику их генерации.

Положение 4. Категоризация кодов цифровой среды позволяет в семиотических моделях разделить коды концептов, имен и состояний денотатов индикаторов.

Словосочетание «знаковая информация» является неисчисляемым, поэтому для описания моделей в диссертации также используется понятие «информационные объекты» как исчисляемый аналог понятия знаковой информации.

- 22 Положение 5. Для определения числовых значений семантических кодов концептов, информационных кодов имен индикаторов и объектных кодов состояний денотатов в диссертации используются, соответственно, уникальные семантические, информационные и объектные идентификаторы дескрипторов проективного словаря лингвистического обеспечения. Дескрипторы строятся экспертами в процессе разработки ими новых индикаторов.

Используя пять перечисленных положений, в диссертации определена стационарная семиотическая модель компьютерного кодирования экспертных знаний.

Для построения модели кодирования экспертных знаний о стабильных индикаторах используются три среды: ментальная, социально-коммуникационная и цифровая среды12, так как денотат индикатора принадлежит цифровой среде.

Определение 1 (для кодирования экспертных знаний о стабильных индикаторах). Стационарной семиотической моделью компьютерного кодирования в системе информационного мониторинга стабильного индикатора, включая его концепт, имя и денотат, которые не изменяются во времени, называется треугольник Фреге этого индикатора, трем вершинам которого назначены семантический код для концепта, информационный код для его имени и объектный код для денотата индикатора13.

Отметим, что в этом и последующих двух определениях говорится о денотатах, а не о состояниях денотатов, так как стационарная модель применима только для случая неизменяемых денотатов.

В диссертации рассматривается также задача кодирования экспертных знаний о трудностях перевода, в которой используются те же три среды:

ментальная, социально-коммуникационная и цифровая среды, так как денотат трудности перевода, представляющий собой пару фрагментов параллельных текстов на русском и французском языках, принадлежит социальнокоммуникационной среде.

Определение 2 (для кодирования экспертных знаний о трудностях перевода).

Стационарной семиотической моделью компьютерного кодирования стабильной трудности перевода, включая ее денотат, концепт и название, которые не изменяются во времени, называется треугольник Фреге трудности перевода, трем вершинам которого назначены семантический код для концепта, информационный код для названия и объектный код для денотата трудности перевода.

Определение 3 (обобщенное, которое не зависит от предметной области).

Стационарной семиотической моделью компьютерного кодирования концепта как значения знака, информационного объекта как формы этого знака и денотата знака, которые не изменяются во времени, называется семиотический Если в треугольнике Фреге вершина денотата является материальным объектом или явлением, то в диссертации рассматривается более общий случай, включающий также материальную сферу объектов и явлений.

В предметной области мониторинга Определение 1 для индикаторов с неизменяемыми денотатами, является вспомогательным. Это определение понадобится далее для построения нестационарной модели для случая индикаторов с изменяемыми денотатами.

- 23 - треугольник Фреге этого знака, для которого построен дескриптор и трем вершинам которого (значению знака, форме знака и денотату) назначены, соответственно, семантический, информационный и объектный коды (т.е. три компьютерных кода первой, второй и третьей категорий - см. Рисунок 3):

Сфера материальных объектов и явлений Денотат (как материальный объект или явление) Значение Ментальная знака среда (концепт) Знак Знак Форма СемоСемознака Социалькод код но-коммуникационная среда ФорФормокод мокод Код катег. Цифровая Код Код среда катег. 1 катег. Рисунок 3. Семиотический треугольник Фреге и коды трех его вершин - код первой категории для концепта как значения знака, который является семантическим идентификатором дескриптора и составной частью семокода, - код второй категории для информационного объекта как формы знака, который является информационным идентификатором дескриптора и составной частью формокода, - код третьей категории для денотата знака, который является объектным идентификатором дескриптора (на рисунке 3 показан денотат, который относится к сфере материальных объектов и явлений).

Стационарная модель основана на семиотическом треугольнике Фреге, стороны которого, обозначенные на рисунке 3 полужирными отрезками, соединяют три вершины этого треугольника: концепт как значение знака, соответствующий ему денотат и информационный объект как форму этого знака.

Сочетание трех компьютерных кодов трех разных категорий для трех вершин любого треугольника Фреге предлагается называть «цифровым семиотическим - 24 треугольником» (три его стороны изображены на рисунке 3 двойными точечными отрезками, которые соединяют три компьютерных кода цифровой среды).

Принципиальная новизна стационарной семиотической модели компьютерного кодирования заключается в том, что она отображает треугольник Фреге, вершины которого имеют разную природу (ментальную, социальнокоммуникационную, цифровую или материальную), на цифровой семиотический треугольник, принадлежащий полностью цифровой среде.

Построение нестационарной семиотической модели компьютерного представления знаний об индикаторах, формируемых экспертами, основано на стационарной модели. В нестационарной модели фиксируются этапы формирования новых индикаторов, включая регистрацию изменений их концептов, имен и состояний изменяемых денотатов индикаторов с помощью кодов трех категорий.

В диссертации сначала строится множество точек, которое названо «пространством Фреге». Основная цель построения пространства Фреге заключается в том, чтобы представить в числовом виде этапы формирования новых индикаторов, используя последовательности семантических, информационных и объектных компьютерных кодов.

Формирование индикаторов, включая концептуализацию их денотатов, будем фиксировать в последовательные моменты времени, которые обозначим как {ti, i = 1, 2,...}, где ti – дискретный момент времени завершения i-го этапа концептуализации и описания в виде дескрипторов семиотических треугольников Фреге для новых индикаторов.

При этом за t1 принимается тот момент времени, когда эксперты начали описывать процесс формирования новых индикаторов в виде дескрипторов лингвистического обеспечения системы информационного мониторинга.

Предполагается, что в моменты времени {ti, i = 1, 2,...}, в процессе формирования новых индикаторов, концептуализации их денотатов и описания экспертами их семиотических треугольников Фреге, система информационного мониторинга генерирует цифровые семиотические треугольники, соответствующие треугольникам Фреге. При этом в каждый момент времени ti может быть сгенерировано одновременно несколько цифровых семиотических треугольников с использованием уникальных идентификаторов дескрипторов, если эксперты фиксируют в словаре в этот момент времени состояние разработки нескольких новых индикаторов.

Пространство Фреге (для регистрации экспертами в системах информационного мониторинга процесса формирования новых индикаторов) определим как четырехмерное пространство действительных чисел R2, в котором задано множество точек {(ti, ni,j, mi,j, ki,j), где j = 1,..., Si, Si – число индикаторов, создание (изменение) и, возможно, интерпретация состояний денотатов которых регистрировались в момент времени ti, i = 1, 2,...}, где:

- ti – момент времени завершения i-го этапа формирования индикаторов экспертами, а также генерации кодов трех категорий, фиксирующих состояния - 25 - денотатов, их концепты как результат интерпретации этих состояний и имена индикаторов в момент времени ti;

- ni,j – числовое представление компьютерного кода концепта j-го индикатора, формируемого в момент времени ti (ni,j=0, если концепта нет, т.е. у экспертов отсутствует понимание совокупности программы, данных и значений этого индикатора);

- mi,j – числовое представление компьютерного кода имени (названия) j-го индикатора, формируемого в момент времени ti (mi,j=0, если имя не было присвоено);

- ki,j – числовое представление компьютерного кода состояния денотата j-го индикатора, формируемого в момент времени ti, т.е. числовое представление кода объекта интерпретации как совокупности программы вычисления, обрабатываемых данных и значений этого индикатора.

Определение пространства Фреге в других предметных областях может быть сформулировано аналогично. В диссертации это показано на примере ЦСЗ о трудностях перевода.

Пространство Фреге (для формирования ЦСЗ о трудностях перевода) определим как четырехмерное пространство действительных чисел R2, в котором задано множество точек {(ti, ni,j, mi,j, ki,j), где j = 1,..., Si, Si – число пар фрагментов на русском и французском языках с трудностями перевода, формирование (изменение) и, возможно, интерпретация которых регистрировались в момент времени ti, i = 1, 2,...}, где:

- ti – момент времени завершения i-го этапа описания экспертами-лингвистами пар фрагментов с трудностями перевода, а также генерации кодов трех категорий, фиксирующих пары фрагментов, описанных на этом этапе, их концепты как результат смысловой интерпретации этих пар и имена соответствующих трудностей перевода в момент времени ti;

- ni,j – числовое представление компьютерного кода концепта трудности перевода j-ой пары фрагментов, описанной в момент времени ti (ni,j=0, если концепта нет, т.е. у экспертов-лингвистов отсутствует понимание трудности перевода этой пары фрагментов);

- mi,j – числовое представление компьютерного кода названия (имени) трудности перевода j-ой пары фрагментов (mi,j=0, если имени нет);

- ki,j – числовое представление компьютерного кода j-ой пары фрагментов на русском и французском языках, описанной в момент времени ti.

Пространство Фреге в общем случае определим как четырехмерное пространство действительных чисел R2, в котором задано множество точек {(ti, ni,j, mi,j, ki,j), где j = 1,..., Si, Si – число денотатов, создание (изменение) и, возможно, интерпретация состояний которых регистрировались экспертами в момент времени ti, i = 1, 2,...}, где:

- 26 - ti – момент времени завершения i-го этапа создания (изменения) денотатов, интерпретации состояний денотатов и генерации соответствующих цифровых семиотических треугольников, число которых равно Si в момент времени ti;

- ni,j – числовое представление компьютерного кода концепта, полученного в результате интерпретации состояния j-го денотата в момент времени ti (ni,j=0, если концепта нет, т.е. отсутствует понимание состояния этого денотата);

- mi,j – числовое представление компьютерного кода имени, выбранного в результате интерпретации состояния j-го денотата в момент времени ti, (mi,j=0, если имя не было выбрано);

- ki,j – числовое представление компьютерного кода состояния j-го денотата, созданного или измененного в момент времени ti.

Пространство Фреге включает ось времени и три оси с числовыми значениями кодов концептов, имен и состояний денотатов. В диссертации рассматривается случай, когда используется N видов кодов концептов (семантических кодов), M видов кодов имен (информационных кодов) и K видов кодов состояний денотатов (объектных кодов). Тогда размерность пространства Фреге равна N + M + K + 1. В автореферате рассматривается случай, когда N = M = K = 1.

Пространство Фреге не отображает связи компьютерных кодов с концептами, именами и состояниями денотатов. Однако в любой дискретный момент времени ti описание связей концепта, имени и состояния денотата с тремя компьютерными кодами фиксируется дескриптором, построенным в момент времени ti (согласно стационарной семиотической модели, примененной в момент времени ti).

Определение 4 (для кодирования экспертных знаний о формируемых индикаторах). Нестационарной семиотической моделью компьютерного представления концептов формируемых индикаторов, кодирования состояний их денотатов и имен в дискретные моменты времени {ti, i = 1, 2,...} называется совокупность следующих трех составляющих:

- множество семиотических треугольников Фреге {Ti,j, где j = 1,..., Si, Si – число индикаторов, формируемых или изменяемых в момент времени ti, i = 1, 2,...};

- множество соответствующих цифровых семиотических треугольников {Di,j, где j = 1,..., Si, Si – число индикаторов, i = 1, 2,...}, каждый из которых состоит из семантического, информационного и объектного кодов;

- множество точек {(ti, ni,j, mi,j, ki,j), где j = 1,..., Si, Si – число индикаторов, i = 1, 2,...}, полученных в результате отображения цифровых семиотических треугольников {Di,j} на пространство Фреге.

В этом определении множество точек {(ti, ni,j, mi,j, ki,j)} пространства Фреге является зависимым от лингвистического обеспечения систем информационного мониторинга, так как информационный, семантический и объектный компьютерные коды любого цифрового семиотического треугольника - 27 - представляют собой соответственно информационный, семантический и объектный идентификаторы дескриптора, соответствующего этому треугольнику.

В качестве примера опишем нестационарную семиотическую модель компьютерного представления ЦСЗ одного эксперта, целью которого является формирование нескольких вариантов индикатора распределения публикационной активности научного коллектива по возрастным группам (далее – ЦСЗ об индикаторах возрастного распределения публикаций или ЦСЗ об индикаторах ВРП).

Построим нестационарную семиотическую модель, концепты которой сформированы экспертом в два последовательных момента времени t1 и t2.

Пример охватывает только эти два момента времени, но это не значит, что в момент времени t2 формирование вариантов индикатора ВРП было завершено (см. Рисунок 4).

Предположим, что в момент времени t1 эксперт сформировал ЦСЗ (состояние ЦСЗ в момент времени t1 обозначено как К(t1)), состоящую из двух его личностных концептов, обозначенных как ConceptI(t1) и ConceptII(t1), полученных в результате анализа и смысловой интерпретации состояний двух цифровых денотатов, обозначенных как DenotatumI(t1) и DenotatumII(t1), т.е. в момент времени t1 эксперт создал два варианта индикатора ВРП.

Каждый из двух цифровых денотатов представляет собой совокупность программы вычисления значений соответствующего варианта индикатора ВРП, исходных данных, используемых этой программой, и вычисленных значений этого варианта индикатора ВРП. В результате анализа экспертом состояний двух таких совокупностей в момент времени t1 были сформированы два концепта:

ConceptI(t1) и ConceptII(t1).

Эти концепты сначала описываются как позиции (рубрики) этих вариантов индикатора в системе классификации, а затем в виде дефиниций двух вариантов индикатора ВРП. Их авторские имена (названия), которые придумал эксперт в момент времени t1, на экране монитора на рисунке 4 условно обозначены как два информационных объекта ObjectI(t1) и II(t1). Одновременно эксперт построил два дескриптора.

Затем в момент времени t2 этот же эксперт продолжил формирование ЦСЗ о вариантах индикатора ВРП и описал ее новое состояние, которое обозначено как К(t2), включающее три его личностных концепта. Эти концепты на рисунке обозначены как ConceptI(t2), II(t2) и III(t2).

Концепт ConceptI(t2) был сформирован на основе ConceptI(t1). Концепт II(t2) был сформирован на основе ConceptII(t1). Концепт третьего варианта индикатора, обозначенный как III(t2), был сформирован как новый. Концепты ConceptI(t2), II(t2) и III(t2) сформированы в процессе анализа и интерпретации состояний денотатов DenotatumI(t2), DenotatumII(t2) и DenotatumIII(t2).

Первые два свои концепта в момент времени t2 пользователь описал в виде дескрипторов как варианты концептов ConceptI(t1) и ConceptII(t1), а третий - 28 личностный концепт III(t2) он отметил в словаре как новый. Структурированное описание пользователем в момент времени t2 концептов ConceptI(t2), II(t2) и III(t2) представляет собой дефиницию каждого из этих трех вариантов индикатора. Их авторские имена (названия) на экране монитора на рисунке 4 условно обозначены как три информационных объекта ObjectI(t2), II(t2) и III(t2).

Дескрипторы в моменты времени t1 и t2 пользователь строил на основе своих личностных концептов, сформированных в процессе анализа и смысловой интерпретации состояния цифровых (а не материальных) денотатов в интересах формирования ЦСЗ о вариантах индикатора ВРП.

Рисунок 4. Два треугольника Фреге и два цифровых семиотических треугольника кодов в моменты времени t1 и t2 (арабскими цифрами в кодах обозначены их категории: «1» обозначает семантические коды, «2» – информационные, а «3» – объектные) Каждый из пяти концептов ConceptI(t1), ConceptII(t1), ConceptI(t2), II(t2), III(t2) с соответствующим ему состоянием денотата, в процессе анализа и интерпретации которого этот концепт был сформирован, а также именем (информационным объектом) как авторским названием индикатора, образуют один семиотический треугольник Фреге. Каждому семиотическому треугольнику Фреге соответствует один дескриптор, построенный экспертом.

- 29 - Рисунок 4 показывает только два треугольника Фреге из пяти (обозначены точечным контуром) в моменты времени t1, t2 и только шесть кодов из 15 (всего в этом примере эксперт сформировал 5 концептов, 5 имен, 5 состояний трех денотатов индикатора ВРП и, следовательно, автоматически было сгенерировано 15 кодов). Концепт ConceptI(t1) является вершиной левого треугольника Фреге, а концепт ConceptI(t2) – вершиной правого треугольника. Каждому из этих треугольников соответствует свой цифровой семиотический треугольник: один в момент времени t1 и один – в t2 (обозначены двойным точечным контуром).

Левый цифровой семиотический треугольник, сгенерированный в момент времени t1, включает три кода:

- семантический код Computer code1.I(t1) личностного концепта ConceptI(t1);

- информационный код Computer code2.I(t1) имени, т.е. информационного объекта ObjectI(t1);

- объектный код Computer code3.I(t1) состояния денотата DenotatumI(t1), в результате анализа и смысловой интерпретации которого был сформирован концепт ConceptI(t1).

Правый цифровой семиотический треугольник, сгенерированный в момент времени t2, также включает три кода:

- семантический код Computer code1.I(t2) личностного концепта ConceptI(t2);

- информационный код Computer code2.I(t2) имени, т.е. информационного объекта ObjectI(t2);

- объектный код Computer code3.I(t2) состояния денотата DenotatumI(t2), в результате анализа и смысловой интерпретации которого был сформирован концепт ConceptI(t2).

В пространстве Фреге (см. Рисунок 5) показаны все числовые значения компьютерных кодов (5 значений n1,1, n1,2, n2,1, n2,2, n2,3 числового представления семантических кодов концептов, 5 значений m1,1, m1,2, m2,1, m2,2, m2,3 информационных кодов имен и 5 значений k1,1, k1,2, k2,1, k2,2, k2,3 объектных кодов состояний денотатов).

Рисунок 4 иллюстрирует построение первых двух составляющих нестационарной семиотической модели компьютерного представления двух состояний ЦСЗ, обозначенных как К(t1) и К(t2):

- семейство семиотических треугольников Фреге для вариантов индикатора ВРП, описанных экспертом в моменты времени t1 и t2 в виде пяти дескрипторов (на рисунке показано два треугольника Фреге из пяти);

- соответствующие этим треугольникам Фреге цифровые семиотические треугольники, автоматически сгенерированные в процессе построения дескрипторов в моменты времени t1 и t2 (на рисунке показано два треугольника из пяти).

Для завершения построения нестационарной семиотической модели компьютерного представления двух состояний ЦСЗ зафиксируем в пространстве Фреге множество из пяти точек {(ti, ni,j, mi,j, ki,j), где j = 1,..., Si; i = 1, 2; S1 = 2, - 30 S2 = 3}. В этом примере число цифровых семиотических треугольников S1, сгенерированных в момент времени t1, равно 2, а число цифровых семиотических треугольников S2, сгенерированных в момент времени t2, равно 3.

Перечислим все числовые значения пяти точек {(ti, ni,j, mi,j, ki,j), где j = 1,..., Si; i = 1, 2; S1 = 2, S2 = 3} (см. Рисунок 5):

n (t1, n1,2, m1,2, k1,2) t(t1, n1,1, m1,1, k1,1) t(t2, n2,3, m2,3, k2,3) tk n1,(t2, n2,2, m2,2, k2,2) n1,k1,tk1,n2,k2,(t2, n2,1, m2,1, k2,1) tn2,2 k2,k2,n2,m m1,1 m1,2 m2,1m2,2 m2,Рисунок 5. Отображение цифровых треугольников на пространство Фреге - t1 и t2 – моменты времени описания экспертом пяти семиотических треугольников Фреге (двух в момент времени t1 и трех в момент времени t2);

- n1,1, n1,2, n2,1, n2,2, n2,3 – числовые значения семантических компьютерных кодов Computer code1.I(t1), Computer code1.II(t1), Computer code1.I(t2), Computer code1.II(t2) и Computer code1.III(t2);

- m1,1, m1,2, m2,1, m2,2, m2,3 – числовые значения информационных компьютерных кодов Computer code2.I(t1), Computer code2.II(t1), Computer code2.I(t2), Computer code2.II(t2) и Computer code2.III(t2);

- k1,1, k1,2, k2,1, k2,2, k2,3 – числовые значения объектных компьютерных кодов Computer code3.I(t1), Computer code3.II(t1), Computer code3.I(t2), Computer code3.II(t2) и Computer code3.III(t2).

- 31 - Рисунок 5 иллюстрирует отображение пяти цифровых семиотических треугольников на пространство Фреге, размерность которого равна 4, но ось времени в явном виде не показана. Так как отображаемое семейство включает цифровые семиотические треугольники, которые сгенерированы только в два момента времени t1 и t2, то эти моменты времени показаны внутри треугольников.

В этом примере в пространстве Фреге показаны три оси: семантическая ось числовых значений кодов n, информационная ось m и объектная ось k.

Пять точек {(ti, ni,j, mi,j, ki,j), где j = 1,..., Si; i = 1, 2; S1 = 2, S2 = 3}, полученных в результате отображения пяти цифровых семиотических треугольников на пространство Фреге, образуют третью составляющую нестационарной семиотической модели компьютерного представления знаний одного эксперта о вариантах индикатора ВРП в два момента времени t1 и t2.

В четвертой главе диссертации дано описание технических решений, основанных на стационарной и нестационарной семиотических моделях, а также результаты экспериментальной апробации компьютерного представления экспертных знаний. В этой главе предметом рассмотрения являются:

– полиструктурная динамическая классификация индикаторов мониторинга ПЦД, включающая:

• статический раздел классификации программно-ориентированных индикаторов целей, результатов, ресурсов, состоятельности, эффективности и результативности некоторой программы14;

• динамические структуры объектов мониторинга;

• сочетание статического раздела классификации и динамических структур объектов мониторинга;

– эксперименты по компьютерному представлению экспертных знаний (случай нескольких экспертов);

– архитектура лингвистического обеспечения систем информационного мониторинга, включающего проективный словарь;

– технология автоматизированного формирования аналитических отчетов по целевым программам в сфере науки, включающих программноориентированные индикаторы, разработанные экспертами.

Классификация индикаторов необходима экспертам в процессе разработки индикаторов для предварительного описания их смыслового содержания.

Выбирая ту или иную позицию (рубрику) в системе классификация, эксперт тем самым фиксирует свое предварительное понимание формируемого индикатора.

Поэтому от степени детальности рубрик применяемой классификации зависит потенциально возможная степень точности описания смысла, которую предоставляет эксперту эта система классификации.

В диссертации самые общие концепты рубрик верхнего (статического) уровня классификации индикаторов, определяются на основе анализа нормативно-правовых актов, регулирующих реализацию некоторой программы Цели, результаты, ресурсы, состоятельность, эффективность и результативность одной программы или ПЦД в целом в диссертации называются объектами мониторинга верхнего уровня.

- 32 или ПЦД в целом. Общие концепты рубрик образуют статический раздел классификации программно-ориентированных индикаторов целей, результатов, ресурсов, состоятельности, эффективности и результативности ПЦД.

В процессе диссертационного исследования рубрики нижних уровней классификации индикаторов были спроектированы как динамически формируемые. Это дало возможность, с одной стороны, учесть полиструктурность как отдельной программы, так и полиструктурность ПЦД в целом, а с другой стороны, адаптировать классификацию к изменениям каждой структуры во времени. Динамическая классификация индикаторов как компонент лингвистического обеспечения является ключевым техническим решением для компьютерного представления знаний об индикаторах, формируемых экспертами для мониторинга и оценивания ПЦД.

При реализации этого технического решения структурирование целей, результатов, ресурсов, состоятельности, эффективности и результативности на составляющие (по тем или иным разрезам) отражалось не в статическом разделе классификации индикаторов, а в описании соответствующих структурных разрезов анализируемой программы.

Так, в действующем прототипе Информационно-технологической системы мониторинга РАН, описание которого дано в приложении к диссертации, для мониторинга и оценивания Программы фундаментальных научных исследований РАН (далее - Программа ФНИ РАН) используются три ее структурных разреза:

• организационный разрез РАН как исполнителя Программы ФНИ РАН, • разрез по видам деятельности по Программе ФНИ РАН, • тематическое деление Программы ФНИ РАН на 88 направлений фундаментальных исследований.

Приведем пример с делением в 2009 году Программы ФНИ РАН на следующие шесть видов деятельности:

• программы фундаментальных исследований Президиума РАН;

• программы фундаментальных исследований Отделений РАН;

• программы фундаментальных исследований научных учреждений РАН (базовое финансирование научных учреждений);

• программы целевых расходов Президиума РАН;

• программа модернизации материально-технической базы научных учреждений РАН;

• исследования по новым направлениям, необходимость в которых возникала в течение 2009 года.

Отметим, что в рамках Программы ФНИ РАН в период 2008-2012гг. это деление по видам деятельности не является постоянным, и от года к году оно может изменяться. Кроме того, может быть изменено и общее число структурных разрезов Программы ФНИ РАН.

Поэтому в процессе разработки лингвистического обеспечения в статический раздел классификации индикаторов не были включены изменяемые во времени организационная, тематическая и другие структуры, но были разработаны средства динамической суперпозиции статического раздела классификации - 33 - индикаторов и выбранной экспертом организационной, тематической или иной структуры Программы ФНИ РАН.

Разработанное проектное решение по динамической классификации индикаторов дает возможность экспертам с одной стороны, учесть полиструктурность ПЦД, а с другой стороны, адаптировать классификацию к изменениям каждой структуры во времени. Рассмотренный подход к автоматической генерации полиструктурной динамической классификации был реализован в процессе разработки прототипа Информационно-технологической системы мониторинга РАН, описание которой дано в приложении к диссертации.

Кроме полиструктурной динамической классификации, в состав лингвистического обеспечения прототипа включено два словаря (см. Рисунок 6):

семантический словарь для используемых индикаторов и проективный словарь для отражения этапов формирования новых индикаторов экспертами.

Рассмотрим разработанную и реализованную архитектуру лингвистического обеспечения, включающего словари индикаторов, а также полиструктурную динамическую классификацию программно-ориентированных индикаторов.

Основной целью создания семантического словаря является обеспечение пользователей информацией в виде словарных статей об используемых индикаторах. Каждая статья включает следующие компоненты:

- дефиницию и название индикатора (см. Рисунок 6, на котором показаны названия двух индикаторов «X индикатор» и «Y индикатор» без дефиниций);

- примеры использования индикатора (на рисунке не показаны);

- параметры отбора информационных ресурсов, задаваемые при вычислении значений индикатора, например параметр отбора только тех статей, которые опубликованы в журналах из списка ВАК (обозначены как «{PXi}» и «{PYi}»);

- параметры алгоритма вычисления значений индикатора, например, параметр учета самоцитирования, от которого зависят значения индексов цитирования авторов публикаций (обозначены как «{RXi}» и «{RYi}»);

- ссылку на описание того алгоритма программы, который используется для вычисления значений индикатора (две ссылки условно обозначены в виде двух штриховых стрелок, направленных от словарных статей индикаторов «X» и «Y» к программному обеспечению);

- ссылки на те базы данных (хранилища), из которых осуществляется отбор информационных ресурсов, используемых при вычислении значений индикатора (обозначены в виде двух штриховых стрелок, направленных от словарных статей индикаторов «X индикатор» и «Y индикатор» к информационному обеспечению);

- ссылки на положения методических и нормативно-правовых документов (если такие существуют), имеющие отношение к вычисляемому индикатору (в виде еще двух штриховых стрелок, направленных к нормативнометодическому виду обеспечения, которое обозначено прямоугольником со словами «Нормативное обеспечение»).

Лингвистическое Система мониторинга обеспечение Семантичес Полиструккий словарь Проективный Нормативное турная динамическая словарь обеспечение - X индикатор классифи(для новых инди{PX i}, {RX i} кация индикаторов) … каторов - U индикатор Информа- Y индикатор ционное обес- {PUi (t1)} {RUi (t1)} {PY i}, {RY i} … печение - V индикатор {PVi (t1)} {RVi (t1)} Программное Нормативное Информац. Программное … обеспечение обеспечение обеспечение обеспечение - U индикатор (t1) (t1) (t1) {PUi (tn)} {RUi (tn)} Виды обеспечения … Виды обеспечения для проектиро- для вычисления и вания индикаторов - V индикатор использования ин … … … {PVi (tn)} {RVi (tn)} дикаторов Нормативное Информац. Программное … обеспечение обеспечение обеспечение (tn) (tn) (tn) Рисунок 6. Семантический и проективный словари лингвистического обеспечения - 34 - 35 Задачи, функции и применение семантического словаря в системах информационного мониторинга описаны в автореферате и кандидатской диссертации О.С. Кожуновой «Технология разработки семантического словаря системы информационного мониторинга», выполненной под руководством автора диссертационного исследования. Отметим, что в разработанном О.С. Кожуновой варианте семантического словаря пользователь имеет возможность задавать значения параметров {PXi} и {PYi} для вычисления значений индикатора, используя интерфейсное окно словарной статьи, и получать в этом же окне вычисленные значения индикатора в интерактивном режиме.

Основной целью создания проективного словаря является предоставление экспертам возможности описания процесса формирования ими новых индикаторов согласно разработанным семиотическим моделям в виде дескрипторов, включающих словарные статьи.

Каждый дескриптор проективного словаря отражает состояние одного индикатора (варианта индикатора) в момент времени завершения некоторой итерации (этапа) его формирования. Разработанный вариант архитектуры позволяет описать этапы процесса формирования индикаторов экспертами.

Рисунок 6 отражает два этапа разработки двух индикаторов, обозначенных буквами U и V: первый этап, который завершился в момент времени t1, и n-ый этап, который завершился в момент времени tn. Каждый дескриптор проективного словаря включает следующие компоненты:

- дефиницию и название индикатора (Рисунок 6 содержит названия двух индикаторов «U индикатор» и «V индикатор» для случая, когда названия индикаторов не меняются в процессе их разработки с первого по n-ый этапы);

- примеры использования формируемого индикатора (на рисунке не показаны);

- параметры отбора информационных ресурсов системы мониторинга, задаваемые при вычислении значений формируемого индикатора в моменты времени t1 и tn (наборы этих параметров условно обозначены как {PUi (t1)}, {PUi (tn)}, {PVi (t1)} и {PVi (tn)};

- параметры алгоритмов вычисления значений формируемого индикатора, задаваемые в моменты времени t1 и tn (наборы этих параметров условно обозначены как {RUi (t1)}, {RUi (tn)}, {RVi (t1)} и {RVi (tn)};

- ссылки на те базы данных (хранилища), из которых осуществляется отбор информационных ресурсов, используемых при вычислении значений формируемого индикатора (эти ссылки обозначены в виде четырех точечных стрелок, направленных от словарных статей индикаторов «U индикатор» и «V индикатор» в моменты времени t1 и tn к информационному обеспечению системы информационного мониторинга);

- ссылки на описание тех алгоритмов, которые используются для вычисления значений формируемого индикатора (также обозначены в виде четырех точечных стрелок);

- 36 - ссылки на положения методических и нормативно-правовых документов (если такие существуют), имеющие отношение к формируемому индикатору (в виде четырех точечных стрелок, направленных к двум прямоугольникам со словами «Нормативное обеспечение» в моменты времени t1 и tn).

В проективном словаре предусмотрена возможность изменения дефиниций и названий индикаторов, наборов параметров отбора информационных ресурсов, наборов параметров алгоритмов вычисления индикаторов. После завершения разработки и утверждения нового индикатора его описание переносится из проективного словаря в семантический.

Серия экспериментов по компьютерному представлению экспертных знаний о формируемых вариантах индикатора ВРП на основе разработанных семиотических моделей была проведена в процессе выполнения НИР «Разработка методов и принципов создания информационных технологий для оценивания результатов влияния фундаментальных исследований».

Эксперименты проводились с использованием прототипа Информационнотехнологической системы мониторинга РАН.

Прежде чем описать эксперименты, в рамках которых велась разработка вариантов индикатора ВРП, включая отображение этапов их формирования, отметим новый аспект решаемой проблемы, который проявился в процессе реализации проектных решений по созданию проективного словаря.

Этот аспект касается категоризации концептов. Реализация проектных решений показала необходимость введения еще одной категории – неактуальных концептов и соответствующих им дескрипторов проективного словаря (см табл. 1).

Категории Неактуальные Личностные Согласован- Конвенциоконцептов и (авторские) ные (коллек- нальные (нордескрипторов тивные) мативно ут вержденные) Концепты Неактуальные Личностные Согласован- КонвенЦСЗ концепты концепты ные циональные концепты концепты Дескрипторы Неактуальные Авторские Коллектив- Нормативнопроективного дескрипторы дескрипторы ные утвержденные словаря дескрипторы дескрипторы Таблица 1. Четыре категории концептов ЦСЗ и соответствующих им дескрипторов Поэтому была модифицирована идея Вежбицки и Накамори о разграничении личностных, коллективных и общепринятых знаний.

Дополнительно было введено понятие неактуальных концептов системы знаний, от которых на некотором этапе отказались все эксперты. Отметим, что в обобщенной модели формирования знаний Вежбицки и Накамори неактуальные знания не рассматриваются.

- 37 Опишем результаты серии экспериментов по компьютерному представлению знаний нескольких экспертов о формируемых вариантах индикатора ВРП и построению функции, позволяющей вычислять степень согласованности между экспертами формируемых ими вариантов.

Одним из итогов серии экспериментов является вывод о том, что область определения функции степени согласованности должна иметь на одно измерение больше, чем пространство Фреге. Это дополнительное измерение необходимо для описания эволюции степени согласованности формируемых вариантов индикатора ВРП. В проведенной серии экспериментов использовалось четырехмерное пространство Фреге. Поэтому, область определения построенной функции степени согласованности имела пять измерений.

Как отмечалось ранее, основная цель построения пространства Фреге заключается в том, чтобы эволюцию во времени концептов ЦСЗ об индикаторах представить в виде последовательностей семантических кодов, а эволюцию соответствующих имен индикаторов и их денотатов – в виде информационных и объектных компьютерных кодов, соответственно. Эти коды генерируются программно в процессе описания экспертами-разработчиками индикаторов семиотических треугольников Фреге и соответствующих им дескрипторов проективного словаря в дискретные моменты времени {ti, i = 1, 2,...}.

С целью построения функции степени согласованности, сначала были определены границы между четырьмя категориями концептов и между соответствующими им категориями дескрипторов (неактуальный, авторский, коллективный и нормативно-утвержденный).

Было определено множество целочисленных параметров {Lpi, j 0, где j = 1,..., Si, i = 1, 2,..., p =0, 1, 2,...}, значение каждого из которых равно числу экспертов, согласованно интерпретирующих в момент времени ti+p три вершины (концепт, имя и состояние денотата) семиотического треугольника Ti,j, сгенерированного в момент ti.

Было задано число NC как граница между категориями коллективных и нормативно-утвержденных дескрипторов. В серии экспериментов дескриптор считался нормативно-утвержденным, если число экспертов, согласованно интерпретирующих этот дескриптор, больше или равно NC.

Понятие неактуального дескриптора было определено следующим образом: если в момент времени ti все эксперты, участвующие в формировании ЦСЗ, приняли решение о неперспективности некоторого дескриптора, то в момент времени ti он помечался как неактуальный.

Целочисленный параметр Lpi, j равен 1 для всех тех семиотических треугольников, которым в момент времени ti+p соответствует авторский дескриптор с личностным концептом. Если в некоторый момент времени эксперт-автор этого дескриптора и все остальные эксперты, участвующие в формировании ЦСЗ, отмечали его как неактуальный для процесса построения - 38 ЦСЗ, то тогда целочисленный параметр Lpi, j в этот момент времени становился равен нулю.

В процессе проведения экспериментов функция степени согласованности Fcon была определена следующим образом: для любого i при условии, что Si 0, Fcon(i, p, ni,j, mi,j, ki,j) = 0 – если дескриптор с кодом ni,j является неактуальным в момент ti+p;

1 – если дескриптор с кодом ni,j является авторским в момент ti+p;

Lpi, j – если дескриптор с кодом ni,j является коллективным, а число экспертов, его согласовавших в момент ti+p, меньше NC;

= NC – если дескриптор с кодом ni,j является нормативно-утвержденным в момент ti+p, т.е. число экспертов, его согласовавших в момент ti+p, равно или больше NC, где p =0, 1, 2,... является пятым измерением области определения Fcon, кроме четырех измерений i, n, m, и k (пятое измерение было введено для отражения изменения степени согласованности дескрипторов индикаторов, начиная с момента создания каждого из этих дескрипторов).

Значения определенной функции Fcon не зависят от семантических, информационных и объектных компьютерных кодов ni,j, mi,j, и ki,j, соответственно, а зависят только от хода процесса согласования экспертами смысла дескрипторов вариантов индикатора. В проведенной серии экспериментов согласование экспертами смысла предполагало согласование экспертами всех атрибутов и связей соответствующего дескриптора.

Серия экспериментов включала пять этапов (итераций) разработки вариантов индикатора ВРП группой из пяти экспертов (обозначим их как А, Б, В, Г и Д).

Первая итерация. Эксперт А создал первый вариант индикатора ВРП при следующих условиях:

- для вычисления значений этого варианта индикатора использовались статьи сотрудников одного из подразделений ИПИ РАН, напечатанные в любых журналах и сборниках в 2009 году и введенных в базу данных статей прототипа Информационно-технологической системы мониторинга РАН;

- возрастная группа15 каждого соавтора статьи получала за одну статью 1 балл;

- отсутствовала нормализация относительно численности возрастных групп.

В экспериментах учитывались 14 возрастных групп: 20 – 24, 25 – 29 и далее до группы 85 – 89 лет.

- 39 В это же время (на этой же итерации) эксперты Б и В создали совместно и В это же время (на этой же итерации) эксперты Б и В создали совместно и согласованно второй вариант индикатора ВРП при тех же первом и третьем согласованно второй вариант индикатора ВРП при тех же первом и третьем условиях, но второе из трех вышеперечисленных условий отличалось:

условиях, но второе из трех вышеперечисленных условий отличалось:

возрастная группа каждого соавтора получала 1/N балла за статью, у которой N возрастная группа каждого соавтора получала 1/N балла за статью, у которой N соавторов.

соавторов.

На первой итерации порождается два семиотических треугольника На первой итерации порождается два семиотических треугольника (следовательно, Si =2 для i=1), для них строятся два дескриптора проективного (следовательно, Si =2 для i=1), для них строятся два дескриптора проективного словаря и вычисляются два значения Fcon в точке (i=1, p=0):

словаря и вычисляются два значения Fcon в точке (i=1, p=0):

- первое значение Fcon равно 1, так как дескриптор эксперта А на пер- первое значение Fcon равно 1, так как дескриптор эксперта А на первой итерации является авторским; это значение обозначено тревой итерации является авторским; это значение обозначено треугольником с вершиной ниже его основания (см. Рисунок 7 и угольником с вершиной ниже его основания (см. Рисунок 7 и Рисунок 8; на них все значения Fcon для вариантов этого дескриптоРисунок 8; на них все значения Fcon для вариантов этого дескриптора, порожденных на последующих итерациях, обозначены таким же ра, порожденных на последующих итерациях, обозначены таким же треугольником);

треугольником);

Эксперты Fcon Fcon Б, Г и Д Эксперты Эксперты Эксперты Эксперты Б и В Б и В А и В А и В А и В Эксперт А Эксперт Б Эксперт Б Эксперт Б Эксперт А t t t1 t4 tt2 tРисунок 7. Значения Fcon на пяти итерациях в следующих точках ti+p:

Рисунок 7. Значения Fcon на пяти итерациях в следующих точках ti+p:

(i=1, p=0), (i=1, p=1), (i=3, p=0), (i=4, p=0) и (i=4, p=1) (i=1, p=0), (i=1, p=1), (i=3, p=0), (i=4, p=0) и (i=4, p=1) (сплошные стрелки соединяют те пары значений функции, (сплошные стрелки соединяют те пары значений функции, которым соответствуют идентичные концепты;

которым соответствуют идентичные концепты;

точечными стрелками обозначены отношения наследования).

точечными стрелками обозначены отношения наследования).

Fcon p i 1 2 3 Рисунок 8. Проекция функции Fcon(i, p, ni,j, mi,j, ki,j), область определения которой имеет пять измерений, на трехмерное пространство с осями i, p и F для первых пяти итераций разработки вариантов индикатора ВРП (20 значений функции условно отмечены треугольниками) - 40 - 41 - второе значение равно 2, так как дескриптор экспертов Б и В на первой итерации является коллективным; это значение обозначено треугольником с вершиной выше его основания (см. Рисунок 7 и Рисунок 8; на них все значения Fcon для вариантов этого дескриптора, порожденных на последующих итерациях, обозначены таким же треугольником).

Вторая итерация. На второй итерации эксперт В решил изменить свою точку зрения и принять точку зрения эксперта А. Иначе говоря, эксперт В на второй итерации отказывает в согласовании второму варианту индикатора ВРП, так как считает правильным добавлять всем соавторам по одному баллу, и согласовывает первый вариант индикатора ВРП. Первый вариант, сгенерированный экспертом А становится коллективным, а второй - авторским.

Эти варианты индикатора ВРП идентичны вариантам первой итерации, что обозначено серым цветом и двумя пересекающимися сплошными стрелками (см. Рисунок 7).

Так как имеющиеся концепты, имена и состояния денотатов на второй итерации не изменялись, а новые не формировались, то новые дескрипторы не строились и число порожденных семиотических треугольников на второй итерации равно нулю (Si = 0 для i=2), значения функции Fcon не определены в точке (i=2, p=0) при S2 = 0, но два значения этой функции определены в точке (i=1, p=1), так как S1 = 2. Эти значения равны 2 и 1 (см. Рисунок 7 и Рисунок 8).

Третья итерация. Эксперты А, Б и В одновременно принимают решения учесть численности возрастных групп при вычислении значений своих вариантов индикатора ВРП, что находит отражение в изменении соответствующих алгоритмов программ вычисления их значений с целью нормализации. При этом на третьей итерации эксперты связывают новые порожденные концепты с концептами, созданными на первой итерации и изменившими степень согласованности на второй итерации, отношениями наследования, что обозначено двумя точечными стрелками (см. Рисунок 7). Так как формируются два новых концепта, то на третьей итерации для них строятся два дескриптора проективного словаря (Si = 2 для i=3). При этом вычисляются четыре значения функции Fcon: по два значения в точках (i=3, p=0) и (i=1, p=2) (см. Рисунок 7 и Рисунок 8).

Четвертая итерация. Эксперты А, Б и В одновременно приняли решения учитывать только те статьи, которые опубликованы в журналах из перечня ВАК. На этой итерации эксперты связывают новые порожденные концепты с концептами, созданными на третьей итерации, отношениями наследования, что обозначено еще двумя точечными стрелками. Так как формируются два новых концепта, то на четвертой итерации для них строятся два дескриптора проективного словаря (Si = 2 для i=4). При этом вычисляются шесть значений функции Fcon: по два значения в точках (i=4, p=0), (i=3, p=1) и (i=1, p=3).

Пятая итерация. На этой итерации разработки эксперты оставляют неизменными концепты двух вариантов индикатора ВРП, учитывающие - 42 численность групп и выбранный перечень журналов ВАК, но точки зрения экспертов изменяются следующим образом.

Эксперт В отказывается от варианта эксперта А. Следовательно, этот концепт становится личностным концептом эксперта А. Другой вариант приобретает двух новых сторонников - экспертов Г и Д, что приводит к изменению степени его согласованности. У этих двух концептов изменилась только степень согласованности, но они остались идентичными концептам, сгенерированным на четвертой итерации, что условно обозначено двумя серыми треугольниками на пятой итерации и двумя пересекающимися сплошными стрелками между четвертой и пятой итерациями (см. Рисунок 7).

Так как новые концепты не формировались, а существующие не изменялись, то на пятой итерации новые дескрипторы не строились и число порожденных семиотических треугольников равно нулю (Si = 0 для i=5).

Значение функции Fcon не определено для пары (i=5, p=0). При этом вычисляются шесть значений функции Fcon в других точках: по два значения в точках (i=4, p=1), (i=3, p=2) и (i=1, p=4) (см. Рисунок 7).

Все значения функции Fcon для новых или измененных концептов обозначены черными треугольниками, а им идентичные – серыми треугольниками (у этих концептов изменилась только степень их согласованности экспертами, формирующими ЦСЗ).

Первым пяти итерациям разработки вариантов индикатора ВРП соответствуют 20 значений функции степени согласованности Fcon, условно обозначенные черными и серыми треугольниками (см. Рисунок 8).

Рисунок 7, в отличие от рисунка 8, содержит не все 20 значений функции степени согласованности Fcon, а только те ее 10 значений, соответствующие дескрипторы и концепты которых либо связаны отношениями наследования, либо изменили степень согласованности.

Рассмотренная серия экспериментов по компьютерному представлению экспертных знаний и вычислению значений функции степени согласованности Fcon иллюстрирует потенциал использования пространства Фреге для построения областей определения функций, которые планируется использовать в будущем в процессе решения проблем оценивания релевантности и направляемого развития ЦСЗ.

Проведенные эксперименты позволили сделать следующий вывод:

разработка стационарной и нестационарной семиотических моделей компьютерного представления экспертных знаний, построение полиструктурной динамической классификации индикаторов и включение проективного словаря в состав лингвистического обеспечения системы информационного мониторинга дают возможность группе экспертов разрабатывать совместно новые алгоритмы для вычисления значений программно-ориентированных индикаторов, фиксируя в системе все этапы формирования их смыслового содержания, а также различия в трактовке и степень согласованности их понимания между экспертами.

- 43 Разработанные технические решения были использованы при создании действующего прототипа Информационно-технологической системы мониторинга РАН, описание которого дано в приложении к диссертации, и технологии автоматизированного формирования аналитических отчетов по целевым программам в сфере науки, включающих новые программноориентированные индикаторы, разработанные экспертами, что подтверждается актами об использовании результатов работы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ В процессе диссертационного исследования получены следующие результаты, выносимые на защиту:

1. Концептуальные основы компьютерного представления экспертных знаний для мониторинга программно-целевой деятельности, которые включают:

- введение средового измерения в креативное пространство Вежбицки и Накамори, - определение объекта интерпретации как состояния денотата, которое является неизменным в процессе интерпретации, - определение новых структурных элементов знаний, формируемых экспертами на каждом из этапов концептуализации, - введение в креативное пространство Вежбицки и Накамори оси времени, - введение в креативное пространство Вежбицки и Накамори двух уровней для процесса перехода от индивидуальных (личностных) невыраженных знаний к выраженным знаниям, - использование трех модальностей форм выражения структурных элементов знаний (вербальной, образной и вербально-образной), - использование процессов концептуализации, определенных как сочетание двух итерационных процессов (изменение денотатов и интерпретация их состояний), - определение на каждом этапе концептуализации четырех возможных вариантов завершения процесса интерпретации, - определение процесса перехода от индивидуальных выраженных знаний к коллективным и его добавление в креативное пространство Вежбицки и Накамори, - описание системы терминов, включающей новые понятия формокода и семокода.

2. Стационарная и нестационарная модели компьютерного представления знаний экспертов о программно-ориентированных индикаторах для мониторинга программно-целевой деятельности (нестационарная модель описывает процесс разработки индикаторов в динамике их формирования).

3. Определение пространства Фреге для отображения динамики процесса формирования экспертных знаний о программно-ориентированных индикаторах, которое имеет ось времени и несколько осей компьютерных кодов для объектов интерпретации, соответствующих структурных элементов формируемых экспертных знаний и их названий (имен).

- 44 4. Технические решения по разработке архитектуры лингвистического обеспечения систем информационного мониторинга для компьютерного представления экспертных знаний о программно-ориентированных индикаторах, которое включает полиструктурную динамическую классификацию индикаторов и проективный словарь программноориентированных индикаторов, формируемых экспертами.

5. Технические решения по совершенствованию технологии автоматизированного формирования аналитических отчетов по целевым программам в сфере науки, включающих программно-ориентированные индикаторы, разработанные экспертами.

ЗАКЛЮЧЕНИЕ В соответствии с целью диссертационного исследования разработаны концептуальные основы и модели компьютерного представления экспертных знаний, формируемых для мониторинга и индикаторного оценивания программно-целевой деятельности, а также отображения динамики формирования личностных и коллективных знаний экспертов.

Для достижения поставленной цели автором были решены следующие задачи.

1. Сформулирована проблема компьютерного представления знаний, формируемых экспертами для мониторинга и оценивания программно-целевой деятельности.

2. Разработаны концептуальные основы компьютерного представления экспертных знаний об индикаторах в динамике их формирования, включая описание используемой системы терминов.

3. Разработаны модели компьютерного представления экспертных знаний, которые описывают процесс формирования программно-ориентированных индикаторов и фиксируют изменения формируемых знаний об индикаторах во времени.

4. На основе семиотических моделей компьютерного представления экспертных знаний в динамике их формирования разработана архитектура лингвистического обеспечения систем информационного мониторинга и индикаторного оценивания программно-целевой деятельности.

5. С целью апробации результатов диссертационного исследования проведена серия экспериментов по компьютерному представлению экспертных знаний о вариантах индикатора возрастного распределения публикаций и построению функции, позволяющей вычислять степень согласованности вариантов индикатора, формируемых экспертами.

- 45 ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ (14 работ с номерами 4-8, 12-14, 22-25, 27 и 28 опубликованы в журналах из Перечня ВАК) Монографии 1. Зацман И.М. Концептуальный поиск и качество информации. – М.: Наука, 2003. – 271 с.

Книги и брошюры 2. Клейнер Г.Б., Голиченко О.Г., Зацман И.М. Основные принципы разработки системы мониторинга функционирования исследовательских организаций. - М.: ЦЭМИ РАН, 2007. – 61 с. (личный вклад диссертанта:

описание основных функций систем информационного мониторинга и оценивания программно-целевой деятельности).

3. Зацман И.М., Веревкин Г.Ф., Шубников С.К. Моделирование систем мониторинга. - М.: ИПИ РАН, 2008. – 115 с. (личный вклад диссертанта:

описание методологических аспектов моделирования предметной области мониторинга и систем информационного мониторинга).

Статьи в отечественных журналах 4. Зацман И.М. Электронные библиотеки научных документов в Интернет:

структуризация, формальное описание и поиск невербальной информации // Научно-техническая информация. 1998. № 11. - С. 12–18 (Серия 2.

Информационные процессы и системы).

5. Зацман И.М. Логико-семантические модели полнотекстовых научных документов // Научно-техническая информация. 1999. No 5. - С. 13 – (Серия 2 "Информационные процессы и системы").

6. Зацман И.М. Семантическое кодирование и разметка геологогеографических документов в политематических электронных библиотеках // Информационные технологии. 2000. N 11. - С. 2-11.

7. Зацман И.М. Вербально-образное представление знаний в электронных библиотеках (Часть I) // Научно-техническая информация. 2001. No 10. - С. 20-30 (Серия 2 "Информационные процессы и системы").

8. Зацман И.М. Вербально-образное представление знаний в электронных библиотеках (Часть II) // Научно-техническая информация. 2001. No 12. - С. 10-17 (Серия 2 "Информационные процессы и системы").

9. Зацман И.М. Типология знаков и семиотика поиска // Системы и средства информатики. Вып. 11. - М.: Наука, 2001.- С. 113-131.

10. Зацман И.М. Семиотическая аппроксимация и вербально-образное представление знаний в электронных библиотеках // Системы и средства информатики. Вып. 11. - М.: Наука, 2001.- С. 149-167.

11. Соколов И.А., Босов А.В., Зацман И.М., Иванов А.В., Чавтараев Р.Б. О концептуальных основах разработки Единой информационной системы РАН // Системы и средства информатики. Вып. 12. - М.: Наука, 2002.- С. 29-- 46 (личный вклад диссертанта: обоснование необходимости разработки системы статистических и информационно-аналитических индикаторов для Единой информационной системы РАН).

12. Зацман И.М. Семиотические основания и элементарные технологии информатики // Информационные технологии. 2005. N 7. - С. 18-31.

13. Зацман И.М. Семиотические основания гуманитарной информатики // Открытое образование. 2005. № 2. – С. 64-68.

14. Зацман И.М. Терминологический анализ нормативно-правового обеспечения создания систем мониторинга и оценки результативности в сфере науки // Экономическая наука современной России. 2005. № 4. - С.

114-129.

15. Зацман И.М. Информационные ресурсы для систем мониторинга в сфере науки // Системы и средства информатики. Вып. 15.- М.: Наука, 2005.- С.

288-318.

16. Зацман И.М., Веревкин Г.Ф. Информационный мониторинг сферы науки в задачах программно-целевого управления // Системы и средства информатики. Вып. 16. - М.: Наука, 2006. - С. 164-189 (личный вклад диссертанта: обоснование необходимости расширения спектра индикаторов для мониторинга и оценивания программно-целевой деятельности).

17. Зацман И.М., Веревкин Г.Ф., Дрынова И.В., Курчавова О.А., Ларин Н.В., Норекян Т.П. Моделирование систем информационного мониторинга как проблема информатики // Системы и средства информатики: Спец. вып.

Научно-методологические проблемы информатики - М.: Изд-во ИПИ РАН, 2006. - С. 112-139 (личный вклад диссертанта: концептуальные основы моделирования систем информационного мониторинга).

18. Зацман И.М., Кожунова О.С. Предпосылки конвергенции компьютерной и информационной наук // Системы и средства информатики: Спец. вып.

Научно-методологические проблемы информатики - М.: Изд-во ИПИ РАН, 2006. - С. 257-278 (личный вклад диссертанта: сопоставление теоретических основ представления знаний в компьютерной и информационной науках).

19. Зацман И.М., Курчавова О.А. Информационно-коммуникационные технологии долговременного применения и термины для их описания // Системы и средства информатики. Вып. 17. - М.: Наука, 2007. - С. 142-1(личный вклад диссертанта: описание системы терминов с их разделением на три группы в зависимости от природы обозначаемых ими сущностей:

ментальной, социальной и цифровой).

20. Зацман И.М., Кожунова О.С. Семантический словарь системы информационного мониторинга в сфере науки: задачи и функции. // Системы и средства информатики. Вып. 17.- М.: Наука, 2007.- С. 124-141.

(личный вклад диссертанта: описание концептуальных подходов к классификации программно-ориентированных индикаторов).

- 47 21. Зацман И.М., Курчавова О.А., Галина И.В. Информационные ресурсы и индикаторы для оценки инновационного потенциала направлений научных исследований // Системы и средства информатики. Вып. 18 (доп.). - М.:

Наука, 2008. - С. 159-175 (личный вклад диссертанта: разработка методики обработки полнотекстовых информационных ресурсов для индикаторного оценивания инновационного потенциала направлений научных исследований).

22. Зацман И.М., Косарик В.В., Курчавова О.А. Задачи представления личностных и коллективных концептов в цифровой среде // Информатика и ее применение. 2008. Том 2. Вып. 3. – С. 54-69 (личный вклад диссертанта:

описание концептуальных основ компьютерного представления экспертных знаний для мониторинга программно-целевой деятельности, включая описание используемой системы терминов).

23. Зацман И.М., Кожунова О.С. Предпосылки и факторы конвергенции информационной и компьютерной наук // Информатика и ее применение.

2008. Том 2. Вып. 1. – С. 77-97 (личный вклад диссертанта: сопоставление теоретических основ представления знаний в компьютерной и информационной науках).

24. Зацман И.М. Семиотическая модель взаимосвязей концептов, информационных объектов и компьютерных кодов // Информатика и ее применение. 2009. Т. 3. Вып. 2. - С. 65–81.

25. Зацман И.М. Нестационарная семиотическая модель компьютерного кодирования концептов, информационных объектов и денотатов // Информатика и ее применение. 2009. Том 3. Вып. 4. - С. 87–101.

26. Зацман И.М. Категоризация результатов и индикаторов программ научных исследований в информационных системах мониторинга // Системы и средства информатики. Вып. 19 (доп.). - М.: ИПИ РАН, 2009. - С.

199-217.

27. Buntman N., Minel J.-L., Le Pesant D., Zatsman I. Typology and Computer Modelling of Translation Difficulties // Информатика и ее применения. 2010.

Т. 4. Вып. 3. - С. 77–83 (личный вклад диссертанта: описание концептуальных основ компьютерного представления экспертных лингвистических знаний для создание корпусно-ориентированной типологии трудностей перевода с русского языка на французский).

28. Архипова М.Ю., Зацман И.М., Шульга С.Ю. Индикаторы патентной активности в сфере информационно-коммуникационных технологий и методика их вычисления // Экономика, статистика и информатика.

Вестник УМО. 2010. №4. - С. 93-104 (личный вклад диссертанта:

разработка методики обработки полнотекстовых информационных ресурсов для вычисления индикаторов патентной активности).

29. Зацман И.М., Шубников С.К. Методы верифицируемого оценивания целевых программ научных исследований // Системы и средства информатики. 2010. Вып. 20. № 2. – С. 23-48 (личный вклад диссертанта:

- 48 описание методики верифицируемого мониторинга и индикаторного оценивания программно-целевой деятельности).

Статьи в зарубежных журналах 30. Zatsman I. Pictorial Signs for Geoimages in Digital Libraries // European Journal for Semiotic Studies. 2003. Vol. 15. N. 2–4. - P. 609–620.

31. Zatsman I. Three-level communication model for electronic filing // Acta Semiotica Fennica. 2009. Vol. XXXIV(III). - Pp. 1947-1960.

Труды отечественных конференций 32. Зацман И.М. Визуально-мотивированное представление знаний в электронных библиотеках научных документов // Труды 4 Всероссийской конференции «Электронные библиотеки: перспективные методы и технологии, Электронные коллекции» (Дубна, 15-17 октября 2002 г.): В 2-х томах. Т. 1. - Дубна: ОИЯИ, 2002. - С. 120-135.

33. Зацман И.М. Принципы формирования информационно-аналитических ресурсов Единой информационной системы РАН // Труды 5-й Всероссийской объединенной конференции “Технологии информационного общества - Интернет и современное общество” (IST/IMS-2002, СПб., 25-ноября 2002 г.). - Санкт-Петербург: СПбГУ, 2002. - С. 94-97.

34. Зацман И.М. Семиотические и когнитивные аспекты проблемы электронного взаимодействия в информационном обществе // Труды 6-й Всероссийской конференции "Технологии информационного общества - Интернет и современное общество" (3-6 ноября 2003 г., Санкт-Петербург). - Санкт-Петербург: СПбГУ, 2003. - С. 13-15.

35. Зацман И.М. Семиотические основы создания интеллектуальных технологий // Проблемы и методы информатики. 2-я Научная сессия ИПИ РАН: тезисы докладов. - М.: ИПИ РАН, 2005.- С. 45-47.

36. Зацман И.М. Семиотический анализ человеко-машинного взаимодействия в технологиях поиска // Труды международной конференции Диалог-2005 "Компьютерная лингвистика и интеллектуальные технологии". - М.: Наука, 2005. - С. 172-179.

37. Зацман И.М., Землянов И.В. Принципы семантического кодирования первичных геоданных // Труды международной конференции Диалог-20"Компьютерная лингвистика и интеллектуальные технологии". - М.: Наука, 2005. - С. 180-187 (личный вклад диссертанта: принципы создания вербально-образного геотезауруса, предназначенного для представления знаний о гидрографической сети в виде дескрипторов).

38. Зацман И.М. Семантическое, информационное и знаковое кодирование патентных документов электронных библиотек // Труды Седьмой Всероссийской конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (Ярославль, 4-6 октября 2005г.). – Ярославль: Ярославский госуниверситет, 2005.- С. 112-121.

- 49 39. Зацман И.М. Полидоменные модели в системах оценки инновационного потенциала и результативности научных исследований // Труды международной конференции Диалог-2006 "Компьютерная лингвистика и интеллектуальные технологии". - М.: Изд-во РГГУ, 2006. - С. 178-183.

40. Зацман И.М. Полидоменные модели электронных библиотек систем мониторинга сферы науки // VIII Всероссийская конференция «Электронные библиотеки: перспективные методы и технологии, электронные коллекции».

Труды конференции. - Ярославль, Изд-во ЯрГУ, 2006. - С. 75-81.

41. Кожунова О.С., Зацман И.М. Прагматические аспекты создания семантического словаря терминов информационного мониторинга // Труды международной конференции Диалог-2007 "Компьютерная лингвистика и интеллектуальные технологии".- М.: Изд-во РГГУ, 2007.- С. 278-285 (личный вклад диссертанта: описание концептуальных подходов к классификации программно-ориентированных индикаторов).

42. Зацман И. М. Концептуализация данных наукометрических исследований в научных электронных библиотеках // Труды 10-й Всероссийской конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». – Дубна: ОИЯИ, 2008. – С. 45-54.

Труды зарубежных конференций 43. Liouty A.A., Martynenko A.I., Zatsman I.M Cognitive and Creative Framework for Digital Earth // Proceedings. 20ty International Cartographic Conference. Vol. 5. - Beijing: ICC, 2001. - Pp. 3327-3335 (личный вклад диссертанта: описание концептуальных основ компьютерного представления экспертных знаний в науках о Земле).

44. Zatsman I. Three-level Communication Model for Electronic Filing // The 9th World Congress of the International Association for Semiotic Studies (Helsinki/Imatra 11-17 June 2007). Abstracts. – Helsinki; Imatra: International Semiotics Institute at Imatra, 2007. – P. 482.

45. Zatsman I., Kozhunova O. Evaluating for institutional academic activities:

classification scheme for R&D indicators // The 10th International Conference on Science and Technology Indicators (STI’2008). Book of abstracts. – Vienna: ARC GmbH, 2008. – P. 428-431 (личный вклад диссертанта: разработка статического раздела классификации программно-ориентированных индикаторов).

46. Zatsman I., Kozhunova O. Emerging personal concepts and tracing their evolution by computer: semiotic foundations // Proceedings of ICAI’09, Vol. I.

WORLDCOMP’09, July 13-16, 2009, Las Vegas, Nevada, USA. - CRSEA Press, USA, 2009. P. 486-491 (личный вклад диссертанта: описание концептуальных основ компьютерного представления формируемых личностных экспертных знаний).

47. Zatsman I. Semiotic model for computer coding denotatum, signified and signifier. In: The Abstracts’ book of the 10th World Congress of Semiotics. A Corua: IASS, 2009. - P. 148.

- 50 48. Zatsman I. Emerging personal concepts and tracing their evolution: semiotic foundations. In: The Abstracts’ book of the 10th World Congress of Semiotics. A Corua: IASS, 2009. - P. 77.

49. Zatsman, I., Kozhunova, O. Evaluation system for the Russian Academy of Sciences: Objectives-Resources-Results Approach and R&D Indicators. In: IEEE Xplore Digital Library. E-print Proceedings of the International Conference ATLC’2009 “Atlanta Conference on Science and Innovation Policy 2009” - http://smartech.gatech.edu/bitstream/1853/32300/1/104-674-1-PB.pdf) (вклад диссертанта: разработка статического раздела классификации индикаторов и таблицы соответствия программно-ориентированных индикаторов стадиям мониторинга).

50. Zatsman I., Durnovo A. Incompleteness problem for indicators system of research programme // The 11th International Conference on Science and Technology Indicators (STI’2010). Book of abstracts. September 09–11, 2010. – Leiden: Universiteit Leiden, 2010. - P. 309–311 (личный вклад диссертанта:

описание архитектуры лингвистического обеспечения систем информационного мониторинга для компьютерного представления экспертных знаний об индикаторах).

51. Durnovo A., Zatsman I. Semiotic Models for Cognitive Processing of Language Information about Translation Difficulties // Proceedings of the 12th International Conference «Cognitive Modeling in Linguistics». – Kazan: KSU, 2010. Pp. 135-139 (личный вклад диссертанта: описание семиотических моделей компьютерного представления экспертных лингвистических знаний для создание корпусно-ориентированной типологии трудностей перевода).

52. Zatsman I. Tracing of Emerging Meanings by Computer: Semiotic Foundations // The 7th Conference of the Nordic Association for Semiotic Studies. Book of abstracts. – Lund: Lund University, 2011. – Pp. 70-71.







© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.