WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 || 3 |

Информационные листы, формируемые в автоматизированном режиме из анонсов мероприятий, относящихся к определенным тематикам, стали неотъемлемой частью одного из основных продуктов ВИНИТИ РАН – Реферативного журнала.

Реализация результатов работы Разработанная в рамках диссертационной работы технология наполнения базы данных по научным мероприятиям и формирования на ее основе информационных продуктов внедрена и успешно используется в ВИНИТИ РАН Области применения результатов Результаты работы могут быть использованы в самых разнообразных областях человеческой деятельности, связанных с обработкой информации и, в том числе, обработкой неструктурированной информации.

Также, результаты работы имеют практическую ценность с точки зрения реализации алгоритмов сбора, обработки, корректировки информации и формирования на ее основе различных информационных продуктов.

После адаптации, система может быть использована для создания указателя выставок, системы анализа информации, рассеянной в Интернете, на интересующую заказчика тему, подсистемы учета выступлений на конференциях молодых ученых и формировании индекса цитирования на основе материалов конференций.

Апробация работы Материалы диссертации докладывались на следующих конференциях:

13-я Международная конференция «Крым 2006. "Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса"» (Украина, г. Судак, 2006);

7-я Международная конференция «Научно-техническая информация – 2007» Информационное общество: инновации в информационном обслуживании (Россия, г. Москва, 2007);

10-я Юбилейная международная научно-практическая конференция "SCIENCE ONLINE: электронные информационные ресурсы для науки и образования" (Египет, г. Шарм эль-Шейх, 2007).

Положения, выносимые на защиту 1. Разработка структуры информационного объекта "описание научного мероприятия";

2. Методика создания и поддерживания единого массива описаний научных мероприятий с использованием методов обработки частично формализованной информации;

3. Технология обработки и использования информации об отечественных и зарубежных научных мероприятиях для создания различных информационных продуктов на основе единого массива.

Публикации Основные результаты изложены в 6 опубликованных работах, список которых приводится на стр. 23-24. В журналах включенных в перечень ВАК России – 1 публикация Структура и объем диссертации Диссертация состоит из введения, трех глав, заключения, списка цитируемой литературы, включающего 95 наименований, и приложения. Работа изложена на 131 странице машинописного текста, иллюстрированного 55 рисунками и 10 таблицами..

Содержание работы Во введении дана общая характеристика работы, обоснована актуальность выбранной темы, сформулированы цели и задачи исследования, показана научная новизна и практическая ценность работы.

Кратко изложено содержание диссертации по главам.

В первой главе (Информационный объект «научное мероприятие» как основа для функционирования базы данных) приведен анализ существующих сборников описаний научных мероприятий и форматов описаний. Анализируется разработанный формат информационного объекта «описание научного мероприятия».

Приводится структура массива, объединяющего описания научных мероприятий. Рассматриваются имеющиеся технологические потоки и их особенности. Большое внимание уделено аспекту обработки неформализованной информации о научных мероприятиях с применением алгоритмов нечеткого сравнения строк и созданных словарей основных терминов на различных языках. Исследуется существующая программнотехнологическая поддержка массива научных мероприятий.

Рассматриваются основные элементы описания научного мероприятия, приводится анализ структуры описаний научных мероприятий в различных печатных сборниках и электронных ресурсах, рассматривается структура описания в создаваемом информационном массиве и иерархия этих описаний.

Анализируется структура массива описаний научных мероприятий, ее реализация в СУБД MS SQL Server и программное обеспечение. На рисунке 1 приведены основные таблицы массива мероприятий.

Секции (EVENTS_UP_SECT) PK Идентификатор Номер секции Основная таблица (EVENTS_UP) Название секции PK Идентификатор Тип секции Наименование оригинальное Номер к наименованию Наименование русскоязычное Параллельное наименование мероприятия Тематика (EVENTS_UP_RUB) Тип мероприятия PK Идентификатор Форма проведения мероприятия Язык БО Код тематики (ГРНТИ) Параллельный язык БО Код тематики (РЖ) Характер мероприятия Географический охват мероприятия Состав участников Актуальность описания Организаторы (ORGMAIN2) День начала проведения мероприятия Месяц начала проведения мероприятия PK Идентификатор Год начала проведения мероприятия День окончания проведения мероприятия Статус организатора Месяц окончания проведения мероприятия Порядковый номер организатора Год окончания проведения мероприятия Код организатора Страна проведения Наименование организатора полное Место проведения мероприятия Наименование организатора краткое Адрес мероприятия Аббревиатура наименования организатора Рабочий язык Язык БО Ключевые слова Страна расположения организатора Краткое резюме Город официального расположения организатора Корреспондентский адрес Электронная почта Телефон организатора Факс организатора Электронный адрес организатора ФИО контактного лица организатора Ученая степень контактного лица Должность контактного лица Материалы мероприятия (EVENTS_UP_MATER) PK Идентификатор Связи между описаниями мероприятий (EVENTS_UP_SVZ) Порядковый номер материала Вид материала PK Идентификатор связи Наличие материалов в ВИНИТИ Вид носителя материала Идентификатор мероприятия Сведения об опубликованных материалах Тип связи Рис. 1 Основные таблицы массива мероприятий Исследуются имеющиеся информационные потоки, технология наполнения массива научных мероприятий, приводятся данные по подразделениям, участвующим в наполнении массива. Рассматриваются особенности, присущие внутренним и внешним потребителям информации о научных мероприятиях. На рисунке 2 приведена общая схема получения, обработки и использования информации.

Нормализация Перевод Внешний Информационные мир продукты и услуги Электронные источники Электронные продукты Создание Регистрация Хранение Информационных продуктов Печатные источники Печатные продукты Прочие Корреспонденция источники Прочие продукты Контактные лица Сбор Протоколирование оргкомитетов статистики Администраторы системы Рис. 2 Общая схема получения, обработки и использования информации Приведена статистика по наполнению массива научных мероприятий, а также различные срезы массива (по типу, по месту проведения мероприятий, по тематике и т.д.) Рассмотрены основные аспекты обработки неформализованной или частично формализованной информации о научных мероприятиях на примере обработки данных из регистрационного массива опубликованных материалов, где хранится информация о научных мероприятиях. Приведены данные сравнительного анализа структур описаний в массиве научных мероприятий и регистрационном массиве.

Рассмотрен алгоритм обработки описаний из регистрационного массива.

Приводится обоснование использования нечеткого сравнения строк при поиске дублирующихся описаний мероприятий. Исследуются различные алгоритмы сравнения, приводятся сравнительные тесты этих алгоритмов.

Обосновывается применение в итоговой обработке алгоритма, основанного на сравнении по q-граммам (использовался модифицированный алгоритм, использующий поиск по хеш-ключам, представляющим собой сложную структуру, в основание которой положены частотные сигнатуры строк по биграммам для ускорения времени работы и снижения объема служебной работы). Временная сложность (T) алгоритма составляет:

T = O(B + A B - q) где А, В – длины сравниваемых строк, E – размер алфавита q – величина q-граммы;

Также, описывается алгоритм, использующий коэффициент совпадения подстрок, который показал неплохие результаты и может быть рекомендован к применению в тех случаях, где время работы не является критичным, а возможности создания служебных таблиц с qграммами и (или) хеш-ключами отсутствуют. Временная сложность (T) алгоритма составляет:

j T = ((m - k + 1) (n - k + 1)), k= где m,n – длины сравниваемых строк, k – значение длины подстроки, j - максимальное значение длины подстроки;

Рассматривается программно-технологическая поддержка массива научных мероприятий, основные технологические процессы, связанные с массивом, и приводятся соответствующие функции программного обеспечения.

Во второй главе (Разработка технологии формирования традиционных информационных продуктов) обосновывается и предлагается новая технология формирования оригинал-макетов в программе MS Word на основе сведений, поступающих из базы данных.

Рассмотрена технология, внедренная в ВИНИТИ РАН.

Рассмотрены особенности технологии формирования оригиналмакетов печатных изданий объемом до 300 страниц в программе MS Word, входящей в состав пакета MS Office и являющегося, де-факто, стандартной комплектацией современного компьютера. Рассмотрена технология формирования оригинал-макета «Бюллетеня международных научных съездов, конференций, конгрессов, выставок» - сборника анонсов научных мероприятий (выпускается ВИНИТИ РАН с 1960 года).

Обоснованы преимущества формирования «Бюллетеня международных научных съездов, конференций, конгрессов, выставок» по новой технологии, выразившиеся в упрощении технологии создания оригинал-макета, добавлении новых классификаторов, изменении внутреннего оформления, увеличении объема и, как следствие, повышении качества и стабилизации тиража. Иллюстрация этого приведена далее на рисунке 3.

Приведены результаты разработки технологии формирования оригинал-макетов Информационных листов для включения последних в Реферативный журнал ВИНИТИ РАН. Рассмотрены ее отличия от технологии формирования оригинал-макета «Бюллетеня международных научных съездов, конференций, конгрессов, выставок».

Продемонстрирована универсальность разработанных подходов и приведены предложения по дальнейшему расширению области применения этого аспекта настоящей работы.

Рис. 3 Сравнительный анализ тенденций в Бюллетене научных съездов, конференций, конгрессов, выставок Третья глава (Разработка технологии формирования электронных информационных продуктов) посвящена разработке подходов к созданию электронных информационных продуктов.

Рассмотрен опыт применения современных технологий в ВИНИТИ РАН, выразившийся в создании электронного каталога НТЛ, расположенного на сайте ВИНИТИ РАН (http://www.viniti.ru). Обоснована структура и особенности электронного каталога НТЛ. Приведено описание концепции подраздела «Научные мероприятия», обеспечивающего взаимодействие с массивом мероприятий интернетпользователей. Разработана структура базы данных, являющейся посредником между массивом мероприятий, предназначенным для внутреннего пользования, и его отображением на публичном веб-сайте, и интерфейсные решения с подробным описанием функционала. На рисунке 4 приведена концепция иерархии раздела, посвященного научным мероприятиям.

Веб-сервер ВИНИТИ Http://www.viniti.ru Электронный каталог поступлений ВИНИТИ Http://catalog.viniti.ru Раздел «Научные мероприятия» Http://catalog.viniti.ru/ conf.asp Массив научных мероприятий Http://catalog.viniti.ru/ conf_mas.asp Рассылка информации с анонсами Http://catalog.viniti.ru/ conf_mail.asp Добавление сведений о мероприятии Http://catalog.viniti.ru/ conf_add.asp Рис. 4 Иерархия раздела, посвященного научным мероприятиям Рассмотрены аспекты взаимодействия администраторов массива мероприятий с интернет-пользователями. Приведено описание технологии рассылки сообщений об анонсированных мероприятиях пользователям посредством электронной почты, а также, технология получения анонсов мероприятий непосредственно от организаторов.

Использован опыт ведущего зарубежного информационного портала – ConferenceAlerts.com (http://www.conferencealerts.com).

Исследованы особенности создания оффлайновых электронных продуктов. Сформирована экспериментальная база данных «Научные мероприятия», предназначенная для распространения на электронных носителях. Приведены особенности технологии формирования подобных продуктов и описаны возможности использования имеющегося продукта и возможности создания новых с минимальными затратами.

В заключении изложены основные результаты диссертационной работы.

Основные результаты работы 1. В ходе выполнения работы был создан единый и четко структурированный массив описаний научных мероприятий. При этом была решена основополагающая задача – разработка структуры информационного объекта – «описание научного мероприятия».

2. Разработан технологический процесс обработки информации о научных мероприятиях. Освоена технология обеспечения жизненного цикла информационных объектов «описание научного мероприятия». Произведена интеграция новой технологии в существующие в ВИНИТИ РАН технологические процессы, в том числе, в процессы формирования информационных продуктов. В процессе разработки технологических процессов была спроектирована и реализована в реляционной СУБД структура массива научных мероприятий.

Одним из аспектов технологического процесса обработки информации о научных мероприятиях стала обработка регистрационного массива опубликованных материалов, который содержал в 5 раз больше описаний, чем имелось в тот момент в массиве описаний научных мероприятий. Несовпадение форматов описаний в этих массивах, а также отсутствие формализации в регистрационном массиве потребовало применения алгоритмов нечеткого сравнения строк, специально созданных словарей и оригинальных программных решений. В результате сократился объем работы для пользователей и администраторов системы по обработке данных из регистрационного массива опубликованных материалов.

3. Спроектировано и реализовано программное обеспечение, включающее все инструменты управления для администраторов массива мероприятий, а также автоматизированные рабочие места для пользователей массива мероприятий. Разработаны и введены в эксплуатацию механизмы формирования оригиналмакетов печатных информационных продуктов и взаимодействия с существующими программными продуктами. Созданное программное обеспечение удовлетворяет запросам пользователей и отвечает всем требованиям, предъявляемым к современным интерфейсам в плане эргономики и стиля.

Pages:     | 1 || 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»