WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 || 3 |

Остальные возможные требования к технологиям доступа можно считать специальными и определяемыми в зависимости от круга пользователей, для которых технология предназначена.

Все реализованные технологии доступа к ресурсам в России можно условно разбить на четыре группы, в зависимости от характера информационных ресурсов и требуемой функциональности:

1. Системы доступа к документам в крупных библиотеках реализуют доступ к централизованно хранящимся данным. Как правило, в этой группе не используется одновременный поиск по нескольким базам данных.

Системы ориентированы исключительно на используемую в конкретной библиотеке автоматизированную библиотечно-информационную систему (АБИС), а также рассчитаны на технологии и формы отчетности, принятые в таких организациях.

2. Большинство российских корпоративных библиотечных систем, работающих с распределенными данными, не обеспечивают доступ к полным текстам и систему заказа электронных копий документов, а также не используют поиск по словарям метаданных.

3. Системы доступа издательств и других поставщиков информационных ресурсов осуществляют коммерческий доступ к документам, преимущественно к журнальным статьям, поэтому системы используют закрытые протоколы, ориентированы на лицензирование доступа и жесткое разграничение пользователей по правам использования ресурсов.

4. Поисковые машины Интернет имеют дело с большим количеством хаотичных, тематически неорганизованных ресурсов, а также с усредненным пользователем с неопределенным кругом интересов.

Научно-исследовательская организация имеет свою специфику и контингент пользователей, поэтому не может прямо заимствовать ни одну из описанных технологий. Для организации доступа к документам в такой организации необходим специальный подход, основанный на потребностях пользователей и доступных организации информационных ресурсах.

Вторая глава «Модель доступа к документам в научно-исследовательской организации» посвящена разработке информационной модели технологии доступа к документам.

В разделе 2.1 приведено определение доступа, компонентный состав технологии доступа к документам, специфика научно-исследовательской организации, определяющая особенности технологических подходов.

Обозначены задачи, которые необходимо решить для обеспечения доступа к документам. На основании пользовательских рекомендаций определены технологические требования к доступу:

1. Открытость и расширяемость. Доступ к документам из Интернет базируется на стандартах открытых систем, что обеспечивает переносимость технологических блоков на иные аппаратные платформы, а также подключение источников информации других производителей.

Обеспечивается использованием Web-технологий, коммуникативного формата RUSMARC и сетевых протоколов Z39.50.

2. Простота управления. Достигается использованием в технологии функциональных модулей, определяемых общностью информационных процессов и используемыми информационными технологиями. Разбиение на модули позволяет использовать в них готовые программные решения разных разработчиков. Модульность позволяет автономно обслуживать каждый блок, а также модернизировать и заменять используемые в них программные средства по мере развития соответствующих информационных технологий.

3. Централизованный пользовательский интерфейс. Поиск документа и доступ к нему производится из «единого окна». Для пользователя система выглядит централизованной, так как её распределенность скрыта интерфейсом.

4. Распределенность документов и коллекций по местам хранения и децентрализация их администрирования. Документы, коллекции и группы коллекций хранятся там, где образуются.

5. Интегрируемость на уровне баз данных. Технология обеспечивает доступ к ресурсам различных производителей, а также допускает логическую группировку коллекций документов, в том числе созданных с помощью различных СУБД, с целью формирования тематических ресурсов и ресурсов, скомпонованных по региональному признаку.

6. Дифференциация прав доступа. Для обеспечения условий лицензионных соглашений и авторских прав уровень доступа к базам данных организации и отдельным документам определяется индивидуальными правами пользователя или группы пользователей.

7. Унифицированные описательные метаданные и обеспечение многофункционального поиска по ним. Для обеспечения доступа к документам с помощью различных поисковых интерфейсов документы различного типа и вида представлены в системе унифицированным способом описания двух типов, допускающих взаимную конверсию:

a. В блоке формирования метаданных документ описывается АБИС в формате семейства MARC;

b. Документ, поступающий в хранилище документов через экспертное хранилище, получает RDF-описание в схеме Dublin Core (DC) или MODS.

8. Унифицированные форматы хранения документов. Формат хранения документа должен допускать его семантический и синтаксический анализ для последующего поиска по полному тексту.

9. Вариативность форматов вывода на экран результатов поиска документов – от MARC-форматов до формата каталожной карточки. Доступ к электронному документу on-line инкапсулирован в формате вывода как URL-ссылка.

Д П о л ь з о в а т е л и Передача О д окументов С Точка Производство Единое окно Т электронных доступа документов А В Набор О к н о Формирование поисковых отображения К заказа интерфейсов результатов А Контроль доступа Б Д Блок поиска IR-Explain Поисковая Контроль доступа система Хранилище Формирование метаданных поисковых словарей Формирование Конвертор Формирование метаданных метаданных Х р а н и л и щ е д о к у м е н т о в Рис. 1. Модель информационных процессов технологии доступа 10. Возможность «отложенного доступа», т. е. регистрация заявки, конверсия документа в электронный вид с сохранением и последующей доставкой пользователю через систему доступа или электронной почтой.

В разделе 2.2 приведена общая схема информационных процессов технологии доступа к документам (рис. 1).

В технологии выделены функциональные модули, реализующие отдельные информационные процессы, и модули информационных ресурсов технологии - хранилища данных.

Функциональный модуль – это технологический блок целевого назначения с собственными информационными потоками.

Выделение функциональных модулей обусловлено следующими признаками их внутреннего единства:

1. Однородностью используемых в пределах модуля информационных технологий и программных средств их реализации.

2. Возможностью обслуживания и модернизации каждого модуля специалистом, имеющим навыки работы только с конкретными программными продуктами.

Для хранения информационных ресурсов технологии используются четыре хранилища:

1. Распределенное хранилище документов.

2. Распределенное хранилище метаданных документов.

3. База данных описаний коллекций.

4. Временное экспертное хранилище документов перед помещением их на постоянное хранение.

Раздел 2.3 посвящен описанию функциональных модулей технологии доступа. Выделены четыре модуля: единая точка доступа, поисковая система, формирование метаданных и доставка.

Единая точка доступа реализует технологию «единого окна» и предназначена служить пользовательским интерфейсом доступа к документам. Разработка и реализация точки доступа к документам осуществляются на основе технологий Web. С помощью точки доступа пользователь извещается о доступных ему базах данных и может самостоятельно выделить список ресурсов для поиска необходимого ему документа. Точка доступа оперирует тремя информационными потоками:

1) Поисковые запросы пользователей с вектором «пользователь - единое окно - набор поисковых интерфейсов – поисковая система – окно отображения результатов – пользователь».

2) Информация о массивах метаданных документов с вектором «пользователь – единое окно - поисковая система – единое окно – пользователь».

3) Запросы на доставку документов с вектором «пользователь – окно отображения результатов – доставка – окно отображения результатов – пользователь».

Поисковая система предназначена для поиска документов по набору их поисковых индексов. Базовым требованием к поисковой системе является возможность распределенного поиска по массивам метаданных, размещенным в Интернете. Для этой цели используется сетевой протокол Z39.50 (стандарт ISO 23950). Метаданные документов группируются в массивы, определяемые видовыми и/или тематическими характеристиками документов. Описания массивов хранятся в базе данных IR-Explain. Доступ пользователей к массивам определяется правами доступа и обеспечивается системой контроля, встроенной в протокол Z39.50. В поисковой системе определены три информационных потока:

1) Поисковые запросы пользователей с вектором «точка доступа – блок поиска – контроль доступа – хранилище метаданных - блок поиска – точка доступа», либо в случае отказа в доступе «точка доступа – блок поиска – контроль доступа – блок поиска – точка доступа».

2) Информация о массивах метаданных с вектором «точка доступа – БД IR-Explain – точка доступа».

3) Лингвистическое обеспечение поиска с вектором «формирование метаданных – блок поиска».

Модуль формирования метаданных предназначен для обработки полных текстов документов перед размещением их в хранилище. В процессе обработки документа блоком формирования метаданных создается вторичный документ - библиографическое описание. Представление библиографического описания, а также результатов индексирования и реферирования документа в стандартной машиночитаемой форме семейства MARC создает библиографическую запись или поисковый образ документа, который может быть использован поисковой системой. Библиографические записи компонуются в именованные массивы записей, индексируются и размещаются в хранилище метаданных. Для этого пригодна автоматизированная библиотечно-информационная система (АБИС), используемая в библиотеке организации. Однако для совместного функционирования модуля с поисковой системой используемый технологией сервер Z39.50 должен быть укомплектован соответствующим провайдером данных, отображающим данные АБИС в абстрактную схему данных. Модуль содержит три функциональных блока и обслуживает следующие потоки информации:

1) Формирование описательных метаданных в формате MARC с вектором «хранилище документов – формирование метаданных – хранилище метаданных» 2) Формирование метаданных в формате DC (или MODS) с вектором «хранилище документов - формирование метаданных – конвертор – хранилище метаданных». Возможен и встречный поток для преобразования метаданных в формате DC, содержащихся в электронном документе, в формат MARC с последующей их корректировкой, с вектором «хранилище документов – конвертор – формирование метаданных – хранилище метаданных».

3) Лингвистическое обеспечение поиска с вектором «формирование метаданных – формирование поисковых словарей - поисковая система».

Модуль доставки функционирует в зависимости от способа хранения требуемого документа и прав доступа к нему:

1. Если электронная версия документа находится в открытом доступе, то модуль производит онлайновую доставку его на компьютер пользователя по URL-ссылке.

2. Если доступ к электронной версии ограничен, пользователь может оформить заказ на доставку и, если возможно, получить его по электронной почте.

3. Если документ существует в печатном виде и возможна его конверсия в электронный вид, регистрируется заказ на доставку, а полученный в результате конверсии документ отсылается пользователю электронной почтой.

В модуле определены следующие информационные потоки:

1) Доставка электронного документа с вектором «точка доступа – контроль доступа – хранилище документов – точка доступа».

2) Доставка электронного документа с ограничениями в доступе с вектором «точка доступа – контроль доступа – точка доступа – формирование заказа – пользователь».

3) Доставка печатного документа, пригодного для оцифровки с вектором «точка доступа – формирование заказа – производство электронного документа – пользователь».

Третья глава «Метаданные и их связь с документами в хранилище» посвящена описанию информационных ресурсов технологии доступа – документов и метаданных.

В разделе 3.1 описаны информационные ресурсы технологии, определен класс принадлежности документов и приведены необходимые определения.

Перечислены основные стандарты метаданных, используемые в технологии.

В разделе 3.2 описана модель документа в хранилище. Под документом понимается:

di=, где pi – содержательная часть (или файл) документа, mi – метаданные документа. Эквивалентные множества P={p1,p2,…,pn} и M={m1,m2,…,mn}, определяющие массив документов D={d1,d2,…,dn}, образуют два связанных хранилища данных: хранилище документов (или их полных текстов) и хранилище метаданных. Далее обоснована возможность применения объектной модели документа к его метаданным в технологии доступа к документам. Приведены определения.

Метаданными документа mi называется пара mi=, где Si – структура метаданных, Vi – содержание (информационное наполнение) структуры. Структура документа определяется одной из выбранных схем данных. Для публикаций это MARC, DC или MODS.

Описательные метаданные (содержание) описывают семантику документа.

Описательные метаданные могут являться частью электронного документа или храниться отдельно от него. Для того, чтобы избежать дублирования документов, определен признак идентичности: два документа d1 и d2 назовем экземплярами документа, если они имеют идентичные метаданные m1 = m2.

Коллекцией называется множество документов (или их метаданных) с выделенной фиксированной структурой, содержание которых имеет одинаковую тематическую направленность.

Из определения документа понятно, что для множества документов D в хранилище документов понятие коллекции размыто, так как в определение документа не входит в явном виде описание его структуры. Понятие коллекции определено на множестве метаданных. В силу связанности и эквивалентности множеств D и M каждому входящему в коллекцию элементу mi множества M соответствует элемент di множества D.

Итак, все множество метаданных в хранилище метаданных разделено на коллекции. Иными словами коллекция Kj есть подмножество множества M:

KjM. В общем случае, все множество M является коллекцией изданий, доступных сотрудникам научно-исследовательской организации. Все множество коллекций распределено по местам их формирования в сети.

Pages:     | 1 || 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»