LibRar.Org.Ua — Бібліотека українських авторефератів


Головна Бібліотечна справа → Библиотека, музей, архив: создания единого информационного ресурса. Проблемы и решения

глобальные сети. Доступ к конфиденциальной информации, обеспечивается путем использования авторизации;

  • научность — содержательная часть базы данных должна быть подготовлена специалистами с высокими профессиональными знаниями;
  • возможность хранения различных типов данных — текст, оцифрованные реальные изображения, звук, видеоинформация, и компьютерная графика;
  • создание и последующее администрирование баз данных должно выполняться, как централизовано, так и удаленно.
  • Основные требования к системе описания объектов каталогизации.
  • должны быть поддержаны объекты с различными структурами описания;
  • полное описание объектов может быть изменено в дальнейшем;
  • возможность двух различных формальных описаний одного и того же объекта;
  • описания объектов связано с другими, причем эти связи разнообразны, заранее четко не определены, могут изменяться.
  • Основные требования к системе поиска.
  • поиск должен выполняться как в полнотекстовых базах данных, так и в каталогах описаний;
  • поиск должен вестись также и по сложным видам информации — изображения, звук, видеоинформация, и компьютерная графика;
  • поиск должен выполняться как по отдельным базам данных, так и по всей распределенной системы.
  • Благодаря построению системы, удовлетворяющей таким требованиям, информация об историко-культурном наследии становится доступной для ученых России и мирового сообщества. Также, в этом случае, решается проблема защиты культурного достояния России. Это достигается путем более совершенного научного и юридического учета культурного наследия и формирования фонда идентифицированных копий на случай форс-мажорных обстоятельств.

    Этот подход был использован специалистами организаций культуры и образования Ярославской области в ходе выполнения ряда проектов РФФИ, РГНФ, Института “Открытое общество” и создан прототип системы, решающий часть вышеперечисленных задач.

    Для реализации была выбрана схема централизованно — распределенной системы. При этом данные участников проекта объединяются в некоторой центральной информационной системе и периодически синхронизируются с локальными электронными каталогами. Наряду с известными недостатками (например, доступ к данным только через одно центральное хранилище и т.д.), такая структура имеет множество положительных сторон. Наличие центральной системы позволит объединить в едином информационном пространстве данные из организаций, не обладающих достаточной технической базой. С другой стороны во многих организациях уже существуют системы учета. При таком подходе их работа с единым каталогом сводится к простому обмену данными на основе некоторого коммуникативного формата. Обмен данными может осуществляться как через Интернет, так и более простыми средствами (грубо говоря, через дискеты). Наличие центрального каталога также обеспечит простоту администрирования и управления системой.

    Далее, для выполнения поставленных в проекте задач были проанализированы структура и типы данных, описывающих объекты (артефакты), сохранение которых предполагалось в электронном виде. Установлены следующие особенности информационного описания:

    • имеется достаточно большое количество объектов (артефактов) различных по структуре описания;
    • полное описание для большинства объектов не закончено, полностью не определено, или подразумевается, что оно может быть изменено в дальнейшем; также возможна ситуация двух различных формальных описаний одного и того же объекта;
    • большинство объектов связано согласно той или иной системе с другими, причем эти связи разнообразны, заранее четко не определены, могут изменяться.

    Информация такого плана возникает во многих предметных областях, данные из которых предполагалось сохранять в электроном виде, например, при описании музейных коллекций, хранилищ редких книг, описании архитектуры и т.д. Указанные особенности во многом определяются спецификой этих предметных областей и связаны с различными подходами в описании и систематизации применяемыми научными работниками не только различных учреждений культуры, но зачастую и одного музея, библиотеки, архива.

    В соответствии с вышесказанным, определены дополнительные функциональные требования к цифровой библиотеке:

    • описание и хранение объектов различной структуры, которая заранее не определена;
    • структурирование информации на уровне системы хранения данных;
    • обеспечение доступа пользователей к метаданным (репозиторию) системы с возможностью динамического изменения структур данных и их взаимосвязей;
    • поддержка системы ссылок между объектами хранения и их характеристиками (атрибутами), как на уровне метаданных, так и на уровне ввода и администрирования объектов;
    • встроенные механизмы, обеспечивающие возможность повторного использования данных;
    • встроенные механизмы авторизированного доступа к данным сторонним пользователями и разработчиками.

    Следует также сказать, что большинство перечисленных требований в настоящее время являются достаточно распространенными. Различные варианты реализующих их информационных систем и хранилищ данных уже описаны в литературе.

    Для хранения информации был избран объектный подход. Соответственно основными компонентами цифровой библиотеки (ЦБ) являются: репозиторий, электронный каталог, интерфейсы доступа к ним, система авторизации. Репозиторий определяет типы и взаимодействия хранимых данных. Электронный каталог собственно содержит информацию. Интерфейсы доступа позволяют внешним приложениям оперировать структурой данных и самими данными. Система авторизации обеспечивает разграничение прав доступа к информации и прав администрирования и управления репозиторием.

    Репозиторий системы содержит определения классов. Класс определяется набором атрибутов и методов. Типы атрибутов класса определяются в репозитории. В первоначальной версии атрибуты могли иметь только скалярные типы, затем список возможных типов атрибутов был расширен. В данный момент имеется возможность определять атрибуты таких типов, как списки (массивы) атрибутов, атрибуты перечислимого типа, BLOB данные и т.д. При этом описание произвольного артефакта (определение класса) приведено к стандартному виду и любой документ выступает в роли атрибута того или иного объекта хранения (экземпляра класса). При этом типы документов определяются в репозитории системы, как типы атрибутов объектов, содержащие BLOB данные. В репозитории же определяются приложения и типы просмотра BLOB атрибутов. Эти определения возможны как на уровне “всего” электронного каталога, так и для конкретной рабочей станции.

    Следует сказать, что атрибуты не могут иметь объектный тип.

    Это ограничение, на наш взгляд, является оправданным. Чтобы определять составные классы, необходимо выделить некоторые элементарные сущности, которые описываются классами и объединены отношением “часть-целое”. Такой анализ подразумевает с одной стороны достаточно полную априорную информацию о структуре данных, с другой стороны, подразумевает что отношения “часть-целое” являются постоянными. В данном случае эти требования часто не выполняются. Структура сохраняемых данных заранее четко не определена, отношения “часть-целое” не фиксированы, более того один и тот же артефакт (набор артефактов) при различных подходах к анализу данных может быть описан различными составными классами. Если учитывать эти особенности, то применение составных классов во многих случаях приводит к неоправданному усложнению, избыточности модели данных