LibRar.Org.Ua — Бібліотека українських авторефератів


Головна Бібліотечна справа → Аналитическая обработка документов для обеспечения научных исследований и разработок

различия в этих ИПЯ и
реализующих их словарных средствах (с одной стороны классификационных таблицах, с другой — тезауру-
сов и ключевых слов) заключаются в следующем:
Классификационные языки, являющиеся «предкоординатными», оперируют терминами, составляющи-
ми «рубрики» или «подрубрики», т. е заголовками, описывающими некоторые области или подобласти, в
соответствующей области знания. Дескрипторные языки, являющиеся «(пост)координатными», ориентиро-
ваны на точное указание объекта(ов) описания или поиска, в том числе — на фактографические сведения;
Статьи в рубрикаторах, описывающих наименование рубрик и подрубрик любого уровня, могут состав-
лять сложные словосочетания и предложения. Лексические единицы дескрипторных языков строятся на
коротких словосочетаниях (1-3 слова). При необходимости построения составных словосочетаний (напри-
мер, в поисковых предписаниях) используются логические операторы, задающие разные виды отношений
между лексическими единицами [1, 2, 3, 4, 5].
Таким образом, следует подчеркнуть, что вербальное индексирование позволяет описать разные аспек-
ты содержания документов и БД с большей разрешающей способностью и более точно, чем классификаци-
онные ИПЯ. Исходя из изложенного, следует подчеркнуть важность использования для удовлетворения
информационных потребностей ученых и разработчиков вербального (дескрипторного) индексирования,
которое, кстати сказать, лежит в основе работы всех ИПС. При этом мы ни в коей мере не отвергаем необхо-
димость классификационного индексирования, которое имеет важное значение в первую очередь для
обеспечения различных внутрисистемных процессов (в библиотеке, группе библиотек, консорциуме и т. п.).
Традиционными процессами аналитической обработки документов и формирования локальных и рас-
пределенных электронных каталогов (ЭК) в библиотеках и информационных органах является составление
библиографических записей (БЗ). Напомним, что в соответствии с ГОСТ 7.1-2003 БЗ включает библиогра-
фическое описание («совокупность библиографических сведений о документе, приведенных по определен-
ным правилам, устанавливающим наполнение и порядок следования областей и элементов, и предна-
значенных для идентификации и общей характеристики документа»), заголовок библиографической записи
(в соответствии с ГОСТ 7.1-2003), термины индексирования, аннотацию или реферат (см. ГОСТ 7.9-95),
шифры хранения документа, справки о добавочных библиографических записях, дату завершения обработки
документа, сведения служебного характера. Реализация указанных требований предусмотрена действующи-
ми коммуникативными форматами серии MARC, предусматривающими в составе БЗ соответствующих
полей данных, в частности в UNIMARC`е и RUSMARC`е для предметных рубрик — 606 и индексов класси-
фикации — 675, 676, 679 и 686; для ключевых слов и персоналий — 610 и 600; для аннотаций и рефератов
— 330 и т. п. [2, 6].
С большим сожалением следует отметить, что указанные требования выполняются в библиотеках не в
полном объеме и далеко не всегда в удовлетворительном качестве:

2
Несмотря на то, что сотрудники подавляющего числа библиотек по данным анкетирования, проведенно-
го среди участников АРБИКОНа в 2004 г. (более 150 библиотек разной ведомственной принадлежности)
признают важность индексирования документов ключевыми словами (КС), реально используется этот
способ аналитической обработки документов далеко не во всех библиотеках;
Качество индексирования КС по полноте и корректности отражения важных аспектов содержания до-
кументов также в большинстве случаев оставляет желать лучшего. В значительной степени это связано со
следующими обстоятельствами: 1) Приверженностью сотрудников библиотек (особенно федеральных и
вузовских) к традиционным способам и средствам индексирования (имеются ввиду «систематизация» и
«предметизация») и в том числе — частая путаница принципов «вербального индексирования» с «предмети-
зацией» (подробно об этом нами говорилось в докладах на международных конференциях КРЫМ 2004 и
LIBCOM 2004 [7, 8]); 2) отсутствием согласованной методики составления КС (требования ГОСТ 7.66—92.
«Индексирование документов.3) Отсутствием общепринятой нормативной терминологической базы для
вербального индексирования, в частности тезаурусов и «авторитетных записей». Общие требования к
координатному индексированию» явно недостаточно) — существуют разные методики, которые в ряде
важных положений существенно противоречат друг другу [3, 7, 8];
Так же недостаточной является аналитическая обработка документов во многих библиотеках в части
описания содержания документов для пользователей, поскольку в большинстве БЗ отсутствуют аннотации
(не говоря уж о рефератах).
Очевидно поэтому, что гигантский объем литературы и содержащейся в ней информации остается не
востребованным для пользователей как локальных, так и распределенных библиотечно-информационных
систем. Особенно для тех из них, которые профессионально заняты в разных областях научных исследова-
ний и разработок.
Еще более серьезные требования к аналитической обработке документов и данных ставятся для их эф-
фективного использования в режиме удаленного доступа. К ним относятся:
Требования обеспечения информационной совместимости в первую очередь для электронных каталогов
и составляющих их БЗ это корректное использование коммуникативных (обменных) форматов и, в первую
очередь — RUSMARC. А поскольку большинство внутренних форматов ПО АБИС ориентировано на
форматы UNIMARC и UMARC 21 (USMARC), к тому же неоднозначно трактуемые, возникают проблемы
совместного использования библиотечно-информационных ресурсов как библиотеками, так и их пользова-
телями.
Описания отдельных полнотекстовых ресурсов, предоставляемых электронными библиотеками в Ин-
тернет или Интранет, созданными на базе библиотек и информационных органов, все более настоятельно
требуют использования специальных систем метаданных и коммуникативных форматов, которые отражают
виды этих ресурсов, характер их принадлежности, использования и т. п.
Термин «метаданные» принято толковать, как «данные о данных», однако его значение распространяет-
ся помимо описания состава данных, их структуры (формата) представления, места хранения и других
признаков описания также на поддерживающие их информационные системы, технологии, пользователей,
методы доступа и т. д. Особенно широко этот термин стал использоваться в последние годы в связи с
развитием электронных библиотек, поскольку метаданные стали важнейшим средством обеспечения навига-
ции, поиска и возможности информационного обмена в Интернете. Однако до настоящего времени значение
этого термина до конца четко не определено. Наиболее размыты границы между метаданными и коммуника-
тивными (обменными) форматами.
Существуют различные категории метаданных, например, описательные метаданные