LibRar.Org.Ua — Бібліотека українських авторефератів


Головна Бібліотечна справа → Англо-русский тезаурус по сохранности документов и некоторые особенности его составления

малооправданному и при этом существенному увеличению объема тезауруса. На принципе минимизации тезауруса, по нашему мнению, основываются и некоторые из выше указанных критериев 272 устойчивости языковых единиц. Так, описанное в пункте 13 разделение словосочетания «история России» на составляющие его элементы скорее всего обусловлено тем, что понятия `история' и 'Россия' как самостоятельные элементы ИПЯ могут быть также использованы для индексирования очень широкого круга запросов, как, например, «история Англии, Франции, Португалии и т. д.» «экономика, население, финансы, военное дело и мн. др. в России 18 века» В дескрипторных ИПЯ связь понятий, называемых одиночными терминами, осуществляется не заранее, до проведения поисков информации, как в сложных предметных рубриках каталогов, а при помощи координации терминов в поисковых выражениях запросов. По этой причине в дескрипторных ИПЯ ключевые слова, содержащие три и более элемента, являются часто ненужными, так как имеются более «экономные» языковые средства индексирования информационных запросов. Содержание многих запросов описывает семантико-синтаксическая модель [предмет индексирования информации] -- [аспект] -- [характеристика места] -- [характеристика времени], и эта модель широко применяется для составления рубрик предметизационных ИПЯ. В связи с обсуждаемым нужно специально сказать, что дескрипторные и предметизационные языки индексирования -- это разные классы ИПЯ. Соотношение между ключевыми словами и сложными предметным рубриками, по образному определению Ф. И. Грининой, такое же, как соотношение между кирпичами (ключевые слова) и кирпичными строительными конструкциями (сложные предметные рубрики) [14], а смешение двух разных принципов разработки тезаурусов неправомерно как теоретически, так и в практическом плане. И поэтому к выше описанным критериям устойчивости языковых единиц можно добавить еще один -- принципиальный выбор типа ИПЯ базы данных. Если при разработке документальной системы был выбран предметизационный ИПЯ, то соображения о малооправданной сложности языка индексирования информации теряют свою актуальность и становятся малосущественными. Экономия лингвистических средств как критерий устойчивости «действует», как и все остальные, описанные выше, только с учетом взаимодействия многих условий и факторов, и не является главным и определяющим. Так, трехсловное сочетание УЧЕТ БИБЛИОТЕЧНЫХ ФОНДОВ в отношении его синтаксической формы (но не содержания и употребления) -- такое же, как и «свободное» словосочетание «история России». Однако в отличие от последнего эта ЛЕ: (1) относительно часто 273 встречается в литературе по обеспечению сохранности документов, (2) является общепринятым термином, (3) имеет в БД ОСД вышестоящий дескриптор PRESERVATION [обеспечение сохранности документов], и поскольку близких к нему в семантико-синтаксическом отношенииЛЕ, кроме синонима комплектование фондов, в тезаурусе по ОСД не имеется, по принципу аналогии (4) не может быть образовано большое число таких же, но малополезных при проведении поисков терминов. Приведенное комплексное рассмотрение «бытования» термина учет библиотечных фондов и позволяет определить его как терминологически неделимую единицу. Из рассмотрения проблемы устойчивости, как одной из центральных проблем, решаемых при разработке тезаурусов, вытекает, что в ходе дескрипторизации лексики разработчики ИПТ руководствуются не только небольшим числом правил (в ГОСТ на создание одноязычных тезаурусов их описано, например, только 6) установления терминологически неразложимых ЛЕ, простых и понятных любому носителю русского языка с известным уровнем общего образования, но и учитывают много критериев, часть которых далеко отстоит от собственно лингвистической стороны рассмотрения проблемы. Правила индексирования информации и составления ИПТ представляют собою не «жесткие» и не знающие исключений закономерности, как это имеет место в точных науках или в химии, физике и других дисциплинах естественнонаучного профиля. Исключения из рассматриваемых правил обусловлены тем, что поскольку данные правила вырабатываются с учетом большого количества факторов в конкретных условиях разработки или эксплуатации информационных систем, не все они могут учитываться в полном объеме, и какие-то из критериев объективно являются (или оцениваются) как более важные и «весомые», чем другие. Отсюда -- и неизбежная субъективность и неоднозначность в конкретных решениях вопроса о терминологической разложимости/неразложимости языковых единиц в различных документальных системах. Литература 1. Соловушкова Г. Э., Пименов Е. Н., Амхир И. К. Опыт работы автоматизированной информационно-поисковой системы по огнеу- порам// Огнеупоры. -- 1989. -- № 3. -- C. 43 -- 48. 2. Horny K. Cataloging simplification: trends and prospects// Int. cat. and bibliogr. control. -- 1991. -- Vol. 20, № 3. -- C. 25 -- 28. 274 3. Пименов Е. Н. О факторах, влияющих на индексирование: индекси- рование и предметная область // НТИ. Сер.1. -- 2000. -- № 2. -- С. 15 -- 23. 4. ГОСТ 7.25--80. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления. Введен. 01.01.82 -- Изм.1. Вед. 01.07.87. 5. Воройский Ф. С. Аналитико-синтетическая обработка и переработка информации в автоматизированных системах НТИ: Основы органи- зации и технологии. (Учебное пособие). -- М.: ИПКИР, 1991. -- 289 с. 6. Воройский Ф. С. Некоторые пути повышения качества поисковых характеристик электронных каталогов// Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: Материалы конф., 1-9 июня 1996 г. -- М., 1996. -- С. 286 -- 289. 7. Воройский Ф. Индексирование документов в АБИС // Библиотека. -- 1996. -- № 9. -- C. 42 -- 44. 8. Садовска Я. Проблемы предметного поиска в on-line каталогах // Предметный поиск в традиционных и нетрадиционных информацион- но-поисковых системах. -- Вып.11 -- СПб: РНБ, 1994. -- С.108. 9. Методика индексирования запросов в АСНТИ-СМ: Методические рекомендации. -- М.: ВИИЭСМ, 1981. -- 15 с. 10. Мельчук И. А. О терминах «устойчивость» и «идиоматичность»// Вопросы языкознания. -- 1960. -- № 4. -- C. 73 -- 80. 11. ван Дейк Т А. Язык. Познание. Коммуникация: Сб. работ. -- M.: Прогресс, 1989. -- 312 с. 12. Методика индексирования документов по «Тезаурусу по атомной науке и технике» для системы автоматизированного распределения информа- ции. -- М: ЦНИИатоминформ, 1977. -- 49 с. 13. Ханжин А. Г. Разработка методики координатного индексирования информации. Часть 2 // НТИ. Сер.2. -- 1995. -- № 9. -- C. 14 -- 17. 14. Гринина Р Ф. К вопросу о соотношении дескрипторных и предметиза- ционных языков // Труды Гос. ин-та культуры им. Н. К. Крупской. -- XXIII -- Л., 1970. -- C. 53 -- 63.