Сукиасян Э.Р.
Школа индексирования. Занятие 2. Сущность, объект, условия, принципы индексирования
[ Библиотека. 2004. № 3. С. 51-53 ]
Мы продолжаем наши занятия в Школе индексирования с комментированного изложения раздела 4 «Общие положения» ГОСТ 7.59—2003. Но прежде всего нам надо повторить стандартизованную терминологию. Начнем с наиболее общих понятий. Термины выделены курсивным шрифтом, после определения в скобках указывается номер стандарта, за косой чертой номер конкретного пункта. Если после термина при ведена аббревиатура, то он также является стандартизованной и в дальнейшем будет широко использоваться нами.
Информационная потребность определяется как характеристики предметной области, значения которых необходимо установить для выполнения поставленной задачи в практической деятельности (ГОСТ 7.73—96 / п. 3.4.11). Текст, выражающий информационную потребность, называется информационным запросом (там же, п. 3.4.12).
Информационный поиск действия, методы и процедуры, позволяющие отобрать определенную информацию из массива данных (там же, п. 3.1.3). Информационно-поисковый язык, ИПЯ формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов для последующего хранения и поиска (ГОСТ 7.74— 96/П.2.1).
Лексическая единица ИПЯ, ЛЕ обозначение отдельного понятия, принятое в ИПЯ и неделимое в этой функции (ГОСТ 7.74—96 / п. 3.1.1). Здесь же в примечании поясняется, что ЛЕ могут представлять собой принятые в естественном языке слова, устойчивые словосочетания, аббревиатуры, символы, даты, общепринятые сокращения, лексически значимые компоненты сложных слов, а также эквивалентные им кодовые или символические обозначения искусственного языка, например коды классов классификационной системы (классификационные индексы).
Поисковый образ так называется текст, состоящий из ЛЕ ИПЯ, выражающий содержание документа или информационного запроса и предназначенный для реализации информационного поиска (ГОСТ 7.74—96 / п. 7.10). Различаются два вида поисковых образов. Поисковый образ документа, ПОД, выражает основное смысловое содержание документа (там же, п. 7.11), а поисковый образ запроса, ПОЗ, смысловое содержание информационного запроса (там же, п. 7.12). Впрочем, все мы знаем, что информационный поиск состоит не в простом сопоставлении ПОД и ПОЗ. Поэтому надо ввести еще один термин: поисковое предписание текст, включающий ПОЗ и указания о логических операциях, подлежащих выполнению в процессе информационного поиска (там же, п. 7.13).
Осталось ввести еще один обобщающий термин, который для нас, в России, оказался одним из наиболее сложных для усвоения и понимания. В МС ИСО он представлен как «indexing term», в ГОСТ 7.76—96 / п. 5.3 принят как термин индексирования (одна или несколько связанных лексических единиц, представленных в поисковом образе документа и оформленных по правилам определенного ИПЯ). Рассматривался вариант «индексирующий термин», но был отвергнут, так как сам по себе этот «термин» ничего не индексирует… Опережая план наших занятий, могу пояснить, что классификационные индексы или предметные рубрики и есть, например, термины индексирования.
Общие положения ГОСТ 7.59 открываются п. 4.1, где формулируется задача индексирования как совокупности процессов и операций, результатом которых является формирование ПОД документа в виде терминов индексирования, а конечной целью эффективный информационный поиск:
4.1. При индексировании следует представлять с необходимой и достаточной полнотой и точностью в поисковом образе документа (ПОД) в виде терминов индексирования основное содержание документа, а при необходимости его форму и назначение (далее содержание документа) для обеспечения эффективного информационного поиска.
Сразу обратим внимание: задача организации фонда при систематической его расстановке здесь даже не упоминается. И это, наверное, правильно: далеко не во всех случаях она решается средствами индексирования (например, при использовании формальных (нумерационных или форматных) способов организации фонда). В учебниках и пособиях ранее часто говорилось «о двуединой задаче систематизации», при этом имелись в виду каталог и фонд. Положение несколько спорное: почему же не «триединой» ведь учет и статистика книговыдачи также связаны с систематизацией документов? Все-таки первичным является содержание документа и, соответственно, поиск с учетом содержания.
4.2. Объектом индексирования является отдельный документ, его составная часть или совокупность документов (далее документ).
Понятие объекта индексирования (также, как и объекта каталогизации) одно из наиболее принципиальных. В качестве объекта индексирования могут рассматриваться различные виды документов: книги и брошюры; сериальные издания периодические (газеты и журналы) и продолжающиеся (труды, ученые записки и пр.); изоиздания; картографические произведения, представленные как изданиями (атласами, картами, планами), так и произведениями» глобусами, рельефными картами и пр.; нотные издания; кинофотофоно-документы диапозитивы, слайды, кинофильмы, магнитные записи, грампластинки, видеофильмы; документы на микроносителях микрофишах и микрофильмах (как оригиналы, так и копии изданий); электронные ресурсы удаленного и локального доступа; неопубликованные документы (только в том случае, если они проводятся через инвентарный учет и включаются в библиотечный фонд на постоянное хранение).
Объект индексирования устанавливается на этапе составления библиографической записи документа. По ГОСТ 7.76 / п. 3.2 библиографическая запись элемент библиографической информации, фиксирующий в документальной форме сведения о документе, позволяющие его идентифицировать, раскрыть его состав и содержание для библиографического поиска. Аббревиатура БЗ в ГОСТе не стандартизована, но она широко применяется в учебной и методической литературе, поэтому мы в дальнейшем будем ее использовать. В примечании поясняется: в состав БЗ входит библиографическое описание, дополняемое по мере надобности заголовком, терминами индексирования (классификационными индексами и предметными рубриками), аннотацией (рефератом), шифром хранения документа, справками о добавочных БЗ, датой завершения обработки документа, сведениями служебного характера.
Приступая к содержательному анализу документа, сотрудник библиотеки, осуществляющий индексирование, предварительно знакомится с БЗ (она может быть представлена лишь библиографическим описанием, но, как правило, любой документ, поступающий на обработку, уже имеет инвентарный или регистрационный номер).
Традиционная особенность отечественной практики каталогизации функциональное разделение труда: как правило, одни сотрудники занимаются составлением библиографического описания и заголовка БЗ, другие систематизацией и предметизацией. Есть немало аргументов в пользу последовательного перехода к принятой во всем мире практике, когда всеми каталогизационными процессами занимается один специалист. Так, некоторые особенности отражения многотомных изданий в системе каталогов библиотеки не могут быть приняты во внимание на этапе составления сводной БЗ (по ГОСТ 7.1—2003 она называется многоуровневой): нужно достаточно хорошо представлять себе, каковы будут результаты индексирования не только издания в целом, но и каждого тома в отдельности. Возможно, в зависимости от оформления и содержания тома, придется составить БЗ на частное заглавие отдельного тома (или всех томов многотомника). Иногда целесообразно применить методы аналитической систематизации (например, чтобы дополнительно отразить объемную вступительную статью или очень ценный библиографический аппарат). Решения подобного характера принимают при индексировании. Если процессы составления библиографического описания слишком изолированы от индексирования, они воспринимаются как «пожелания» и, как правило, не реализуются. Страдает читатель: содержание документа отражается в системе каталогов далеко не полностью.
4.3 Индексирование должно проводиться на основе непосредственного анализа документа с учетом характера информационно-поискового массива, элементом которого становится ПОД, характера информационных потребностей пользователей данной информационно-поисковой системы (ИПС), в соответс-вии с общими принципами индексирования и особенностями их применения в конкретной организации.
К этому пункту стандарта надо дать необходимые терминологические пояснения. Информационно-поисковая система, ИПС, совокупность справочно-информационного фонда и технических средств информационного поиска в нем (ГОСТ 7.73—96 / п. 3.2.1). Справочно-информационный фонд, СИФ совокупность информационных массивов и связанного с ними справочно-поискового аппарата, предназначенная для справочно-поискового обслуживания (там же, п. 3.1.10). Справочно-поисковый аппарат совокупность информационно-поисковых массивов, содержащих данные об адресах хранения в информационно-поисковой системе документов с определенными поисковыми образами документов (там же, п. 3.1.5). Обратим внимание: аббревиатура СП А в ГОСТе не стандартизована, однако активно применяется в литературе, мы ее будем использовать. Есть и другой, знакомый нам термин: Справочно-библиографический аппарат, ОБА, СПА, включающий библиографические пособия (ГОСТ 7.0—99 / 3.3.2.48).
В п. 4.3 стандарта регламентируется важнейшее условие индексирования непосредственный анализ документа. Об этом же говорит латинское выражение de visu. Увы, это положение порой нарушается! Есть случаи, когда вместо документа на индексирование поступает БЗ или ксерокопия его титульного листа, а иногда индексирование происходит… по телефону. О возможных ошибках говорить не приходится.
Другое важное условие учет особенностей своей библиотеки, информационных потребностей ее читателей, особенностей создаваемых в библиотеке каталогов и картотек (это и есть СПА), наконец общих принципов индексирования, изложенных в практических пособиях, в общей методике систематизации и предметизации.
4.4. Ниже рассматриваются два принципа индексирования классификационный и предметизационный. Принципы координатного индексирования определяются ГОСТ 7.66—92.
4.4.1. Классификационный принцип индексирования базируется на представлении содержания документа в некоторой специально разработанной классификационной системе и использовании в качестве терминов индексирования классификационных индексов, в которых отношения между классами этой системы выражены в явном виде.
Примечание: классификационный принцип индексирования обеспечивает возможность организации информационного поиска по иерархическому признаку.
4.4 2. Предметизационный принцип индексирования базируется на представлении содержания документа в понятийной системе определенного естественного языка и на использовании в качестве терминов индексирования лексических единиц (ЛЕ) естественного языка.
Примечание: предметизационный принцип индексирования обеспечивает возможность организации информационного поиска по алфавитному признаку.
4.5. В зависимости от того, какой принцип индексирования ведущий (или единственный), различают классификационные и предметизационные информационно-поисковые языки (ИПЯ). В соответствии с характером ИПЯ индексирование осуществляется как систематизация или предметизация, а в качестве терминов индексирования используют, соответственно, классификационные индексы или предметные рубрики.
Понятие «принцип индексирования» введено в ГОСТ 7.59— 2003 для того, чтобы с его помощью провести дифференциацию в рамках индексирования на уровне самых общих понятий и представлений:
На следующем занятии мы рассмотрим общие требования к ИПЯ. После двух занятий мы должны хорошо понимать значение 14 стандартизованных терминов и запомнить ряд введенных аббревиатур (БЗ, ПОЗ, ПОД, ИПС, ИПЯ, ЛЕ, СИФ, СБА, СПА).