Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 1 — Внемашинная информационная база автоматизированных библиотечно-информационных систем

Внемашинная информационная база автоматизированных библиотечно-информационных систем

Внемашинное информационное обеспечение включает различные документы на бумажных носителях (договора, приказы, распоряжения, отчеты, приходно-расходные ордера и др.).
   Всю информацию, которая используется в АС можно разделить на:

  • Нормативно-справочную;
  • Входную оперативную;
  • Производную, в том числе и статистическую.

   К нормативно-справочной информации относятся:

  • Системы классификации и кодирования (СКК) и классификаторы (Кл);
  • Стандарты;
  • Нормативные и руководящие документы;
  • И др.

   СКК — это способ разделения некоторого множества на классы и правила определения для каждого элемента каждого класса некоторого уникального идентификатора — кода.
   Наиболее распространенными являются следующие СКК:

  • Порядковая;
  • Иерархическая — дерево. Типичный пример — УДК;
  • Фасетная — по нескольким независимым признакам;
  • Смешанная.

   Кл бывают: международные; национальные; отраслевые; предприятия.
   Для того чтобы обеспечить эффективный поиск, обработку на ЭВМ и передачу по каналам связи технико-экономической информации, ее необходимо представить в цифровом виде. С этой целью ее нужно сначала упорядочить (классифицировать), а затем формализовать (закодировать) с использованием классификатора.
Классификация — это разделение множества объектов на подмножества по их сходству или различию в соответствии с принятыми методами. Классификация фиксирует закономерные связи между классами объектов. Под объектом понимается любой процесс, предмет или явление.
   Свойство или характеристика объекта классификации, которое позволяет установить его сходство или различие с другими объектами классификации, называется признаком классификации. Например, признак «роль предприятия-партнера в отношении деятельности объекта автоматизации» позволяет разделить все предприятия на две группы (на два подмножества): «поставщики» и «потребители». Множество или подмножество, объединяющее часть объектов классификации по одному или нескольким признакам, носит название классификационной группировки.
   Классификатор — это документ, с помощью которого осуществляется формализованное описание информации в ИС, содержащей наименования объектов, наименования классификационных группировок и их кодовые обозначения.
   По сфере действия выделяют следующие виды классификаторов: международные, общегосударственные (общесистемные), отраслевые и локальные классификаторы.
Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС) и обязательны для передачи информации между орга­низациями разных стран мирового сообщества.
Общегосударственные (общесистемные) классификаторы, обязательны для организации процессов передачи и обработки информации между экономическими системами государственного уровня внутри страны.
Отраслевые классификаторы используют для выполнения процедур обработки информации и передачи ее между организациями внутри отрасли.
Локальные классификаторы используют в пределах отдельных предприятий.
   Каждая система классификации характеризуется следующими свойствами:

  • гибкостью системы;
  • емкостью системы;
  • степенью заполненности системы.

Гибкость системы — это способность допускать включение новых признаков, объектов без разрушения структуры классификатора. Необходимая гибкость определяется временем жизни системы.
Емкость системы — это наибольшее количество классификационных группировок, допускаемое в данной системе классификации.
Степень заполненности системыопределяется как частное от деления фактического количества группировок на величину емкости системы.
Иерархическая классификация
   В настоящее время чаще всего применяются два типа систем классификации: иерархическая и многоаспектная.
   При использовании иерархического метода классификации происходит «последовательное разделение множества объектов на подчиненные, зависимые классификационные группировки». Получаемая на основе этого процесса классификационная схема имеет иерархическую структуру. В ней первоначальный объем классифицируемых объектов разбивается на подмножества по какому-либо признаку и детализируется на каждой следующей ступени классификации.
   Построение иерархической классификации объектов проходит в следующей последовательности:

  • определяется множество объектов, которое необходимо классифицировать для решения конкретных задач (множество заболеваний, медицинских учреждений, фармацевтических предприятий, простых медицинских услуг и т.д.);
  • выделяются основные признаки (свойства, характеристики, показатели, параметры и др.), по которым множество будет разделяться на подмножества;
  • выбирается порядок следования признаков — уровень деления;
  • определяется оптимальное количество уровней как с точки зрения удобства построения классификатора, так и с точки зрения удобства его дальнейшего практического применения.

   Наиболее важными правилами при построении иерархической классификации являются:

  • разделение множества на подмножества на каждом уровне производится только по одному признаку деления;
  • получаемые в результате деления группировки на каждом уровне относятся только к одной вышестоящей группировке и не пересекаются, т.е. не повторяются;
  • разделение множества осуществляется без пропусков очередного или добавления промежуточного уровня деления;
  • классификация производится таким образом, чтобы сумма образованных подмножеств составляла делимое множество.

   Наиболее существенными и сложными вопросами, возникающими при построении иерархической классификации, считаются выбор системы признаков, используемых в качестве основания деления, и определение порядка их следования. В основу иерархической классификации закладываются признаки, являющиеся необходимыми в решении конкретных задач, для которых она создается. При этом последовательность признаков определяется по принципу "от общего к частному" с учетом приоритетной вероятности обращений к разным уровням деления при решении конкретных задач.
Фасетная классификация
   Недостатки, отмеченные в иерархической системе, отсутствуют в других системах, которые относятся к классу многоаспектных систем классификации.
Аспект — точка зрения на объект классификации, который характеризуется одним или несколькими признаками. Многоаспектная система — это система классификации, которая использует параллельно несколько независимых признаков (аспектов) в качестве основания классификации. Существуют два типа многоаспектных систем: фасетная и дескрипторная. Фасет — это аспект классификации, который используется для образования независимых классификационных группировок. Дескриптор — ключевое слово, определяющее некоторое понятие, которое формирует описание объекта и дает принадлежность этого объекта к классу, группе и т.д.
   Под фасетным методом классификации понимается «параллельное разделение множества объектов на независимые классификационные группировки». При этом методе классификации заранее жесткой классификационной схемы и конечных группировок не создается. Разрабатывается лишь система таблиц признаков объектов классификации, называемых фасетами. При необходимости создания классификационной группировки для решения конкретной задачи осуществляется выборка необходимых признаков из фасетов и их объединение в определенной последовательности.
   Внутри фасета значения признаков могут просто перечисляться по некоторому порядку или образовывать сложную иерархическую структуру, если существует соподчиненность выделенных признаков.
   Последовательность построения фасетной классификации такая же, как и при построении иерархической классификации:

  • определяется множество объектов;
  • выделяются основные признаки и группы признаков этого множества;
  • выбирается порядок следования групп признаков (фасетов) и признаков — характеристик.

   Для вычленения из множества объектов конкретного подмножества, обладающего определенными признаками, необходимо:

  • выделить основные признаки (характеристики), всесторонне характеризующие объект и обеспечивающие его идентификацию;
  • сгруппировать их по принципу однородности в фасеты;
  • присвоить им коды;
  • определить фасетные формулы для образования подмножеств.

   При фасетном методе построения классификаторов подмножества формируются "от частного к общему", т.е. на основе различных наборов конкретных характеристик объекта формируются конкретные подмножества.
   Основными правилами при создании фасетной классификации являются:

  • признаки в различных фасетах не пересекаются, т.е. каждый признак отличается от другого по наименованию, значению и кодовому обозначению;
  • из общего числа фасетов, характеризующих множество объектов, выбираются фасеты, необходимые для решения поставленных задач, и устанавливается их строгая последовательность (фасетная формула).

   В современных классификационных схемах часто одновременно используются оба метода классификации. Это снижает влияние недостатков методов классификации и расширяет возможность использования классификаторов в информационном обеспечении управления.
   Для поиска показателей и документов по набору содержательных признаков используется информационный язык дескрипторного типа, которой характеризуется совокупностью терминов (дескрипторов) и набором отношений между терминами.
   Содержание документов или показателей можно достаточно полно и точно отразить с помощью списка ключевых слов — дескрипторов.
Дескриптор — это термин естественного языка (слово или словосочетание), используемый при описании документов или показателей, который имеет самостоятельный смысл и неделим без изменения своего значения.
   Для того чтобы обеспечить точность и однозначность поиска с помощью дескрипторного языка, необходимо предварительно определить все постоянные отношения между терминами: родовидовые, отношения синонимии, омонимии и полисемии, а также ассоциативные отношения.
   В процессе аналитико-синтетической переработки газетного текста «Казанских извecтий» описывалась информация каждой единицы содержания в соответствии с разработанной системой классификации. Систематизация содержания газеты осуществлялась последующим аспектам: виду информации, сфере общественной жизни, персонам (именам, встречающиеся в газете), учреждениям, географическим названиям мест, датам событий, приведенным в тексте. Внутри фасетов значения признаков либо просто перечисляются, либо образуют иерархическую структуру, если существует соподчиненность выделенных признаков.
  

Вы здесь: Главная Библиотечное дело Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 1