Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 1 — Внемашинная информационная база автоматизированных библиотечно-информационных систем
- Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 1
- Общесистемные требования к разработке АБИС
- Информация как базовая категория информационного обеспечения
- Мировые и национальные информационные ресурсы
- Описание содержания информационных массивов
- Назначение информационных ресурсов
- Форма представления информации
- Информация, данные, знания
- Модели представления знаний
- Электронные информационные ресурсы
- Информационный рынок
- Общая характеристика информационной базы автоматизированной библиотечно-информационной системы
- Виды документов
- Внемашинная информационная база автоматизированных библиотечно-информационных систем
- Вид информации
- Машинная информационная база АБИС
- Информационная база и способы ее организации
Внемашинное информационное обеспечение включает различные документы на бумажных носителях (договора, приказы, распоряжения, отчеты, приходно-расходные ордера и др.).
Всю информацию, которая используется в АС можно разделить на:
- Нормативно-справочную;
- Входную оперативную;
- Производную, в том числе и статистическую.
К нормативно-справочной информации относятся:
- Системы классификации и кодирования (СКК) и классификаторы (Кл);
- Стандарты;
- Нормативные и руководящие документы;
- И др.
СКК — это способ разделения некоторого множества на классы и правила определения для каждого элемента каждого класса некоторого уникального идентификатора — кода.
Наиболее распространенными являются следующие СКК:
- Порядковая;
- Иерархическая — дерево. Типичный пример — УДК;
- Фасетная — по нескольким независимым признакам;
- Смешанная.
Кл бывают: международные; национальные; отраслевые; предприятия.
Для того чтобы обеспечить эффективный поиск, обработку на ЭВМ и передачу по каналам связи технико-экономической информации, ее необходимо представить в цифровом виде. С этой целью ее нужно сначала упорядочить (классифицировать), а затем формализовать (закодировать) с использованием классификатора.
Классификация — это разделение множества объектов на подмножества по их сходству или различию в соответствии с принятыми методами. Классификация фиксирует закономерные связи между классами объектов. Под объектом понимается любой процесс, предмет или явление.
Свойство или характеристика объекта классификации, которое позволяет установить его сходство или различие с другими объектами классификации, называется признаком классификации. Например, признак «роль предприятия-партнера в отношении деятельности объекта автоматизации» позволяет разделить все предприятия на две группы (на два подмножества): «поставщики» и «потребители». Множество или подмножество, объединяющее часть объектов классификации по одному или нескольким признакам, носит название классификационной группировки.
Классификатор — это документ, с помощью которого осуществляется формализованное описание информации в ИС, содержащей наименования объектов, наименования классификационных группировок и их кодовые обозначения.
По сфере действия выделяют следующие виды классификаторов: международные, общегосударственные (общесистемные), отраслевые и локальные классификаторы.
Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС) и обязательны для передачи информации между организациями разных стран мирового сообщества.
Общегосударственные (общесистемные) классификаторы, обязательны для организации процессов передачи и обработки информации между экономическими системами государственного уровня внутри страны.
Отраслевые классификаторы используют для выполнения процедур обработки информации и передачи ее между организациями внутри отрасли.
Локальные классификаторы используют в пределах отдельных предприятий.
Каждая система классификации характеризуется следующими свойствами:
- гибкостью системы;
- емкостью системы;
- степенью заполненности системы.
Гибкость системы — это способность допускать включение новых признаков, объектов без разрушения структуры классификатора. Необходимая гибкость определяется временем жизни системы.
Емкость системы — это наибольшее количество классификационных группировок, допускаемое в данной системе классификации.
Степень заполненности системыопределяется как частное от деления фактического количества группировок на величину емкости системы.
Иерархическая классификация
В настоящее время чаще всего применяются два типа систем классификации: иерархическая и многоаспектная.
При использовании иерархического метода классификации происходит «последовательное разделение множества объектов на подчиненные, зависимые классификационные группировки». Получаемая на основе этого процесса классификационная схема имеет иерархическую структуру. В ней первоначальный объем классифицируемых объектов разбивается на подмножества по какому-либо признаку и детализируется на каждой следующей ступени классификации.
Построение иерархической классификации объектов проходит в следующей последовательности:
- определяется множество объектов, которое необходимо классифицировать для решения конкретных задач (множество заболеваний, медицинских учреждений, фармацевтических предприятий, простых медицинских услуг и т.д.);
- выделяются основные признаки (свойства, характеристики, показатели, параметры и др.), по которым множество будет разделяться на подмножества;
- выбирается порядок следования признаков — уровень деления;
- определяется оптимальное количество уровней как с точки зрения удобства построения классификатора, так и с точки зрения удобства его дальнейшего практического применения.
Наиболее важными правилами при построении иерархической классификации являются:
- разделение множества на подмножества на каждом уровне производится только по одному признаку деления;
- получаемые в результате деления группировки на каждом уровне относятся только к одной вышестоящей группировке и не пересекаются, т.е. не повторяются;
- разделение множества осуществляется без пропусков очередного или добавления промежуточного уровня деления;
- классификация производится таким образом, чтобы сумма образованных подмножеств составляла делимое множество.
Наиболее существенными и сложными вопросами, возникающими при построении иерархической классификации, считаются выбор системы признаков, используемых в качестве основания деления, и определение порядка их следования. В основу иерархической классификации закладываются признаки, являющиеся необходимыми в решении конкретных задач, для которых она создается. При этом последовательность признаков определяется по принципу "от общего к частному" с учетом приоритетной вероятности обращений к разным уровням деления при решении конкретных задач.
Фасетная классификация
Недостатки, отмеченные в иерархической системе, отсутствуют в других системах, которые относятся к классу многоаспектных систем классификации.
Аспект — точка зрения на объект классификации, который характеризуется одним или несколькими признаками. Многоаспектная система — это система классификации, которая использует параллельно несколько независимых признаков (аспектов) в качестве основания классификации. Существуют два типа многоаспектных систем: фасетная и дескрипторная. Фасет — это аспект классификации, который используется для образования независимых классификационных группировок. Дескриптор — ключевое слово, определяющее некоторое понятие, которое формирует описание объекта и дает принадлежность этого объекта к классу, группе и т.д.
Под фасетным методом классификации понимается «параллельное разделение множества объектов на независимые классификационные группировки». При этом методе классификации заранее жесткой классификационной схемы и конечных группировок не создается. Разрабатывается лишь система таблиц признаков объектов классификации, называемых фасетами. При необходимости создания классификационной группировки для решения конкретной задачи осуществляется выборка необходимых признаков из фасетов и их объединение в определенной последовательности.
Внутри фасета значения признаков могут просто перечисляться по некоторому порядку или образовывать сложную иерархическую структуру, если существует соподчиненность выделенных признаков.
Последовательность построения фасетной классификации такая же, как и при построении иерархической классификации:
- определяется множество объектов;
- выделяются основные признаки и группы признаков этого множества;
- выбирается порядок следования групп признаков (фасетов) и признаков — характеристик.
Для вычленения из множества объектов конкретного подмножества, обладающего определенными признаками, необходимо:
- выделить основные признаки (характеристики), всесторонне характеризующие объект и обеспечивающие его идентификацию;
- сгруппировать их по принципу однородности в фасеты;
- присвоить им коды;
- определить фасетные формулы для образования подмножеств.
При фасетном методе построения классификаторов подмножества формируются "от частного к общему", т.е. на основе различных наборов конкретных характеристик объекта формируются конкретные подмножества.
Основными правилами при создании фасетной классификации являются:
- признаки в различных фасетах не пересекаются, т.е. каждый признак отличается от другого по наименованию, значению и кодовому обозначению;
- из общего числа фасетов, характеризующих множество объектов, выбираются фасеты, необходимые для решения поставленных задач, и устанавливается их строгая последовательность (фасетная формула).
В современных классификационных схемах часто одновременно используются оба метода классификации. Это снижает влияние недостатков методов классификации и расширяет возможность использования классификаторов в информационном обеспечении управления.
Для поиска показателей и документов по набору содержательных признаков используется информационный язык дескрипторного типа, которой характеризуется совокупностью терминов (дескрипторов) и набором отношений между терминами.
Содержание документов или показателей можно достаточно полно и точно отразить с помощью списка ключевых слов — дескрипторов.
Дескриптор — это термин естественного языка (слово или словосочетание), используемый при описании документов или показателей, который имеет самостоятельный смысл и неделим без изменения своего значения.
Для того чтобы обеспечить точность и однозначность поиска с помощью дескрипторного языка, необходимо предварительно определить все постоянные отношения между терминами: родовидовые, отношения синонимии, омонимии и полисемии, а также ассоциативные отношения.
В процессе аналитико-синтетической переработки газетного текста «Казанских извecтий» описывалась информация каждой единицы содержания в соответствии с разработанной системой классификации. Систематизация содержания газеты осуществлялась последующим аспектам: виду информации, сфере общественной жизни, персонам (именам, встречающиеся в газете), учреждениям, географическим названиям мест, датам событий, приведенным в тексте. Внутри фасетов значения признаков либо просто перечисляются, либо образуют иерархическую структуру, если существует соподчиненность выделенных признаков.