Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 4 — Семантическое кодирование информации

Семантическое кодирование информации

Термин “семантическое кодирование” возник в 60-х годах прошлого века в разработках, посвященных созданию баз данных, различных форм представления знаний, компьютерных методов обработки текстов, а также машинного перевода. Согласно А.М. Кондратову, семантический код — это особый “язык смысла”, в котором “из одних понятий — основных — должны выводиться другие”. Идея такого языка восходит к Г. Лейбницу, к его “универсальной характеристике”, т.е. к знаковой системе, с помощью которой возможно исчисление смыслов. По мнению Г. Лейбница, “все человеческие мысли вполне разрешаются на немногие, как бы первичные”. Если этим первичным понятиям будут “поставлены в соответствие характеры, то из них могли бы образовываться характеры производных понятий”.

Кодирование представляет собой образование по определенным правилам кодов присвоение их объекту или группе объектов, позволяющее заменить несколькими знаками (символами) наименования этих объектов. С помощью кодов обеспечивается идентификация объектов максимально коротким способом, т.е. с помощью минимального числа знаков. Минимизация количества знаков, идентифицирующих объекты, способствует повышению эффективности сбора, учета, хранения, обработки (анализа) информации.

Код — это символ, посредством которого объекты предметной области могут быть представлены с целью хранения в памяти ЭВМ и вывода информации на любой носитель.

В области машинной обработки информации различают два типа кодов: машинные и экономические.

Машинные коды используются для управления машиной и подачи команд. Это так называемые служебные коды.

Под экономическим кодом понимается код, используемый для представления разнообразной информации. Например, код профессии работника, код жилых зданий, код вида подземных коммуникаций и так далее.

Совокупность методов и правил кодирования объектов классификации называется системой кодирования.

Кодовое обозначение характеризуется:

· алфавитом кода;

· структурой кода;

· числом знаков — длиной кода;

· методом кодирования.

Алфавит кода представляет собой систему знаков (символов), составленных в определенном порядке, куда могут входить цифры, буквы и другие знаки, имеющиеся на клавиатуре печатающего устройства. Коды бывают цифровые, буквенные и смешанные — буквенно-цифровые.

Структура кода представляет собой, как правило, графическое изображение последовательности расположения знаков кода и соответствующие этим знакам наименования уровней деления. Обычно структура кода представляется в нормативном документе как "ХХ.ХХ".

Число знаков в коде определяется его структурой и зависит от количества объектов, входящих в подмножества, образуемые на каждом уровне деления. При определении числа знаков на каждом уровне деления необходимо иметь в виду возможность появления новых объектов и предусматривать резервные емкости кода.

Части кода разделяются между собой точкой, после последней цифры кода точка не ставится. Обозначение года в коде ставится в конце, отделяется дефисом и имеет емкость 4 знака, т.е. "ХХ.ХХ-20ХХ".

Методы кодирования в значительной степени связаны с методами разделения множества на подмножества. При разработке структуры кода важно выбрать оптимальное соотношение между уровнями деления и числом знаков в каждом разряде кода. При этом коды должны удовлетворять следующим основным требованиям:

однозначно идентифицировать объекты и (или) группы объектов, т.е. являться идентификаторами;

иметь минимальное число знаков (минимальную длину) и достаточное для кодирования всех объектов (признаков) заданного множества;

иметь достаточный резерв для кодирования вновь возникающих объектов кодируемого множества;

обеспечивать возможность автоматического контроля ошибок при вводе в компьютерные системы.

Вы здесь: Главная Библиотечное дело Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 4