Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 4 — Технология формирования документографических баз данных
- Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 4
- Семантическое кодирование информации
- Две группы методов, используемых в системе кодирования
- Регистрационное кодирование
- Общая технология формирования баз данных АБИС
- Модели данных
- Реляционная база данных
- Процедура проектирования
- Структурирование информации в базах данных
- Операции реляционной алгебры
- Технология формирования документографических баз данных
- Технология формирования фактографических баз данных
- Технологии создания электронных документов
- Технологии создания web-сайтов автоматизированных библиотечно-информационных систем
- Состав и содержание работ по проектированию информационного обеспечения АБИС
- Реально сложившаяся практика проектирования АС
- Нормативно-справочная база проектирования информационного обеспечения АБИС
Документографические БД содержат описания документов. В зависимости от содержания описания различают документографические БД типов БО (только библиографическое описание документа), БК (библиографическое описание и ключевые слова) и БКР (библиографическое описание, ключевые слова, реферат или аннотация). Появились также полнотекстовые БД, содержащие полные тексты документов, которые являются собственно документальными.
Документографические системы, как правило, строятся по двуконтурной схеме: первый контур содержит документографическую БД и используется для автоматизированного поиска документов, второй контур в случае необходимости обеспечивает выдачу полного текста документа в виде копии первоисточника на бумаге, микрофильме или выводит текст на экран с оптического диска (в некоторых случаях с жесткого магнитного диска большой емкости).
В составе данного класса выделены следующие виды БД:
· по публикуемым научно-техническим документам;
· по публикуемым документам в области общественных наук;
· по патентным документам;
· по отчетам по НИР, ОКР, программным средствам;
· по материалам межотраслевого обмена (научно-техническим достижениям, ППТО, ИЛ, каталожная, выставочная информация и т.п.);
· по стандартам и другой нормативно-технической документации;
· библиографические БД, создаваемые в библиотеках, книгоиздательских и книготорговых организациях;
· реферативные и полнотекстовые БД по общественно-политической информации, создаваемые средствами массовой информации;
· БД законодательной и правовой информации;
· документографические по специальным видам документов;
· БД по архивным документам. Анализ состояния дел с ДБД различных видов в стране показывает, что в настоящее время наибольшее развитие получили ДБД документографического типа, главным образом, по опубликованным документам в области научнотехнической информации, общественных наук, патентным документам, отчетам по НИР, ОКР и другим видам документов, созданные в рамках системы научно-технической информации.
В системе НТИ создан распределенный автоматизированный банк данных (РБнД) общим объемом более 20 млн. записей.
Порядка 30-40% записей относятся к отечественным первоисточникам, остальные — к зарубежным. В рамках РБнД созданы абонентские сети удаленных пользователей, охватывающие все столицы союзных республик и основные областные центры.
Доступ к БД предоставляется частями по жесткому расписанию. Доля одновременно доступных БД составляет 20% общего объема БнД системы НТИ.
РБнД поддержан вторым контуром, обеспечивающим выдачу пользователям исходных текстов документов. Однако функционирование второго контура системы НТИ в настоящее время не соответствует современным требованиям, так как не обеспечивает гарантированного получения копии любого первоисточника в приемлемые сроки.
Не в полной мере соответствует современным требованиям и актуальность записей в РБнД системы НТИ, так как сроки поступления первоисточников в России, обработки их и ввода в БД в совокупности составляют несколько месяцев.
К документографическим БД НТИ тесно примыкают библиографические БД, создаваемые в библиотеках, книгоиздательских и книготорговых организациях.
Функции этих систем совпадают почти полностью, что делает целесообразным их объединение.
Крупным недостатком сложившейся системы следует признать полное отсутствие полнотекстовых БД научно-технической информации, в особенности, полнотекстовых БД стандартов и нормативно-технической документов. Однако широкое распространение полнотекстовых БД общенормативного и нормативно-правового характера радует.
Средствами массовой информации (в основном центральны ми) создан и ведется ряд БнД по общественно-политической информации. Основная проблема БнД средств массовой информации заключается в полном отсутствии координации их создания и ведения, откуда проистекает разнобой в технологии, технических решениях, подходах к отбору и обработке информации.
Документографические БД по специальным видам документов функционируют для документов следующих видов:
1. Картографические документы — в ГБЛ и ГУГК. Эти документографические БД представляют собой, в сущности, обычные библиографические БД. В настоящее время объем совокупного БнД картографических документов незначителен.
2. Чертежно-конструкторские и проектные документы. Документографические БД по документам этого вида существуют на отдальных предприятиях, где они разрабатываются, как правило, самостоятельно с использованием имеющихся программно-аппаратных средств. В результате полученные массивы, как правило, не совместимы между собой. Кроме того, эти массивы создаются в интересах управления деятельностью самого предприятия, и заинтересованность предприятия-генератора в предоставлении доступа к ним внешних потребителей обычно отсутствуют.
По-видимому, в настоящее время вопрос о включении этих документов в систему БД и БнД не стоит.
3. Аудиовизуальные документы. В телекомпаниях существует документографическая БД по аудиовизуальным документам Центрального телевидения, используемая в интересах этих организаций. Теледоступ внешних потребителей к этой БД технически осуществим, но в настоящее время не предусматривается руководством этой организации. Формирование документографического БнД по архивным документам фактически только началось. Основная проблема в этом виде БнД состоит в очень большом объеме данных, подлежащих переработке и вводу в БнД, что потребует больших затрат и длительного времени. Задача облегчается наличием четкой структуры архивных органов и существованием координации этой работы между ними.
В целом можно отметить, что в стране существует несколько отдельных, не связанных между собой систем документографических БнД и отдельных БД этого класса, между которыми не всегда обеспечивается совместимость даже по данным. Планомерное и скоординированное развитие таких систем можно отметить только внутри следующих подсистем: документов научно-технической информации; по общественным наукам; патентных документов; отчетных документов; документов межотраслевого обмена; стандартов и нормативно- технической документов; законодательных документов; архивных документов. Между этими подсистемами координация слаба или отсутствует.
В других подсистемах нет и внутренней координации. Вместе с тем, и в тех подсистемах, которые развиваются планомерно, имеет место совершенно неоправданное дублирование функций, связанное с искусственным разделением информационных потоков по отрасли-источнику на общие документальные потоки и потоки группы отраслей промышленности. Применительно к открытой информации такое разделение излишне (а другая информация не относится к области рассмотрения настоящей концепции).
Сопоставление состояния дел в стране и за рубежом в области документографических БнД позволяет также отметить отсутствие или слабое развитие, неорганизованность и разрозненность в России некоторых видов документографических и документальных БнД, в том числе:
· ДБнД обзорной и прогнозной экономической информации;
· ДБнД по научным статьям с индексами цитирования;
· ДБнД по правительственным документам незаконодательного характера (заявлениям, сообщениям для прессы, выступлениям государственных деятелей и т.п.);
· ДБнД по программному обеспечению;
· ДБнД деловой и коммерческой информации;
· ДБнД по зарегистрированным торговым маркам и другие.