Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 4 — Технология формирования документографических баз данных

 Технология формирования документографических баз данных

Документографические БД содержат описания документов. В зависимости от содержания описания различают документографические БД типов БО (только библиографическое описание документа), БК (библиографическое описание и ключевые слова) и БКР (библиографическое описание, ключевые слова, реферат или аннотация). Появились также полнотекстовые БД, содержащие полные тексты документов, которые являются собственно документальными.

Документографические системы, как правило, строятся по двуконтурной схеме: первый контур содержит документографическую БД и используется для автоматизированного поиска документов, второй контур в случае необходимости обеспечивает выдачу полного текста документа в виде копии первоисточника на бумаге, микрофильме или выводит текст на экран с оптического диска (в некоторых случаях с жесткого магнитного диска большой емкости).

В составе данного класса выделены следующие виды БД:

· по публикуемым научно-техническим документам;

· по публикуемым документам в области общественных наук;

· по патентным документам;

· по отчетам по НИР, ОКР, программным средствам;

· по материалам межотраслевого обмена (научно-техническим достижениям, ППТО, ИЛ, каталожная, выставочная информация и т.п.);

· по стандартам и другой нормативно-технической документации;

· библиографические БД, создаваемые в библиотеках, книгоиздательских и книготорговых организациях;

· реферативные и полнотекстовые БД по общественно-политической информации, создаваемые средствами массовой информации;

· БД законодательной и правовой информации;

· документографические по специальным видам документов;

· БД по архивным документам. Анализ состояния дел с ДБД различных видов в стране показывает, что в настоящее время наибольшее развитие получили ДБД документографического типа, главным образом, по опубликованным документам в области научнотехнической информации, общественных наук, патентным документам, отчетам по НИР, ОКР и другим видам документов, созданные в рамках системы научно-технической информации.

В системе НТИ создан распределенный автоматизированный банк данных (РБнД) общим объемом более 20 млн. записей.

Порядка 30-40% записей относятся к отечественным первоисточникам, остальные — к зарубежным. В рамках РБнД созданы абонентские сети удаленных пользователей, охватывающие все столицы союзных республик и основные областные центры.

Доступ к БД предоставляется частями по жесткому расписанию. Доля одновременно доступных БД составляет 20% общего объема БнД системы НТИ.

РБнД поддержан вторым контуром, обеспечивающим выдачу пользователям исходных текстов документов. Однако функционирование второго контура системы НТИ в настоящее время не соответствует современным требованиям, так как не обеспечивает гарантированного получения копии любого первоисточника в приемлемые сроки.

Не в полной мере соответствует современным требованиям и актуальность записей в РБнД системы НТИ, так как сроки поступления первоисточников в России, обработки их и ввода в БД в совокупности составляют несколько месяцев.

К документографическим БД НТИ тесно примыкают библиографические БД, создаваемые в библиотеках, книгоиздательских и книготорговых организациях.

Функции этих систем совпадают почти полностью, что делает целесообразным их объединение.

Крупным недостатком сложившейся системы следует признать полное отсутствие полнотекстовых БД научно-технической информации, в особенности, полнотекстовых БД стандартов и нормативно-технической документов. Однако широкое распространение полнотекстовых БД общенормативного и нормативно-правового характера радует.

Средствами массовой информации (в основном центральны ми) создан и ведется ряд БнД по общественно-политической информации. Основная проблема БнД средств массовой информации заключается в полном отсутствии координации их создания и ведения, откуда проистекает разнобой в технологии, технических решениях, подходах к отбору и обработке информации.

Документографические БД по специальным видам документов функционируют для документов следующих видов:

1. Картографические документы — в ГБЛ и ГУГК. Эти документографические БД представляют собой, в сущности, обычные библиографические БД. В настоящее время объем совокупного БнД картографических документов незначителен.

2. Чертежно-конструкторские и проектные документы. Документографические БД по документам этого вида существуют на отдальных предприятиях, где они разрабатываются, как правило, самостоятельно с использованием имеющихся программно-аппаратных средств. В результате полученные массивы, как правило, не совместимы между собой. Кроме того, эти массивы создаются в интересах управления деятельностью самого предприятия, и заинтересованность предприятия-генератора в предоставлении доступа к ним внешних потребителей обычно отсутствуют.

По-видимому, в настоящее время вопрос о включении этих документов в систему БД и БнД не стоит.

3. Аудиовизуальные документы. В телекомпаниях существует документографическая БД по аудиовизуальным документам Центрального телевидения, используемая в интересах этих организаций. Теледоступ внешних потребителей к этой БД технически осуществим, но в настоящее время не предусматривается руководством этой организации. Формирование документографического БнД по архивным документам фактически только началось. Основная проблема в этом виде БнД состоит в очень большом объеме данных, подлежащих переработке и вводу в БнД, что потребует больших затрат и длительного времени. Задача облегчается наличием четкой структуры архивных органов и существованием координации этой работы между ними.

В целом можно отметить, что в стране существует несколько отдельных, не связанных между собой систем документографических БнД и отдельных БД этого класса, между которыми не всегда обеспечивается совместимость даже по данным. Планомерное и скоординированное развитие таких систем можно отметить только внутри следующих подсистем: документов научно-технической информации; по общественным наукам; патентных документов; отчетных документов; документов межотраслевого обмена; стандартов и нормативно- технической документов; законодательных документов; архивных документов. Между этими подсистемами координация слаба или отсутствует.

В других подсистемах нет и внутренней координации. Вместе с тем, и в тех подсистемах, которые развиваются планомерно, имеет место совершенно неоправданное дублирование функций, связанное с искусственным разделением информационных потоков по отрасли-источнику на общие документальные потоки и потоки группы отраслей промышленности. Применительно к открытой информации такое разделение излишне (а другая информация не относится к области рассмотрения настоящей концепции).

Сопоставление состояния дел в стране и за рубежом в области документографических БнД позволяет также отметить отсутствие или слабое развитие, неорганизованность и разрозненность в России некоторых видов документографических и документальных БнД, в том числе:

· ДБнД обзорной и прогнозной экономической информации;

· ДБнД по научным статьям с индексами цитирования;

· ДБнД по правительственным документам незаконодательного характера (заявлениям, сообщениям для прессы, выступлениям государственных деятелей и т.п.);

· ДБнД по программному обеспечению;

· ДБнД деловой и коммерческой информации;

· ДБнД по зарегистрированным торговым маркам и другие.

Вы здесь: Главная Библиотечное дело Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 4