Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 1 — Назначение информационных ресурсов
- Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 1
- Общесистемные требования к разработке АБИС
- Информация как базовая категория информационного обеспечения
- Мировые и национальные информационные ресурсы
- Описание содержания информационных массивов
- Назначение информационных ресурсов
- Форма представления информации
- Информация, данные, знания
- Модели представления знаний
- Электронные информационные ресурсы
- Информационный рынок
- Общая характеристика информационной базы автоматизированной библиотечно-информационной системы
- Виды документов
- Внемашинная информационная база автоматизированных библиотечно-информационных систем
- Вид информации
- Машинная информационная база АБИС
- Информационная база и способы ее организации
В Национальном докладе "Информационные ресурсы России" указывается, что основной проблемой российской информационной индустрии является громадный разрыв между большим объемом созданных в России ИР и низким уровнем их использования.
В соответствии с результатами статистического обследования информационных ресурсов средний коэффициент использования (т. е. число инсталляций или коллективных пользователей) для российских БД составляет около 2, в то время как для западных БД он превышает 10. При этом примерно половина российских БД используется только самими их создателями.
Задача повышения эффективности ИР заключается именно в расширении их использования как в форме товара продуктов, так и в форме общественного продукта. Поэтому определение назначения ИР является важным инструментом управления ими.
Опыт показывает, что владельцы ИР, особенно государственные, склонны преуменьшать возможности общественного использования, рассматривая их как ресурсы внутрикорпоративного или внутриведомственного предназначения. Это связано и со стремлением к монопольному владению информацией, и с нежеланием нести затраты на обеспечение общественного доступа к ИР, и с другими факторами, препятствующими открытому доступу к информации.
Поэтому для определения назначения ИР необходима разработка объективных критериев, основанных на изучении их содержания и анализе общественных потребностей. Основа для разработки таких критериев заложена в законе "Об информации, информатизации и защите информации", где определены некоторые категории ИР, для которых запрещено устанавливать ограничения на доступ.
Это относится к законодательной информации, сведениям, необходимым для безопасности граждан и населения в целом, к информации о деятельности органов власти и местного самоуправления. К данной категории отнесены также "документы, накапливаемые в открытых фондах библиотек и архивов, информационных системах органов государственной власти, органов местного самоуправления, общественных объединений, организаций, представляющие общественный интерес или необходимые для реализации прав, свобод и обязанностей граждан" (ст, 10, п. 3).
Очевидно, что эта последняя норма носит слишком общий характер. Определить, какие документы, принадлежащие организациям, представляют общественный интерес, весьма и весьма непросто. Здесь неизбежен конфликт интересов общества и конкретных владельцев ИР, поэтому необходим механизм установления общественной значимости ИР, вырабатываемый самим обществом.
Классификация информационных ресурсов
Что касается классификации ИР по назначению, то детальной общепринятой классификации такого рода не существует. В аналитических исследованиях более или менее регулярно применяется деление ИР по этому признаку на четыре класса:
- ИР для управления (регистры, кадастры, организационно-распорядительная информация и др.);
- ИР профессиональные (НТИ, геологическая, экологическая, медицинская информация и др.);
- ИР для бизнеса (фондовый рынок, валютные курсы, недвижимость);
- ИР массовые (новости, искусство, развлечения, спорт).
Деление это достаточно условное. Например, не очень ясно, к каким классам нужно относить правовую, образовательную информацию и многие другие виды ИР.
Объем информационных ресурсов
Возьмем три наиболее распространенные формы информационных массивов: библиотечные и архивные фонды, обычные БД (документографические и фактографические). Во всех случаях методики, принятые для измерения этих массивов, несоизмеримы между собой.
В архивах принята следующая система. Архив как организация включает несколько архивных фондов (основная единица учета на макроуровне), которые могут разделяться в диахроническом измерении на описи. Архивные фонды состоят из множества дел (т.е. объем фонда измеряется числом дел), а последние — из множества листов. Единицей хранения является дело или лист. Существует и понятие документа, но оно является вспомогательным и в основных измерениях массивов не применяется. Копии документов, в том числе на микроносителях, а также созданные на основе архивных документов базы данных учитываются отдельно. Кроме того, используется понятие "коллекция", отличающееся от фонда принципом формирования.
В библиотеках применяется система измерения всего фонда (как единого целого), выражаемая в числе единиц хранения (включая множество экземпляров одного документа). Иногда число экземпляров и наименований книг учитывается отдельно. В составе фондов могут выделяться части, учитываемые самостоятельно (фонды открытого доступа, собрания, фонды специального хранения, фонды периодики и проч.). Особо учитываются каталоги библиотек (картотечные и электронные). Иногда отдельно ведется учет документов на разных языках. Базы данных, созданные библиотекой или ею приобретенные, в состав библиотечных фондов не входят и если учитываются, то отдельно.
Документографические базы данных практически всегда измеряются числом содержащихся в них записей, т. е. полных текстов документов или их библиографических описаний либо рефератов. Важной характеристикой БД служит также глубина их ретроспективы. Иногда применяют измерение по физическому объему (например, в мегабайтах). Фактографические БД измеряются по числу описанных в них объектов, по числу используемых для описания реквизитов, а также по физическому объему.
Широко распространенные системы измерения ресурсов Интернета учитывают число серверов (хостов), число страниц (обычно представленных в определенных форматах, например только HTML) и общий объем документов (в гигабайтах), содержащихся на этих страницах.
Таким образом, очевидно, что могут применяться как логические единицы измерения (число фондов, документов, объектов), так и физические (число листов, единиц хранения, мегабайт). При этом как физические, так и логические единицы измерения несоизмеримы между собой.
Таким образом, методика измерения объема ИР требует дополнительных исследований. Кроме того, необходимы единые метрологические стандарты и решение весьма сложной задачи по их внедрению в информационную практику.