Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 2 — Оценка качества электронных документов

Оценка качества электронных документов

 

Самостоятельность и самодостаточность электронного документа

Под самостоятельностью документа понимается возможность его прочтения без обращения к другим документам или использования специальных программ-клиентов, а так же возможность его идентификации в рамках существующих библиотечно-библиографических технологий. Наличие в документе гиперссылок не ограничивает самостоятельность ресурса, но может существенным образом повлиять на его самодостаточность. Разделяют критичные и некритичные гиперсвязи. Разрыв первых не приводит к потери функциональности документа, в то время как разрыв вторых может существенным образом повлиять как на содержание документа, так и на его полноценное воспроизведение. Соответственно, библиотека должна разработать четкие методы вычленения необходимых электронных документов из объектов верхнего уровня (сайта, портала).

С этой точки зрения полезно понимать, каким образом устанавливается идентичность сетевого электронного документа. В традиционном книгоиздании сложилась строгая система идентификационных признаков, включающая автора, название, выходные сведения, международные стандартные номера, индексы классификационных схем и т.д. В электронной среде самым распространенным способом индексации является присвоение объекту индивидуального наименования, что наиболее наглядно проявляется на примере сайтов или порталов. В настоящее время ведутся активные разработки в области создания идентификационных номеров по примеру книжно-журнальной практики (аналоги ISBN и ISSN):

· Идентификатор для цифровых объектов — DOI (Digital Object Identification);

· Универсальный идентификатор ресурса — URI (Uniform Resource Identificator);

· Универсальный указатель ресурса, относящийся к единице информации, имеющей самостоятельный адрес — URL (Uniform Resource Locator); однако данный номер не изменяется автоматически при изменении месторасположения объекта, а значит, достаточно часто становится неверным. Поэтому ведутся разработки PURL (Persistent Uniform Resource Locator) для долгоживущих ресурсов;

· Универсальное имя ресурса, предназначенное для идентификации электронного объекта вне зависимости от его перемещений — URN (Uniform Resource Name).

Неизменяемость и завершенность электронного документа

Основным объектом комплектования является статичный электронный документ. Динамичные объекты (базы данных, сайты, форумы) могут быть объектами комплектования только в тех случаях, когда ценность ресурса значительно превосходит экономические и технологические затраты на его копирование. В иных случаях объектами комплектования могут быть отдельные статичные фрагменты или состояния динамических объектов (отчеты баз данных, т.е. их фиксированное состояние на определенный момент времени), которые поддерживаются программно-аппаратной средой библиотеки. К динамичным объектам целесообразно предоставлять доступ, составив каталог наиболее востребованных пользователями библиотеки ресурсов.

Предназначенность для неограниченного круга пользователей

Объектами комплектования, как правило, не должны являться документы, имеющие следующие ограничений по доступу:

· гриф секретности (включая все виды тайн — государственную, служебную, коммерческую, следственную, персональные данные и проч.);

· доступ к которым предоставляется за плату(поскольку в этом случае библиотека должна согласовать регламент доступа к электронному документу с его правообладателем);

· предназначенные только для членов сообщества с фиксированным членством (например, корпоративные документы);

· предназначенные определенным физическим и юридическим лицам (переписка).

Технологические характеристики

С точки зрения технологических характеристик предпочтение отдается объектам, представляющим собой отдельный статичный электронный документ (созданный при помощи только языка HTML, таблиц стилей, технологии SSI и имеющие четко зафиксированный, неизменяемый адрес для каждой страницы), представленный в открытых кодировках и форматах и не имеющий критичных гипертекстовых связей. Если Интернет-ресурс представляет собой данные только одного формата и не имеет неразрывной связи с какими-либо другими типами данных, то его поступление в фонд библиотеки не ограничивается. Если Интернет-ресурс представляет собой комплекс взаимосвязанных данных различных форматов (текста, графика, видео и т.д.), он может поступать в библиотеку только при сохранении всех существующих взаимосвязей. Идеальной является ситуация, позволяющая полностью отделять данные от представлений (TEX, XML-технологии) с последующим наложением внешнего представления/представлений (желательно общего для целого подтипа документов). В манифесте должна содержаться информация о том, каким способом можно изымать части сложного документа для автономной работы.

Вы здесь: Главная Библиотечное дело Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 2