Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 2 — Оценка качества электронных документов
- Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 2
- Носители информации
- Оптические диски
- Магнитооптические диски
- Флэш-память
- Файловые системы
- Форматы файлов
- Организация хранения и обеспечения сохранности компонентов машинной информационной базы
- Сетевые технологии сохранения электронных ресурсов
- Стандарты, используемые программно-техническими средствами при сжатии и восстановлении данных
- работы по обеспечению сохранности электронных документов
- Электронные документы
- Многоаспектная классификация электронных документов
- Электронные журналы
- Сетевые электронные документы
- Особенности технологии комплектования электронных документов
- Оценка качества электронных документов
Самостоятельность и самодостаточность электронного документа
Под самостоятельностью документа понимается возможность его прочтения без обращения к другим документам или использования специальных программ-клиентов, а так же возможность его идентификации в рамках существующих библиотечно-библиографических технологий. Наличие в документе гиперссылок не ограничивает самостоятельность ресурса, но может существенным образом повлиять на его самодостаточность. Разделяют критичные и некритичные гиперсвязи. Разрыв первых не приводит к потери функциональности документа, в то время как разрыв вторых может существенным образом повлиять как на содержание документа, так и на его полноценное воспроизведение. Соответственно, библиотека должна разработать четкие методы вычленения необходимых электронных документов из объектов верхнего уровня (сайта, портала).
С этой точки зрения полезно понимать, каким образом устанавливается идентичность сетевого электронного документа. В традиционном книгоиздании сложилась строгая система идентификационных признаков, включающая автора, название, выходные сведения, международные стандартные номера, индексы классификационных схем и т.д. В электронной среде самым распространенным способом индексации является присвоение объекту индивидуального наименования, что наиболее наглядно проявляется на примере сайтов или порталов. В настоящее время ведутся активные разработки в области создания идентификационных номеров по примеру книжно-журнальной практики (аналоги ISBN и ISSN):
· Идентификатор для цифровых объектов — DOI (Digital Object Identification);
· Универсальный идентификатор ресурса — URI (Uniform Resource Identificator);
· Универсальный указатель ресурса, относящийся к единице информации, имеющей самостоятельный адрес — URL (Uniform Resource Locator); однако данный номер не изменяется автоматически при изменении месторасположения объекта, а значит, достаточно часто становится неверным. Поэтому ведутся разработки PURL (Persistent Uniform Resource Locator) для долгоживущих ресурсов;
· Универсальное имя ресурса, предназначенное для идентификации электронного объекта вне зависимости от его перемещений — URN (Uniform Resource Name).
Неизменяемость и завершенность электронного документа
Основным объектом комплектования является статичный электронный документ. Динамичные объекты (базы данных, сайты, форумы) могут быть объектами комплектования только в тех случаях, когда ценность ресурса значительно превосходит экономические и технологические затраты на его копирование. В иных случаях объектами комплектования могут быть отдельные статичные фрагменты или состояния динамических объектов (отчеты баз данных, т.е. их фиксированное состояние на определенный момент времени), которые поддерживаются программно-аппаратной средой библиотеки. К динамичным объектам целесообразно предоставлять доступ, составив каталог наиболее востребованных пользователями библиотеки ресурсов.
Предназначенность для неограниченного круга пользователей
Объектами комплектования, как правило, не должны являться документы, имеющие следующие ограничений по доступу:
· гриф секретности (включая все виды тайн — государственную, служебную, коммерческую, следственную, персональные данные и проч.);
· доступ к которым предоставляется за плату(поскольку в этом случае библиотека должна согласовать регламент доступа к электронному документу с его правообладателем);
· предназначенные только для членов сообщества с фиксированным членством (например, корпоративные документы);
· предназначенные определенным физическим и юридическим лицам (переписка).
Технологические характеристики
С точки зрения технологических характеристик предпочтение отдается объектам, представляющим собой отдельный статичный электронный документ (созданный при помощи только языка HTML, таблиц стилей, технологии SSI и имеющие четко зафиксированный, неизменяемый адрес для каждой страницы), представленный в открытых кодировках и форматах и не имеющий критичных гипертекстовых связей. Если Интернет-ресурс представляет собой данные только одного формата и не имеет неразрывной связи с какими-либо другими типами данных, то его поступление в фонд библиотеки не ограничивается. Если Интернет-ресурс представляет собой комплекс взаимосвязанных данных различных форматов (текста, графика, видео и т.д.), он может поступать в библиотеку только при сохранении всех существующих взаимосвязей. Идеальной является ситуация, позволяющая полностью отделять данные от представлений (TEX, XML-технологии) с последующим наложением внешнего представления/представлений (желательно общего для целого подтипа документов). В манифесте должна содержаться информация о том, каким способом можно изымать части сложного документа для автономной работы.
- << Назад
- Вперёд