Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 2 — Сетевые технологии сохранения электронных ресурсов
- Курс лекций: Информационное обеспечение автоматизированных библиотечных систем. Часть 2
- Носители информации
- Оптические диски
- Магнитооптические диски
- Флэш-память
- Файловые системы
- Форматы файлов
- Организация хранения и обеспечения сохранности компонентов машинной информационной базы
- Сетевые технологии сохранения электронных ресурсов
- Стандарты, используемые программно-техническими средствами при сжатии и восстановлении данных
- работы по обеспечению сохранности электронных документов
- Электронные документы
- Многоаспектная классификация электронных документов
- Электронные журналы
- Сетевые электронные документы
- Особенности технологии комплектования электронных документов
- Оценка качества электронных документов
Внедрение в архитектуру построения АБИС локальных вычислительных сетей (ЛВС), а также значительное количественное и качественное развитие информационных ресурсов, включая документы и данные, предоставляемые библиотеками и информационными органами в удалённый доступ через сети типа Интернет/Интранет, привело к созданию целого ряда технологий, которые ориентированы на оптимизацию решения задач сохранения информации. При этом наряду с сокращением материальных и трудовых затрат в развитых автоматизированных системах на выполнение процессов создания резервных копий документов и данных успешно решаются задачи обеспечения надёжности и бесперебойного режима предоставления их пользователям при различного рода сбоях работы программно-аппаратных средств. Остановимся на основных особенностях этих технологий.
Технология дисковых массивов (RAID) (Redundant Array of Inexpensive/Independent Disks) впервые разработана в 1987 г. сотрудниками Калифорнийского университета в Беркли. Её основная цель — обеспечение надежности хранения данных в дисковой памяти ПК. Основные признаки технологии:
- предполагает использование наборов дисков, доступных пользователям как один логический диск;
- данные распределяются по набору дисков определенным способом, соответствующим одному из уровней RAID;
- в случае неисправностей («отказов») дисков их массив содержит дополнительную («избыточную») ёмкость, обеспечивающую возможность восстановления данных.
Набор спецификаций устройств хранения данных связан с «уровнями RAID», определяющими способы распределения данных на дисковом массиве, их резервирования и восстановления. Архитектура RAID предлагает различные способы объединения нескольких жёстких дисков в единую систему так, чтобы она функционировала как один диск.
Сети хранения данных SAN и технология Fibre Channel
Традиционные способы оперативного создания резервных копий документов и данных в локальных вычислительных сетях (ЛВС) основаны на установке ленточного или другого типа накопителя на сервере автоматизированной системы (либо на серверах, если их несколько). Такой способ подключения существенно ограничивает скорость резервирования и ведёт к неэффективному расходованию ресурсов сервера и ЛВС. В частности, поскольку при такой конфигурации сервер, выполняющий резервное копирование, является промежуточным звеном на пути данных, последние много раз пересылаются через его системную память, что приводит к дополнительной нагрузке на процессор, системную шину и память. Помимо этого, устройство резервного копирования в традиционных ЛВС не может совместно управляться несколькими серверами, что приводит к их неполному использованию.
Указанные недостатки в условиях необходимости работы с постоянно растущими объёмами информации, непосредственно предоставляемой пользователям в ЛВС и в Интернет, а также посылаемой в различного рода хранилища или извлекаемые из них строенных по технологии Fibre Channel.
По существу SAN — это дополнительная сеть, связывающая один или несколько серверов с одним или несколькими хранилищами данных. В качестве последних могут использоваться RAID-массивы, ленточные и CD-ROM-библиотеки, отдельные диски и их массивы, не объединённые технологией RAID — JBOD (Just a Bunch of Disks).
В 1994 г. технология Fibre Channel принята Американским национальным институтом стандартизации (ANSI) в качестве стандарта. Она устанавливает спецификацию на интерфейс передачи данных со скоростью 1 Гбит/с, который может использоваться как для передачи сетевых данных по протоколам подобным, так и для непосредственного обмена с устройствами ввода/вывода по интерфейсу SCSI. Средой передачи данных могут служить медный кабель и оптоволокно протяжённостью до 10 км.
Сохранение данных невозможно без предварительного структурирования и сокращения их объёма, то есть сжатия данных.
Под «сжатием данных» понимается технический прием сокращения объема (размеров) записи данных на их носителе (например, на жестком магнитном диске, дискете, магнитной ленте и т.п.). Реализуется разными методами, преимущественно использующими кодирование (повторяющихся слов, фраз, символов и т.п.). Условно можно выделить две группы режимов сжатия данных: статический и динамический.
Статическое сжатие данных используется при необходимости их длительного хранения и архивации. Выполняется при помощи специальных сервисных программ — архиваторов, например ARJ, PKZIP/PKUNZIP и др. После разархивации исходная запись восстанавливается.
Динамическое сжатие предназначено для сокращения занимаемой области дисковой памяти данными, требующими оперативного доступа, и их вывода на внешние устройства ЭВМ (в том числе на экран монитора). Динамическое сжатие данных и их восстановление производится специальными программными средствами автоматически.
Динамическое сжатие реализуется при помощи таких систем, как:
1. Кодек [codec] ( от англ. COmpressor-DECompressor) — система, реализующая сжатие данных с целью сокращения занимаемого ими пространства и их восстановления при воспроизведении.
2. Cinepak — ассимметричный кодек, разработанный фирмой SuperMac Technology и показывающий высокие результаты для сжатых цифровых видео изображений.
3. DVI (Digital Video Interactive) — система сжатия и восстановления аудио- и видеозаписей в цифровой форме. Использование ее позволяет записать на CD-ROM полноэкранный видеофильм вместе со звуковым сопровождением, — и т.д.
Сжатие изображения — технический прием или метод сокращения объема (размеров) записи графических изображений (рисунков, чертежей, схем и т.п.) на их носителе. По существу сжатие изображения является разновидностью динамического сжатия. Для его реализации используются различные способы кодирования данных, которые ориентированы на элементы графики, составляющие изображение, включая и движущиеся объекты. Сжатие изображения применяется также при передаче факсимильной информации по каналам связи, в системах мультимедиа, видеофонах и т.д.
Сжатие диска — технический прием, основанный на динамическом сжатии разного вида данных непосредственно в процессе их записи на диск, а при считывании — их автоматическом восстановлении в исходную форму. Используется с целью увеличения ёмкости диска. В зависимости от характера записей последняя может быть увеличена примерно от 1,5 до 5 раз. Реализуется сжатие диска специальными прикладными программами например DoubleSpace, Stacker, SuperStor и др.