архивирование данных

Определение

Архивирование данных — это процесс о перемещении данных, которые больше не используются активно, на отдельное запоминающее устройство для долгосрочного хранения. Архивные данные состоят из более старых данных, которые остаются важными для организации или должны быть сохранены для использования в будущем или в целях соблюдения нормативных требований. Архивы данных индексируются и имеют возможности поиска, поэтому файлы могут быть найдены и извлечены.

Архивированные данные хранятся на более дешевом уровне хранения, что позволяет сократить потребление основного хранилища и связанных с ним расходы. Важным аспектом бизнес-стратегии архивирования данных является инвентаризация данных и определение того, какие данные являются кандидатами для архивирования.

Некоторые архивные системы рассматривают архивные данные как доступные только для чтения, чтобы защитить их от модификации, тогда как другие продукты для архивирования данных позволяют выполнять как чтение, так и запись. Например, технология WORM (запись один раз, чтение много) использует носители, которые нельзя перезаписывать.

Архивирование данных лучше всего подходит для данных, которые должны быть сохранены из-за операционных или нормативных требований, таких как файлы документов , сообщения электронной почты и, возможно, старые записи базы данных.

Преимущества архивирования данных

Наибольшее преимущество архивирования данных это снижает стоимость первичного хранилища. Первичное хранилище обычно дорогое, потому что массив хранения должен обеспечивать достаточный уровень операций ввода-вывода в секунду для удовлетворения эксплуатационных требований для операций чтения/записи пользователя. Напротив, архивное хранилище стоит дешевле, потому что оно обычно основано на низкопроизводительном носителе большой емкости. Архивы данных могут храниться на недорогих жестких дисках (HDD), ленточных или оптических накопителях, которые обычно работают медленнее, чем производительные диски или флеш-накопители.

Архивное хранилище также уменьшает объем данных, которые должны быть иметь резервную копию. Удаление редко используемых данных из набора данных резервного копирования улучшает производительность резервного копирования и восстановления. Как правило, дедупликация данных выполняется для данных, перемещаемых на более низкий уровень хранения, что уменьшает общий объем хранилища и снижает затраты на вторичное хранилище.

Сравнение архивирования данных с резервным копированием

Архивы данных не следует путать с резервными копиями данных, которые являются копиями данных. Хотя оба считаются вторичным хранилищем и используют носитель с более низкой производительностью и большей емкостью, чем первичное хранилище, они служат разным целям.. Архивы служат для сохранения данных, тогда как резервные копии используются для защиты данных и аварийного восстановления.

Архивы данных можно рассматривать как хранилище данных для редко используемых, но все же легко доступных данных. Резервные копии, с другой стороны, являются частью механизма восстановления данных, который можно использовать для восстановления данных в случае их повреждения или уничтожения. Данные резервного копирования часто состоят из важной информации, которую необходимо быстро восстановить в случае потери или удаления.

Онлайн-хранилище или автономное хранилище данных

Архивы данных имеют разные формы. Некоторые системы используют онлайн-хранилище данных, которое помещает архивные данные на дисковые системы, где они легко доступны. Архивы часто основаны на файлах, но популярность объектных хранилищ растет.

Другие архивные системы используют автономное хранилище данных в какие архивные данные записываются на ленту или другой съемный носитель с использованием программного обеспечения для архивирования данных, а не хранятся в сети. Поскольку ленточные архивы могут быть удалены, их архивы потребляют гораздо меньше энергии, чем дисковые системы. Это приводит к снижению затрат на хранение архивов.

Облачное хранилище — еще одна возможная цель архивирования. Amazon Glacier, например, предназначен для архивирования данных. Этот метод недорогой, но требует постоянных вложений. Кроме того, со временем затраты могут расти по мере добавления в облако хранения большего количества данных. Поставщики облачных услуг обычно хранят заархивированные данные на ленте или более медленных жестких дисках большой емкости.

Архивирование данных и жизненный цикл данных. управление

Процесс архивирования почти всегда автоматизирован с использованием архивного программного обеспечения. Возможности такого программного обеспечения варьируются от одного поставщика к другому, но большая часть программного обеспечения для архивирования автоматически перемещает устаревшие данные в архивы в соответствии с политикой архивирования данных, установленной администратором хранилища. Эта политика может также включать особые требования к хранению для каждого типа данных.

Некоторое программное обеспечение для архивирования автоматически удаляет данные из архивов по истечении срока службы, установленного политикой хранения данных организации. Многие программы для резервного копирования и управления данными добавили в свои продукты функции архивирования. В зависимости от ваших потребностей это может быть рентабельным и эффективным способом архивирования данных. Однако эти продукты могут не включать в себя все функции, имеющиеся в специальном архивном программном продукте.

Соответствие требованиям

Некоторым предприятиям требуется хранить данные в течение определенного периода времени из-за соблюдения нормативных требований. Независимо от того, требуется ли это отраслевыми нормативными актами или государственным законодательством, соблюдение нормативных требований является превалирующей задачей бизнеса. Наказания за нарушение нормативных требований могут включать в себя выплаты за ущерб, штрафы и аннулированные контракты..

Архивирование данных помогает предприятиям соответствовать требованиям как за счет длительного хранения данных, так и за счет консолидации данных для облегчения доступа в случае аудита. Правила, определяющие длину, в течение которой данные должны храниться, где они могут храниться и кто имеет к ним доступ, различаются в зависимости от отрасли и типа данных, создаваемых предприятиями в этой отрасли.

Некоторые примеры нормативных актов. организации, которым может потребоваться соблюдение, включают Закон Сарбейнса-Оксли (SOX), Закон о переносимости и подотчетности медицинского страхования (HIPAA) и Общий регламент по защите данных (GDPR).

Продолжить чтение об архивировании данных

  • Узнать разницу между архивами и резервными копиями
  • Проблемы с архивированием данных
  • Реализация стратегии архивирования
  • Роль больших данных в архивировании
  • Как выбрать поставщика услуг долгосрочного архивирования данных

Подробнее об архивировании и резервном копировании


  • Пять лучших способов извлечь пользу из ленты сегодня

  • Архив и резервное копирование и почему вам нужно знать различия

  • архив

  • облачный архив


Архивные данные

Национальная информационная система по академическим исследованиям и сотрудничеству в Нидерландах

DANS

DANS — это институт под эгидой KNAW, который также поддерживается NWO. С момента своего создания в 2005 году DANS хранит и делает данные исследований в области искусства, гуманитарных и социальных наук постоянно доступными и имеет специальный отдел исследований и разработок, который также может выполнять мероприятия для исследовательских групп.

Важным направлением деятельности DANS является установка, управление и постоянное совершенствование удобной системы архивирования EASY. EASY открыт для всех исследователей в области искусства, гуманитарных и социальных наук и позволяет им постоянно хранить свои данные и самостоятельно искать данные. Другими словами, цель EASY — стать электронным хранилищем данных из социальных, искусствоведческих и гуманитарных наук.

Просмотреть главуКнига по закупкам
Прочитать всю главу
URL: https://www.sciencedirect.com/science/article/pii/B9781843346203500180
Оцените статью
clickpad.ru
Добавить комментарий