Автор: Владимир Мешалкин. Рубрики: Центр обработки данных. Опубликовано: Июль 14th, 2009

С ростом объемов хранимой и обрабатываемой информации неуклонно увеличивается стоимость владения инфраструктурой. Повышение ответственности за надежность хранения данных и оперативность их предоставления соперничает со стоимостью общего решения по хранения данных. По статистике, при ежегодном росте общего объема данных на 50%, до половины хранимой на дисковых массивах информации либо не является актуальной, либо хранится в избыточном виде, либо вообще не относится к деятельности компании, однако, вся эта информация продолжает храниться на дорогих устройствах и даже резервироваться на регулярной основе. На смену необоснованному экстенсивному росту объемов систем хранения приходят новые методики и технологии, позволяющие оптимизировать и эффективно использовать текущие ресурсы хранения.

Наряду с такими признанными технологиями прямого снижения хранимых объемов данных как сжатие и дедупликация на рынке активизируется спрос на решения по управлению ресурсами хранения (Storage Resource Management, SRM) и управление жизненным циклом информации (Information Lifecycle Management, ILM). И если первая из этих концепций подразумевает анализ текущей ситуации с хранением данных и перераспределение мощностей в зависимости от производительности и загруженности систем, то вторая является всеобъемлющим подходом к хранению информации, начиная от момента ее появления, использования, архивирования и заканчивая уничтожением. ILM позволяет использовать политики и процессы для экономически эффективного размещения данных, основываясь на потребностях бизнеса и в соответствии с их ценностью. Эффективность подхода можно наблюдать в системах коллективной работы, например, почтовых системах, а также в файловых хранилищах. Реализация концепции подразумевает анализ и классификацию информации по ее бизнес-ценности и частоте использования в рамках определенного временного интервала, определении физического устройства хранения, которое обеспечивает заданные характеристики работы по скорости доступа, объему хранения и др., а также задании политик перемещения информации при наступлении определенных событий, например, по истечении срока актуальности. Критичные данные помимо расположения на высокоскоростных массивах могут быть также продублированы для быстрого восстановления, а менее востребованные данные, хранение и доступ к которым, однако, должен производиться, могут архивироваться и перемещаться на более дешевые массивы или выводиться на ленточные накопители для самого дешевого типа хранения.

Решения ILM призваны пересмотреть концепцию хранения информации и более эффективно подойти к использованию ресурсов, оптимизировав стоимость владения данными. Воплощение концепции ILM можно найти в продуктах ведущих производителей систем хранения, таких как EMC, IBM, HDS, HP и др.

Что касается резервного копирования на ленточные накопители, то с ним связан ряд сложностей. Процедуру резервного копирования необходимо выполнять в отведенное для нее время (окно резервного копирования) — в часы наименьшей загрузки приложений. А с ростом объемов и числа источников данных ставится все сложнее укладываться в этот промежуток: скорость записи на ленту достаточно велика, но только при условии непрерывного потока данных. Кроме того, использование лент не всегда позволяет быстро восстанавливать  утраченные данные из резервных копий. Отказаться от резервирования на ленточные устройства нельзя из-за таких преимуществ, как высокая скорость работы с данными, дешевизна и возможность удаленного хранения лент. Решение заключается в промежуточном хранении данных на дешевеющих дисковых массивах: так достигается минимизация окна резервного копирования, высокая скорость восстановления недавно удаленных данных и отсутствие конфликтов доступа различных источников к единому накопителю. Как правило, используется метод резервного копирования disk-to-disk-to-tape (D2D2T), при котором данные изначально резервируются на дисковое хранилище, а затем периодически переносятся на ленточные накопители. Для промежуточного хранения могут использоваться виртуальные ленточные библиотеки (VTL, Virtual Tape Library). Представление дискового массива в виде  ленточной библиотеки позволяет сократить время операций копирования и восстановления, не требуя при этом изменения текущих процессов и потоков данных.

Для обеспечения возможности быстрого восстановления данных используют системы непрерывной защиты данных (CDP, Continuous Data Protection). Идея подобных систем подразумевает постоянное резервирование данных или сохранение информации об изменении данных на файловом или блочном уровне с использование технологии “мгновенных снимков” (snapshot), что позволяет воспроизводить данные в том виде, в каком они были в любой момент времени в прошлом. Простейшим вариантом реализации концепции можно считать внедрение продукта Microsoft DPM вкупе с использованием встроенной в Windows Server службой теневого копирования (VSS, Volume Shadow Service), позволяющего сохранять «снимок» данных дискретно каждый час. Наиболее сложные системы, в полной мере отвечающие концепции CDP предлагают компании Symantec, EMC, IBM. Стоит отметить, что системы CDP не исключают использования классических методов резервного копирования, более того, они составляют единое решение вместе с инструментами резервного копирования и архивирования данных.

 

Часть материала была опубликована в журнале «CIO» за декабрь 2008 года

Поделиться

Опубликовать в Facebook
Опубликовать в Google Buzz
Опубликовать в Google Plus
Опубликовать в LiveJournal
Опубликовать в Мой Мир
Опубликовать в Одноклассники
Опубликовать в Яндекс

Мы в социальных сетях

Читать ProITClub в TwitterЧитать ProITClub в RSSЧитать ProITClub в п&##1086;чтовой подпискеЧитать ProITClub в Живом ЖурналеЧитать ProITClub в LinkedInЧитать ProITClub в LinkedIn
Вы можете оставить комментарий, или поставить трэкбек со своего сайта.

Написать комментарий

Вы должны войти чтобы добавить сообщение.