DSCon  

Главная > Образование > Дисковые (RAID) массивы

Дисковые массивы серии 4004 с ОС RealStor 2.0 – сервисы хранения в реальном времени

Современный мир утопает в потоках информации и функционирование любых систем в режиме реального времени становится не просто преимуществом, а необходимостью. Постоянный рост вычислительных мощностей и виртуализация упрощают построение инфраструктур, необходимых для обработки данных в реальном времени, но некоторые компоненты, а именно хранилища данных, все еще остаются слабым звеном.

Поэтому производители обратили внимание на технологии флэш-памяти и, соответственно, на твердотельные (SSD) накопители, позволяющие увеличить производительность и значительно повысить скорость ввода/вывода (IOPS). В то время как стоимость флэш-памяти снижается, а массивы, построенные целиком на SSD, становятся все более привычными, гибридные массивы стали наиболее простым способом сбалансировать производительность и большую емкость. Их появление позволило избавиться от недостатка производительности, свойственной хранилищам на традиционных жестких дисках, а также значительно снизить стоимость одного гигабайта хранения и обеспечить намного больший объем по сравнению с хранилищами, построенными только на SSD накопителях.

Гибридные системы хранения данных

В гибридных массивах используются одновременно SSD накопители и традиционные жесткие диски большой емкости, на основе которых формируются ярусы иерархического хранения. Однако первые гибридные системы часто страдали от проблем, связанных с тем, что запись и перемещение данных между ярусами создавали дополнительную нагрузку на процессор хоста, что проявлялось в снижении производительности и эффективности.

Следующее поколение гибридных массивов стало осуществлять распределение данных по ярусам в реальном времени. Такое решение позволило гарантировать размещение на быстрых носителях (SSD) требуемого в каждый конкретный момент набора данных и использовать более эффективную архитектуру для перемещения данных между уровнями, не влияющую на производительность системы в целом.

RealStor 2.0

Примером систем, где распределение данных по ярусам хранения осуществляется в реальном времени, могут служить массивы семейства 4004 от Dot Hill, работающие под управлением ОС второго поколения RealStor 2.0. RealStor предоставляет пользователю несколько различных функций, включая RealTier (автономное распределение данных по ярусам хранения в реальном времени) и RealCache (кэширование чтения), а также такие продвинутые функции как: RealQuick (быстрое перестроение RAID), RealSnap (виртуализированные «моментальные снимки» [snapshot]) и RealThin (тонкое распределение ресурсов).

ОС Dot Hill Realstor

Что такое «Автономное распределение данных по ярусам хранения в реальном времени»?

Процесс распределения данных по ярусам хранения (tiering) в RealTier состоит из анализа характеристик доступа к данным, оценки каждого объекта данных для определения соответствующего уровня и их перемещения. Изначально, многие гибридные системы хранения использовали для выполнения анализа batch-процессы и перемещали данные только через несколько часов. Такой подход использовался из-за того, что процесс распределения данных по ярусам хранения значительно загружал процессор системы и полосу пропускания сети, и, соответственно, приводил к деградации производительности системы. Многие из таких систем также изначально записывали данные на ярус жестких дисков для увеличения сроков жизни SSD накопителей, и переписывали них данные только при следующем цикле перемещения. Проблема такого подхода заключается в том, что решение о перемещении данных очень часто принимается на основании устаревшей информации.

RealStor 5 секундТехнология RealTier от Dot Hill непрерывно распределяет данные по ярусам, сканируя, оценивая и перемещая данные каждые 5 секунд. Для минимизации воздействия на производительность объем трафика операций перемещения данных ограничивается 80МБ в каждый пятисекундный интервал.

В самом процессе распределения данных по ярусам используется концепция, называемая пейджинг (paging). Тома пользователя логически разделяются на маленькие части размеров в 4MB, называемые страницы (pages). Страницы ранжируются при помощи сложного алгоритма, позволяющего эффективно выбирать нужные страницы для перемещения между ярусами хранения. Как результат – страницы могут мигрировать между ярусами автоматически, а производительность ввода/вывода оптимизируется в реальном времени.

В противовес перемещению данных на уровне LUN, более низкий уровень (Sub-LUN) выполнения пейджинга обеспечивает высокоэффективное перемещение данных, задействуя минимальные ресурсы ЦП и памяти, и поэтому, процесс распределения данных по ярусам может осуществляться в реальном времени.

Кроме того, системы хранения Dot Hill семейства 4004 обеспечивают дополнительные вычислительные мощности для обработки нагрузок, связанных с выполнением распределения данных по ярусам. В них используются специализированные процессоры (ASIC) собственной разработки, предназначенные для обработки всего трафика ввода/вывода, обеспечения функций RAID и когерентности кэша обоих контроллеров. Такая архитектура позволяет осуществлять автономное распределение данных по ярусам хранения с минимальной загрузкой процессора хоста со стороны контроллеров хранилища, что гарантирует постоянную производительность.

RealTier поддерживает три области хранения: ярус SSD накопителей, ярус быстрых дисков SAS и ярус nearline-дисков большой емкости. Кроме перемещения данных между ярусом SSD и ярусом жестких дисков RealTier также переносит данные между высокопроизводительными и емкими жесткими дисками.

RealTier - перемещение данных мужду ярусами хранения

ОС RealStor также предоставляет функцию чтения из кэша на основе SSD накопителей, называемую RealCache. Эта функция помогает максимально увеличить производительность чтения для приложений и обладает способностью назначать приоритет конкретных томов для поддержки наиболее критичных нагрузок. Для использования этой функции достаточно одного SSD накопителя, так как нет необходимости в избыточности. Параллельно существуют две копии данных: одна на SSD – для ускорения чтения, и одна – на жестких дисках.

Дополнительной возможностью является пропуск яруса SSD и запись данных непосредственно на диски, что крайне полезно для приложений, работающих с потоковыми данными. Кроме того, сокращение записи на SSD накопители увеличивает срок их службы.

Эффективность хранения

Функция RealSnap в RealStor обеспечивает поддержку виртуализованных «моментальных снимков» (snapshot), процесса перенаправления при записи (redirect-on-write), поддерживающего, не влияя на производительность, одновременно до 1024 «моментальных снимков». Пользователи могут настраивать «моментальные снимки» одновременно для множества томов с использованием консоли управления хранилищем.

Функция RealThin – это технология тонкого распределения ресурсов системы, позволяющая устранить превышение доступности ресурсов хранилища, позволяя осуществлять более эффективное управление томами и расширение емкости, не влияющее на работу системы.

При помощи RealThin пользователи повышают эффективность использования емкости благодаря современным файловым системам (например – Microsoft Windows NTFS), позволяющим возвращать свободное дисковое пространство, возникающее в результате удаления файлов/каталогов в общий пул хранилища. Кроме того, эти тома постоянно сканируются на наличие нулевых блоков и автоматически сжимаются для максимально эффективного использования доступной емкости дисков.

Быстрая перестройка RAID

В эпоху мультитерабайтных дисков перестройка RAID может длиться часами или даже днями. Очевидно, что это может стать серьезной проблемой для дисковых и гибридных первичных хранилищ, особенно в средах, где от них ожидают высокой производительности и доступности. Технология RealQuick, предоставляемая RealStor, призвана решить эту проблему за счет перестройки только секторов, содержащих данные, пропуская пустые участки, представленные неиспользуемыми областями жесткого диска. Прирост производительности перестройки RAID при использовании RealQuick может достигать пятикратного размера (в зависимости от степени заполнения дисков).

Дисковые массивы серии 4004

Системы хранения данных серии 4004Дисковые массивы серии 4004 это восьмипортовые, подключаемые по Fibre Channel, iSCSI и SAS системы хранения данных, поддерживающие SSD накопители, быстрые SAS и near-line SAS жесткие диски. Системы масштабируются до 224 накопителей малого форм-фактора (LFF) в четырех 56-дисковых шасси форм-фактора 4U или до 192 накопителей в четырех 48-дисковых шасси форм-фактора 2U.

Будучи разработанными для высоких рабочих нагрузок, они обеспечивают скорость последовательного чтения в 6400MB/s и скорость последовательной записи в 5300 MB/s наряду со 120 000 IOPS с диска. Дисковые массивы серии 4004 оснащаются дублированными RAID-контроллерами с поддержкой RAID 0, 1, 3, 5, 6, 10 и 50, а также избыточными компонентами с поддержкой «горячей» замены для обеспечения максимальной доступности в 99.999%. Кроме того они соответствуют требованиям стандартов NEBS Level 3 (для использования в сфере телекоммуникаций) и MIL STD 810G (для использования в армии).

Энергоэффективность

Системы хранения серии 4004 используют технологию Dot Hill EcoStor, заключающуюся в использовании суперконденсаторов и компактной флэш-памяти вместо батарей для поддержания целостности данных кэша в случае отключения электропитания. Также эти массивы способны снижать скорость вращения дисков для сокращения энергопотребления. Это позволяет пользователям создавать энергоэффективные ярусы хранения для задач, требующих длительного хранения данных без их перемещения с дисковых массивов.

Заключение

Накопители на базе флэш-памяти все чаще применяются для повышения производительности систем хранения данных. Для многих вычислительных сред наиболее удобными являются гибридные массивы хранения, включающие одновременно SSD-накопители и традиционные жесткие диски. Они обеспечивают улучшение производительности, позволяя держать расходы под контролем. Однако традиционные гибридные массивы могут создавать проблемы там, где на первом месте стоит функционирование систем в реальном времени, что становится все более актуальным. Просто гибридным массивам требуется слишком много времени, чтобы приспособится к быстро меняющимся приоритетам.

Технологии гибридных массивов, функционирующие в реальном времени, могут помочь решить эту проблему, обрабатывая и перемещая данные между ярусами хранения практически непрерывно. Это означает, что на SSD-накопителях всегда будет находиться правильный набор данных, и они будут очень быстро перемещаться на емкие жесткие диски в случае снижения их приоритета.

Поэтому, системы подобные Dot Hill 4004 с ПО RealStor 2.0 могут осуществлять процесс распределения данных по ярусам хранения в реальном времени, не влияя на производительность массива, предоставляя эффективное и экономичное хранилище для современного центра обработки данных.

Где купить?
Контакты

Ультраплотная система хранения данных серии Ultra48 – 4844
Ультраплотная система хранения данных серии Ultra56 – модель 4854
PDF OC RealStor 2.0 datasheet (ENG)
PDF Описание функций RealTier и RealCache (ENG)
PDF Описание функции RealThin (ENG)
PDF Описание функции RealQuick (ENG)
PDF Описание функции RealSnap (ENG)
O разработчике -
Dot Hill Systems
Компания | Продукты | Поставщики | Поддержка | Образование | Press room
Copyright © 2000-2016 DSCon®. All Rights Reserved.