Бытует мнение, что технически сложные продукты, к каковым с полным основанием можно отнести и системы хранения данных, относятся к нишевым рынкам, которые характеризуются, в том числе, ограниченными объемами продаж и узким товарным предложением. Однако к рынку систем хранения данных (СХД) такой подход просто неприменим. Если развернуть в полном объеме на-звание статьи вместе с подзаголовком, получится небольшая энциклопедия. Поэтому мы просто вынуждены значительно сузить объект анализа в данной конкретной статье. На самом деле речь пойдет о некоторых классах дисковых систем хранения, однако понима-ние их места в общей иерархии рынка СХД представляется не лишним.

      Обобщенная типизация систем хранения данных
      В первом приближении все имеющиеся СХД можно разделить на системы оперативного хранения и архивного хранения. Такая типи-зация базируется на ряде критериев, часть которых относится к разряду определяющих (время доступа к данным, стоимость их хранения, их аутентичность), а часть – к разряду дополняющих: совокупный объем хранения, надежность хранения. В целом идея доволь-но проста – данным, в которых нет постоянной потребности, которые не должны изме-няться каким-либо образом и надежное хранение которых необходимо в течение годов, если не десятилетий, прямая дорога в архивные хранилища. Постоянно изменяемые данные, доступ к которым нужен всегда и при этом в течение считанных секунд, – это епархия оперативных хранилищ. При действительно больших объемах хранения (тера-байты данных) такая схема еще и экономически выгодна, так как в силу технологических особенностей хранение данных в архивных системах в пересчете на гигабайт обходится пользователям значительно дешевле, чем в оперативных.
      Из всех представленных сегодня на рынке тех-нологий записи и хранения данных (магнитной, оптической, флэш-памяти) действительно большие объемы доступны только решениям на основе магнитных носителей – дисковых и ленточных. Именно поэтому все современные системы хранения данных построены на этих двух типах носителей, хотя в последнее время не исключается и возможность ком-бинирования в одном устройстве магнитных дисков и флэш-памяти.
      История использования магнитной ленты в ка-честве носителя для хранилища данных насчитывает уже более 50 лет. При этом когда-то лента применялась в качестве как архивного, так и оперативного хранилища, однако сегодня ленточные системы выполняют функции чисто архивных хранилищ.
      В активе дисковых магнитных накопителей также внушительный исторический багаж – в качестве основы для хранилища информа-ции такие решения впервые появились на рынке в конце 50-х годов прошлого века. Тех-нические ограничения на объем данных и высокая стоимость хранения, свойственные магнитным дискам на начальном этапе развития, довольно долго сдерживали НЖМД в рамках системы решений для оперативного хранения. Однако активное совершенствова-ние технологий хранения данных на магнитных дисках, приведшее к созданию емких, вы-сокопроизводительных и надежных носителей этого типа, и бурное развитие производст-венной базы, открывшее дорогу к стремительному снижению стоимости НЖМД, открыли дисковым системам дорогу и в сферу архивного хранения. Так, в последнее время все большую популярность набирает альтернативный подход, основанный на комби-нировании отдельных преимуществ хранилищ обоих типов – оперативного и архивного. Системы типа D2D (disc-2-disc) формально относятся к классу систем архивного хранения и потому обладают функциональностью ленточных архивных систем. Но в то же время в качестве физических носителей для хранения информации они используют недорогие магнитные диски большой емкости, что в определенной мере роднит их с системами опе-ративного хранения.
      Сегодня магнитные диски широко применяются в системах как оперативного, так и архивного хранения, при этом благодаря наличию разных типов НЖМД, широкому спектру интерфейсов и большому диапазону варьирова-ния технических параметров дисков (емкости хранения и скорости вращения шпинделя) появляется возможность подобрать оптимальную конфигурацию СХД под конкретные за-дачи. Более того, комбинируя в рамках одной системы диски разных классов, можно соз-давать ярусные хранилища, где данные перераспределяются между уровнями хранения в соответствии с их ценностью для бизнеса и стоимостью хранения. Характерной особен-ностью дисковых систем оперативного хранения является использование широкого спек-тра технологий и протоколов обмена данными, позволяющее эффективно решать все ти-пы стоящих перед СХД задач. В настоящее время в системах хранения применяются диски следующих стандартов: FC (Fibre Channel), SCSI (Small Computer System Interface), SAS (Serial Attached SCSI), SATA (Serial Advanced Technology Attachment), FATA (Fibre Channel ATA).
      Исследование класса систем архивного хране-ния (как ленточных, так и дисковых) не входило в планы данного обзора, поскольку это направление само по себе поднимает целый пласт вопросов и проблем, требующих от-дельного серьезного обсуждения. Не пытаясь охватить разом весь необъятный рынок систем хранения, в рамках текущего материала решено сосредоточиться на рассмотре-нии только класса дисковых систем оперативного хранения, о которых далее и пойдет речь.

      Архитектуры дисковых СХД
      Существует два подхода к определению архи-тектуры дисковых систем хранения данных. Первый указывает на принадлежность СХД к тому или иному типу, исходя из используемой в ней архитектуры доступа к данным – либо блочный, либо файловый. Второй основывается на способе подключения СХД к ИТ-инфраструктуре – это может быть либо прямое подключение к серверам, либо подключе-ние к сетям передачи данных. Разница между сетевым и прямым подключением, очевид-но, понятна и так. Разницу между блочной и файловой архитектурами можно определить на уровне доступа к данным. В первом случае доступ к данным, хранимым на диске в ви-де блоков одинакового размера, осуществляется через посредничество специализиро-ванного прикладного ПО, отвечающего за работу с ним, например, СУБД. Во втором слу-чае к данным возможен прямой доступ посредством дополнительного уровня абстракции – файловой системы. Для работы с ними необходима лишь совместимость прикладного ПО с файловой системой, в данном случае – с сетевыми системами типа NFS или CIFS/SMB, на уровне возможности чтения/записи данных в файлы.
      Наиболее простыми в архитектурном плане и финансово доступными являются блочные системы с прямым подключением – DAS-решения (direct attached storage). Системы такого рода представляют собой шасси, за-полненное жесткими дисками и снабженное HBA-адаптером (Host Bus Adapter) для под-ключения непосредственно к серверу по интерфейсу SCSI или FC. Фактически это рас-ширение дисковой подсистемы сервера, вынесенное в отдельный внешний кабинет, по-этому доступ к данным здесь происходит по аналогии с внутренними НЖМД сервера. Среди основных преимуществ DAS-систем – их конструктивная простота, легкость в об-служивании, высокая скорость доступа к данным и достаточно низкая цена. К ключевым недостаткам относятся невозможность разделения хранимых данных между большим ко-личеством серверов (современные DAS-системы высшего уровня обычно позволяют под-ключать не более четырех серверов) и неспособность перераспределять неиспользуе-мые ресурсы между приложениями. В целом DAS-системы являются довольно ограни-ченными с функциональной точки зрения решениями, в которых эффективное управле-ние хранением данных и значительная масштабируемость емкости хранения либо серь-езно затруднены, либо вовсе невозможны. Присутствие таких решений на рынке доволь-но ограничено (в плане количества поставщиков и ассортимента моделей), и в силу всего перечисленного они в данном обзоре не рассматриваются.
      Еще один самостоятельный класс представля-ют собой системы с файловым доступом, использующие сетевое подключение, – NAS-решения (network attached storage). Фактически эти системы наделены функционалом выделенного файл-сервера, работающего в стандартной Ethernet-сети компании. В тех-ническом плане такие решения представляют собой сочетание аппаратных ресурсов на основе какой-либо серверной платформы (чаще всего х86), сетевой операционной систе-мы и серверного ПО, реализующего функции доступа к данным по протоколам NFS, CIFS/SMB, FTP и им подобным. Основное преимущество NAS-систем состоит в возмож-ности обеспечить быстрый доступ к данным большому количеству клиентов одновремен-но. Среди недостатков таких систем (и NAS-архитектуры в целом) можно отметить боль-шую нагрузку на аппаратные ресурсы, создаваемую вследствие значительных накладных расходов на поддержание работы системного ПО. В результате при большом количестве подключений и недостаточной мощности комплекса происходит быстрая деградация ка-чества обслуживания клиентов вплоть до полной его остановки. Сегодня на рынке суще-ствует две разновидности NAS-систем: шлюзы и хранилища. Первые представляют собой устройства, выполняющие функции посредника между потребляющими информацию серверами, с одной стороны, и внешними блочными хранилищами данных – с другой. Системы такого рода, не имеющие в своем составе каких-либо емкостей хранения и лишь пропускающие через себя потоки запросов и данных, обеспечивая доступ к данным на уровне сетевой файловой системы, в данном обзоре не рассматриваются. Вторые же, обладая аналогичной функциональностью, кроме того, включают в себя дисковую под-систему определенной емкости и выступают в качестве комбинированных устройств, осуществляющих хранение и обработку (в рамках представления в сетевой файловой системе) данных. Этим системам в обзоре уделено особое внимание.
      Последний класс систем хранения – SAN-решения (storage area network) – сочетает в себе архитектуру блочного доступа к данным с сетевым подключением к ИТ-инфраструктуре. Следует особо подчеркнуть, что в общем случае данная архитектура подразумевает использование для передачи данных высоко-скоростной выделенной SAN -сети на основе стандарта FC, никоим образом не связанной с традиционными вычислительными сетями стандарта Ethernet. В простейшем случае SAN-сеть включает в себя СХД, сервер и коммутатор, объединенные оптическими кана-лами связи. Доступ к сети серверы и системы хранения осуществляют посредством HBA-адаптеров, при этом передача данных между устройствами осуществляется по стандарт-ному протоколу SCSI, инкапсулированному внутри транспортного протокола FC. Для ра-боты в рамках SAN-сети с большими вычислительными комплексами типа мэйнфреймов корпорации IBM существуют особые HBA-адаптеры, поддерживающие специализирован-ные протоколы типа FICON/ESCON. Помимо типовой схемы с использованием стандарта FC в последнее время все большую популярность набирает схема построения SAN-сетей, базирующихся на стандарте iSCSI, позволяющем инкапсулировать сообще-ния протокола SCSI внутри пакетов стека TCP/IP, в качестве транспорта используя стан-дартные сети Ethernet.
      Традиционные преимущества SAN-систем – высокая надежность доступа к данным за счет общей устойчивости архитектуры к отка-зам и сбоям в отдельных узлах и системах, централизованное хранение данных, обеспе-чивающее реализацию дополнительных возможностей и сервисов (снапшоты, удаленная репликация и т. п.), высокая масштабируемость как по емкости хранения, так и по количе-ству серверов, высокий уровень утилизации ресурсов СХД, возможность виртуализации данных. В качестве дополнительных преимуществ SAN-систем на базе стандарта iSCSI можно отметить более низкие затраты на приобретение, развертывание и обслуживание оборудования. К недостаткам SAN-систем обычно относят высокую стоимость приобре-тения и владения, а также сложность самой SAN-архитектуры применительно к сетям большого масштаба.
      Далее основное внимание в обзоре будет уде-лено именно продуктам этого класса, а также упомянутым выше NAS-хранилищам дан-ным.

      Сегментация рынка дисковых СХД
      Проведенная выше классификация СХД по ар-хитектурному признаку по существу дает первый уровень сегментации этого рынка, по-скольку выделение классов и типов СХД в принципе подчеркивает их позиционирование на определенные задачи. Используя в качестве определяющих параметров архитектуру доступа к данным и архитектуру подключения СХД, мы выделили два основных класса дисковых систем хранения – SAN- и NAS-решения. При этом стоит напомнить, что в дан-ном случае понятие NAS сознательно сужено: обсуждаются только системы, обладающие внутренним дисковым хранилищем. NAS-cистемы, выступающие в роли шлюзов и не имеющие дисковой емкости для хранения данных, вынесены за рамки обзора.
      Второй уровень сегментации – разбиение мо-делей СХД на три разномасштабные категории: enterprise, midrange, entry-level, отчасти совпадающее с «адресацией» СХД по типам заказчиков (крупные корпорации; средние предприятия и удаленные филиалы больших компаний; малый бизнес, небольшие выде-ленные офисы, единичные отделы и подразделения). Само разделение носит достаточно условный характер и в первую очередь опирается на классификацию своих моделей са-мими компаниями-производителями. При этом важно понимать, что отнесение продукта к определенной категории вовсе не исключает возможности его применения в решениях, покрывающих задачи другого уровня. Так, продукты сектора midrange активно использу-ются в различных корпоративных проектах, и в тоже время известны случаи, когда сред-ний бизнес выбирал для своих проектов системы enterprise-класса. В тех случаях, когда производитель явно не указывает, к какому классу относится рассматриваемая модель СХД, в качестве определяющих критериев выступает следующий набор параметров:
      - Тип и количество хост-портов в системе
      Предлагается следующая схема классификации: категория entry-level – количество портов в пределах нескольких штук (порядка пяти), при этом порты FC и iSCSI представлены в равной мере; категория midrange – количе-ство портов в пределах десятка, порты FC преобладают, в то время как порты iSCSI часто встречаются в виде опции; категория enterprise – количество портов в пределах от нескольких десятков до нескольких сотен штук, преобладают порты FC, дополнен-ные интерфейсом FICON/ESCON, изредка встречаются конфигурации СХД с портами iSCSI.
      - Тип используемых в системе НЖМД
      Предлагается следующая сегментация: категория entry-level – диски SAS и SATA, категория midrange – диски FC и FATA/SATA, категория enterprise – диски FC и FATA.
      - Максимальная емкость хранения
      В качестве пороговых значений предлагаются следующие диапазоны: до ~ 75 Тбайт для категории entry-level, до ~ 300 Тбайт – для midrange. Класс enterprise, очевидно, в таком пороге не нуждается. Кроме того, по-скольку в целом в обзоре речь идет о довольно серьезных системах, представляется целесообразным для категории entry-level ввести также и нижнюю границу на уровне ~ 4 Тбайт, дабы отсечь системы класса SOHO.
      - Максимальное количество дисков
      В качестве пороговых значений предлагаются следующие диапазоны: до ~ 100 штук для категории entry-level, до ~ 500 штук – для midrange.
      В рамках обзора перечисленные параметры рас-сматриваются как количественные оценки СХД, даже несмотря на то что часть из них в определенной степени носит качественный характер. Оценка неформализованных харак-теристик СХД в данном случае базируется на исследовании таких качественных пара-метров СХД, как возможности создания распределенных виртуальных и многоуровневых хранилищ данных.
      Избранный подход, пожалуй, не обладает в полной мере универсальным и однозначным набором оценочных параметров, позволяю-щих отнести СХД к той или иной категории, однако в отсутствие лучшего решения это наиболее прозрачный и однозначный метод классификации.
      Стоит сказать несколько слов в целом о каж-дом из обозначенных сегментов, нацеленных на заказчиков определенного типа. Entry-level, очевидно, представляет собой начальный уровень иерархии СХД. Системы этого класса предназначены для небольших компаний и в несколько меньшей степени – для корпоративных подразделений. При этом важнейшим фактором выбора поставщика в этой категории является стоимость СХД. Продукты этого класса, прежде всего, ориенти-рованы на решение одной ключевой задачи – создание единого централизованного хра-нилища всех данных компании. Разумеется, ничто не мешает заказчикам использовать системы entry-level и в задачах другого уровня, например, классом выше, однако, несмот-ря на наличие соответствующих технических возможностей, такой подход, в силу ограни-чений по масштабированию емкости хранения и наращиванию пропускной способности, является тупиковым.
      Категория midrange представляет собой сред-ний уровень иерархии и нацелена на заказчиков в лице предприятий среднего масштаба и удаленных филиалов крупных компаний. Обладая значительной емкостью хранения и высокой производительностью, такие системы покрывают большую часть типовых задач хранения данных, при этом они хорошо масштабируются и обеспечивают полный набор технологий и технических решений по защите данных, их репликации, синхронизации, со-хранению целостности и т. д.
      Категория enterprise – высший уровень иерар-хии – ориентирована на крупных и сверхкрупных корпоративных заказчиков и в опреде-ленной мере представляет собой специфический класс продуктов. Решения этого класса не только позволяют строить интегрированные корпоративные хранилища данных огром-ного масштаба и создавать многоярусные системы хранения, они также обладают воз-можностью объединять в единое виртуальное пространство уже имеющиеся у заказчика системы хранения разных типов, классов и поколений, что обеспечивает практически без-граничный уровень масштабирования емкости хранения.
      Предметное рассмотрение обозначенных кате-горий и входящих в них моделей в данном обзоре построено в обратном порядке – от en-terprise-продуктов к системам entry-level.

      Структура товарного предложения
      На российском рынке дисковых СХД активно работает достаточно много компаний. К основным игрокам этого сектора можно отнести «Аквариус», Dell, EMC, Hitachi Data Systems (HDS), HP, IBM, Kraftway, Network Appliance (NetApp), Sun Microsystems. Их суммарный товарный портфель включает около 140 мо-делей СХД разного типа. При этом мы рассматривали только те системы хранения, кото-рые были представлены и активно предлагались на отечественном рынке в течение 2007 г. В сопровождающие статью таблицы также включены модели, объявленные в начале 2008 г. Следует отметить, что компании перечислены в алфавитном порядке, без учета их объемов продаж, долей рынка и прочих коммерческих показателей. Такой подход мы обычно применяем при анализе товарного предложения с целью ознакомления потенци-ального потребителя со всем спектром имеющейся продукции.
      Далее рассматривается представленность продуктов указанных вендоров в выделенных нами сегментах рынка дисковых СХД.

      Сегмент Enterprise
      SAN-системы
      В этой категории оказались представлены лишь решения ведущих мировых игроков: EMC, HDS, HP, IBM, NetApp и Sun Microsystems, что говорит о высоком пороге вхождения в данный сектор рынка (см. табл. 1). Очевидно, это связано не только с высокими техническими характеристиками СХД, достижение ко-торых само по себе требует серьезных инженерной школы, но и с описанными выше ка-чественными параметрами СХД, реализующими функционал, который обеспечивает до-полнительную ценность для бизнеса заказчиков. Одной из ключевых тенденций этого сектора, хорошо прослеживаемой при переходе от поколения к поколению СХД на таких продуктах, как, к примеру, EMC Symmetrix DMX-3/DMX-4 или HP StorageWorks XP12000 / XP24000, является широкое внедрение недорогих SATA-дисков большой емкости. Такой подход позволяет решить две ключевые задачи: значительно – до сотен терабайтов – увеличить максимальный объем хранилища данных; на основе концепции управления жизненным циклом информации (ILM, Information Lifecycle Management) реализовать оп-тимальное с точки зрения стоимости хранения данных ярусное хранилище. Отметим так-же, что в системах этого класса впервые в массовом масштабе использованы носители на базе флэш-памяти. Например, система EMC Symmetrix DMX-4 благодаря использова-нию SSD-накопителей (Solid State Drive) предоставляет пользователям так называемый нулевой уровень хранения с наивысшей скоростью доступа к данным.

      NAS-системы
      Формально в рамках обзора этот сектор ока-зался занят одним-единственным поставщиком – корпорацией IBM, при этом в итоговую таблицу (см. табл. 2) попал целый набор моделей из семейства System Storage N7000. Такая ситуация связана с особенностями принятого в обзоре подхода: исключив из рас-смотрения NAS-шлюзы, мы опустили целый спектр решений таких компаний, как HDS, HP, IBM, NetApp и Sun Microsystems, предлагающих заказчикам вместо монолитных NAS-систем решения, соединяющие в себе специализированные серверы с функционалом NAS и сетевые NAS-хранилища из существующего модельного ряда. При наличии доста-точно больших объемов хранения такая схема организации доступа к данным на уровне сетевых файловых систем во многих случаях оказывается экономически более целесо-образной. Очевидно, оценивая все за и против, в том числе значительные первоначаль-ные расходы на развертывание и высокую стоимость владения монолитными NAS-системами enterprise-класса, многие поставщики отдают предпочтение альтернативной схеме. Говоря о «монолитных» NAS-системах IBM этого класса, необходимо упомянуть, что не так давно корпорация в очередной раз обновила свой модельный ряд, и на смену системам System Storage N7800 и N7600 пришли новые – System Storage N7900 и N7700 соответственно. Среди ключевых новшеств стоит отметить увеличение максимальной емкости хранения у модели N7900 за счет поддержки большего количества модулей рас-ширения и переход обеих моделей к более производительному 4-Гбит/с хост-интерфейсу Fibre Channel.

Полная электронная версия этой статьи доступна только для подписчиков. Для получения полной электронной версии статьи сейчас Вы можете оформить запрос.