СХД по цене дисков?!
В наш адрес, как ИТ дистрибьютора, имеющегося прямые контракты с тремя крупнейшими производителями жестких дисков в мире – Western Digital, Seagate, Toshiba поступают запросы от партнеров, лейтмотив которых — на чем хранить данные, чтобы сэкономить бюджет?
В последнее время актуальность задачи «хранить данные недорого, но надежно» еще больше возросла в связи с принятием Правительством России правил хранения данных в соответствии с «пакетом Яровой». Сам текст Постановления доступен по ссылке. Утвержденные правила требуют от операторов связи с 1 октября 2018г. — хранение в полном объеме сообщений …за 30 суток, предшествующих дате ввода технических средств накопления информации в эксплуатацию.
Согласно современной методологии, весь объем хранения компании обычно делится на несколько слоев. Первый слой – максимально «горячие» данные, которые востребованы в ежедневной работе. Зачастую это критичные данные. Надежность и сохранность данных – вот основное требование для СХД данного слоя. Быстродействие и производительность тоже не помешают. Для эффективного решения в этом слое однозначно рекомендованы Enterprise СХД, уровня INFINIDAT, PURE Storage, IBM, NetApp, PANASAS и др. Они могут быть полностью all flash или гибридными, где есть свои внутренние слои RAM-SSD-HDD.
Следующие слои хранения – это более «медленные» данные. Это могут быть исторические данные, бэкапы, медиа данные и др. На чем хранить здесь? По опыту наших проектов, заказчики зачастую выбирают в данном слое различные SDS (software-defined storage). Это могут быть как open source — Lustre, CEPH так и коммерческие решения RAIDIX, Nexenta, Datacore, Windows Storage и др.
При этом сама инфраструктура строится на серверах (которые выполняют роль контроллеров) + полки хранения с дисками. Такой подход наиболее экономичен и эффективен.
Как говорят врачи, «препаратом первого выбора» при проектировании любой SDS являются полки с дисками -JBOD’ы (от англ. Just a bunch of disks, просто полка с дисками). Дешевле и надежнее брать джейбоды от производителя самих дисков. В стоимости самой полки, львиная доля – это как раз стоимость самих дисков. Из трех крупнейших мировых производителей дисков – Seagate, Western Digital, Toshiba, подобные полки уже несколько лет успешно выпускает Western Digital (HGST).
Самые последние разработки — это гибридные полки высокой доступности, непосредственно разработанные Western Digital — Ultrastar Data60 (720Тб, до 60 дисков в 4U) и Ultrastar Data102 (1.2 Петабайта, 102 диска в 4U).
В тестах вендора тот же Ultrastar Data102 показывает неплохие результаты по производительности.
На 12 серверов:
Последовательная нагрузка
Чтение = 24.2GB/s max. @ 1MB (237 MB/s per HDD max.)
Запись =23.9GB/s max. @ 1MB (234 MB/s per HDD max.)
Случайная нагрузка
Чтение 4kB с глубиной очереди = 128: >26k IOps
Запись 4kB с глубиной очереди 1–128: >45k IOps
Кто, как не производители дисков знают, как обеспечить максимальную производительность и долговременную работу дисков? Поэтому в таких полках хранения все в порядке с уровнем вибрации и охлаждением. Ведь именно вибрация и перегрев – наиболее критичные факторы для того, чтобы ваш жесткий диск прослужил долго.
Сзади у JBOD для каждого IO-модуля есть по 6 SAS 12G портов. Итого мы получаем 28800 MBps пропускной способности бэкенда. Порты можно использовать как для подключения к хостам, так и частично для каскадирования. 24 диска в JBOD могут быть SAS SSD (в случае JBOD Ultrastar Data102). Их можно установить и использовать как в гибридном режиме, так и настроив SAS Zoning, передав хосту нуждающемуся в all-flash.
Итак, если перед вами стоит задача создать большое хранилище данных петабайтных объемов – обратите внимание на гибридные полки высокой доступности. Для того, чтобы использовать возможности такого JBOD с максимальной пользой, потребуются программное обеспечение. Здесь оптимальным выбором является ПО RAIDIX. Для создания отказоустойчивой СХД потребуются два узла хранения и одна или более полок с SAS дисками. Если не стоит задача обеспечивать защиту от отказа узла или использовать репликацию данных, то можно подключить к корзине один сервер и использовать SATA диски.
Ниже приведена типовая схема на основе 2U серверах Supermicro 6029P-TRT
Использование дисковых полок безусловно эффективно и при построении горизонтально-масштабируемой системы, например, HyperFS или Lustre.
Вот примерная схема такой СХД: