Метрокластер: 5 основных “active -active” решений. Часть 5.
Кластерный MetroCluster (сокращенно MCC) — это решение для хранения данных в режиме «активный-активный», которое может улучшить встроенные функции высокой доступности и бесперебойной работы оборудования и программного обеспечения хранения данных, а также обеспечить дополнительный уровень защиты для всей среды хранения и хоста. Благодаря двойному управлению хранилищем серии FAS/V контроллеры разделяются оптоволоконным кабелем или оптоволоконными коммутаторами для формирования удаленной пары высокой доступности. Зеркальное отображение данных на уровне Aggr достигается между контроллерами через SyncMirror , а зеркала хранения данных физически разделены. Для дальнейшего повышения избыточности локального контроллера два контроллера размещаются локально и удаленно соответственно. Два локальных контроллера образуют пару пар высокой доступности, а две пары локальных и удаленных кластеров образуют кластер из четырех узлов для защиты друг друга.
Особенности решения
Сетевое взаимодействие уровня хранения: Сетевое взаимодействие уровня хранения MetroCluster очень сложное.
Главный и подчиненный сайты поддерживают сетевое взаимодействие FC протяженностью 300 км; кластер SAN поддерживает максимум 12 контроллеров, а кластер NAS поддерживает максимум 8 контроллеров; в сетевом взаимодействии с 4 контроллерами на рисунке ниже необходимо настроить 3 типа сетевых устройств, 6 типов сетей и 12 наборов сетевых устройств одновременно: включая 4 набора устройств преобразования FC в SAS, 4 набора коммутаторов FC и 4 набора коммутаторов 10GE; между двумя контроллерами в движке не поддерживается соединение PCI-E, и требуется внешнее сетевое соединение 10GE/4GE Ethernet; арбитраж третьего сайта может выбирать IP-связь, а программное обеспечение арбитража TieBreaker может быть установлено непосредственно на хосте Linux.
MetroCluster включает в себя несколько типов синхронизации данных, включая синхронизацию двух кластерных конфигураций, синхронизацию журналов NVRAM и синхронизацию внутренних дисков. Эти три типа синхронизации данных в системе используют разные сети. Сеть синхронизации двух кластерных конфигураций: через выделенную избыточную сеть TCP/IP служба CRS (служба репликации конфигурации) синхронизирует данные конфигурации двух кластеров в режиме реального времени, чтобы гарантировать, что конфигурация, измененная на одной стороне кластера, такая как добавление IP, SVM или добавление или удаление общего доступа пользователей, может быть автоматически синхронизирована с удаленным кластером HA Pair; Сеть синхронизации журналов NVRAM: используйте дополнительный избыточный адаптер кластера FC-VI для подключения двух кросс-сайтовых главных контроллеров. FC-VI поддерживает функции RDMA и QoS для синхронизации NVRAM и heartbeat между двумя кластерами, что может не только гарантировать приоритет heartbeat, но и сократить количество передач ввода-вывода записи данных, поскольку RDMA поддерживает пакетное получение группы технологии адресного пространства. После того, как группа адресов получена партиями, данные передаются напрямую позже, оптимизируя протокол FC с двух записей до почти одной записи ; Внутренняя сеть записи на диск данных: между контроллером и массивом хранения используется уникальное устройство FC-SAS. Передача данных контроллера использует сеть FC, а внутренний дисковый массив должен быть подключен и объединен в сеть через SAS, поэтому преобразование FC и SAS (Fibre Bridge) с использованием назначенных моделей Cisco и Brocade выделенных коммутаторов для соединения двух контроллеров сайта и внутренних дисков и завершения преобразования протокола.
MetroCluster: NVRAM каждого контроллера в MetroCluster разделена на четыре области, которые используются для хранения и доступа к локальному журналу узла, журналу партнера HA Pair, удаленному журналу партнера HA Pair и удаленному вспомогательному журналу HA Pair (для переключения). Когда запрашивается новая операция записи, она сначала записывается локально, затем синхронизируется с NVRAM локальной пары HA и NVRAM удаленной пары DR, а затем возвращает успешное выполнение; при отказе локального контроллера бизнес сначала переключается на узел HA Pair; после восстановления контроллера он автоматически переключается обратно. Только при отказе всего сайта бизнес переключается на удаленный сайт для работы. Время переключения контролируется так, чтобы оно было завершено в течение 120 секунд, не влияя на бизнес верхнего уровня.
Синхронизация SyncMirror : SyncMirror — это основная технология синхронизации данных Active-Active. Когда журнал NVRAM сбрасывается на диск, реализуется двойная запись дисков основного и подчиненного сайтов. SyncMirror работает на уровне агрегата. Зеркальный агрегат состоит из двух Plex, Plex0 из локального Pool0 и Plex1 из удаленного Pool1. Процесс записи: когда журнал NVRAM начинает сбрасываться на диск, запрос на запись будет записан на локальный Plex0 и удаленный Plex1 одновременно. После успешной записи обеих сторон возвращается успех. Процесс чтения: сначала данные будут считаны с локального Plex0. Разрешение на чтение удаленного Plex1 необходимо открыть с помощью команды. По умолчанию удаленный Plex1 не предоставляет службы чтения.
При отказе Plex на одной стороне сайта выполняется инкрементальное восстановление с помощью снимка Aggregate. По умолчанию в Aggregate зарезервировано место для создания снимков Aggregate, которые служат базовыми данными для повторной синхронизации Aggregate. Если снимки не сделаны, для восстановления после сбоя Plex требуется полная синхронизация.
Архитектура AP: решение MCC основано на зеркалировании дисков. Приложение верхнего уровня видит только один LUN/файловую систему. Активный-активный достигается посредством зеркального агрегата. В обычных условиях данные считываются из локального Plex и синхронизируются с локальным и удаленным Plex. Независимо от того, является ли это кластером MetroCluster с 2 или 4 узлами, в то же время LUN/файловая система может быть предоставлена только одному узлу кластера HA Pair. Только при отказе этого узла узел-партнер пары HA возьмет на себя управление и предоставит услуги, или при отказе всего сайта кластер пары HA с сайта возьмет на себя обслуживание. Переключение сайтов может быть запущено путем ручного выполнения команды CFOD или с помощью арбитражного программного обеспечения TieBreak для запуска автоматического переключения. Таким образом, по сути, это активный-активный режим между различными ядрами массива, а не активный-активный режим одного и того же LUN, поэтому это только активный-активный массив в активно-пассивном режиме.
Гетерогенная виртуализация: может взять на себя существующее гетерогенное хранилище, но не поддерживает активный-активный между локальными дисками серии FAS и гетерогенным хранилищем. Он поддерживает активный-активный между двумя наборами гетерогенного хранилища от одного производителя, одной модели и одной прошивки . При захвате гетерогенного хранилища исходные данные массива будут уничтожены. Перед захватом исходные данные массива необходимо перенести в другое место, а после захвата исходные данные необходимо перенести обратно.
Богатые функции с добавленной стоимостью: большинство продуктов FAS поддерживают MetroCluster, и отдельная лицензия не требуется. Базовый пакет продукта уже включает эту функцию; он может поддерживать SAN и NAS dual-active одновременно, реализуя интегрированную dual-active блочного хранилища и файлового хранилища; другие функции с добавленной стоимостью поддерживают ускорение SSD, моментальные снимки, репликацию, сжатие данных, тонкое выделение ресурсов, дедупликацию и другие функции;