Отказоустойчивые серверы ServerNet
Виктор Шнитман,
Институт системного программирования РАН vzs@ivann.delta.msk.su
Архитектура систем NonStop
Архитектура систем Integrity
Архитектура системы на базе ServerNet
Сеть ServerNet
Процессорный модуль
Организация ввода/вывода
Дуплексная обработка
Возможности масштабирования
Система обслуживания
Инициализация
Программное обеспечение
Компьютеры на базе технологии ServerNet
Заключение
Надежные вычислительные машины являются ключевыми элементами для
построения наиболее ответственных прикладных систем, используемых в сфере
торговли, финансов и телефонной коммутации. На современном этапе развития
информационных технологий подобные приложения предъявляют повышенные требования
к масштабируемости, поддержке открытых стандартов и обеспечению отказоустойчивости.
Одной из известных в мире фирм, работающих в данной области, является компания
Tandem, которая для удовлетворения растущих требований рынка надежных вычислений
поставляет сегодня две различные линии серверов: системы Tandem NonStop
и системы Tandem Integrity.
Системы Tandem NonStop, первые модели которых появились еще в 1976 году,
базируются на реализации многопроцессорной обработки и модели распределенной
памяти. Для обеспечения восстановления аппаратуры и ошибок ПО после сбоев
эти системы используют механизмы передачи сообщений между процессорными
парами. База данных NonStop SQL, в основе архитектуры которой лежит модель
системы без разделения ресурсов (shared-nothing), показала линейную масштабируемость
в приложениях обработки транзакций на конфигурациях, содержащих более 100
процессоров. Первоначально системы NonStop были нацелены на создание приложений
оперативной обработки транзакций (OLTP), но сегодня интенсивно используются
и в других ответственных приложениях, таких как системы передачи сообщений,
поддержки принятия решений.
Чтобы удовлетворить потребности в отказоустойчивых системах, позволяющих
выполнять без переделок существующие UNIX-приложения, в 1990 году Tandem
начала выпуск систем Integrity. Для маскирования ошибок в работе систем
Integrity используются методы аппаратной избыточности (трехкратное резервирование),
обеспечивающие продолжение непрерывной работы в условиях сбоев без воздействия
на приложения. Системы Integrity часто применяются в телефонных и сотовых
сетях связи, а также в других коммерческих приложениях, требующих реализации
надежных систем, удовлетворяющих открытым стандартам.
Хотя обе линии компьютеров имеют отличия, они удовлетворяют целому ряду
общих требований и используют многие общие технологии и компоненты. Все
системы Tandem гарантируют целостность данных и устойчивость к сбоям, и
кроме того, обеспечивают масштабируемость и возможность производить модернизацию
системы в режиме on-line. Обе линии NonStop и Integrity позволяют выполнять
техническое обслуживание: установка и замена плат, источников питания и
вентиляторов без остановки системы и выключения питания. Применяемые конструкции
допускают установку обеих систем в офисных помещениях, стандартных машинных
залах или на телефонных станциях. В системах используется много общих компонентов:
накопители на дисках, элементы памяти и микропроцессоры.
В 1991 году Tandem начала программу объединения лучших свойств обеих
систем в единую линию. Эта программа дает возможность гибкой реализации
целого ряда важнейших свойств: устойчивости к сбоям - восстановление после
проявления неисправности может выполняться как программными, так и аппаратными
средствами, масштабируемости - построение кластеров на базе модели распределенной
памяти и реализация мультипроцессорной обработки в разделяемой общей памяти,
а также использование нескольких ОС (NonStop Kernel, Unix и Windows NT).
Основой для объединения архитектур послужила разработка главного транспортного
средства - системной сети ServerNet, многоступенчатой пакетной сети, используемой
как для организации межпроцессорных связей, так и для реализации связей
с устройствами ввода/вывода. ServerNet обеспечивает эффективные средства
для обнаружения и изоляции неисправностей, а также реализует прямую поддержку
альтернативных каналов передачи данных для обеспечения непрерывной работы
при наличии отказов сети. Эта разработка предоставляет новые возможности
развития обеих линий, включая большую масштабируемость, интерфейсы с открытыми
стандартами шин и улучшенную поддержку мультимедийных приложений.