Hardware - разное

       

Отказоустойчивые серверы ServerNet


Виктор Шнитман,

Институт системного программирования РАН vzs@ivann.delta.msk.su

Архитектура систем NonStop

Архитектура систем Integrity

Архитектура системы на базе ServerNet

Сеть ServerNet

Процессорный модуль

Организация ввода/вывода

Дуплексная обработка

Возможности масштабирования

Система обслуживания

Инициализация

Программное обеспечение



Компьютеры на базе технологии ServerNet

Заключение

Надежные вычислительные машины являются ключевыми элементами для

построения наиболее ответственных прикладных систем, используемых в сфере

торговли, финансов и телефонной коммутации. На современном этапе развития

информационных технологий подобные приложения предъявляют повышенные требования

к масштабируемости, поддержке открытых стандартов и обеспечению отказоустойчивости.

Одной из известных в мире фирм, работающих в данной области, является компания

Tandem, которая для удовлетворения растущих требований рынка надежных вычислений

поставляет сегодня две различные линии серверов: системы Tandem NonStop

и системы Tandem Integrity.

Системы Tandem NonStop, первые модели которых появились еще в 1976 году,

базируются на реализации многопроцессорной обработки и модели распределенной

памяти. Для обеспечения восстановления аппаратуры и ошибок ПО после сбоев

эти системы используют механизмы передачи сообщений между процессорными

парами. База данных NonStop SQL, в основе архитектуры которой лежит модель

системы без разделения ресурсов (shared-nothing), показала линейную масштабируемость

в приложениях обработки транзакций на конфигурациях, содержащих более 100

процессоров. Первоначально системы NonStop были нацелены на создание приложений

оперативной обработки транзакций (OLTP), но сегодня интенсивно используются

и в других ответственных приложениях, таких как системы передачи сообщений,

поддержки принятия решений.

Чтобы удовлетворить потребности в отказоустойчивых системах, позволяющих

выполнять без переделок существующие UNIX-приложения, в 1990 году Tandem


начала выпуск систем Integrity. Для маскирования ошибок в работе систем

Integrity используются методы аппаратной избыточности (трехкратное резервирование),

обеспечивающие продолжение непрерывной работы в условиях сбоев без воздействия

на приложения. Системы Integrity часто применяются в телефонных и сотовых

сетях связи, а также в других коммерческих приложениях, требующих реализации

надежных систем, удовлетворяющих открытым стандартам.

Хотя обе линии компьютеров имеют отличия, они удовлетворяют целому ряду

общих требований и используют многие общие технологии и компоненты. Все

системы Tandem гарантируют целостность данных и устойчивость к сбоям, и

кроме того, обеспечивают масштабируемость и возможность производить модернизацию

системы в режиме on-line. Обе линии NonStop и Integrity позволяют выполнять

техническое обслуживание: установка и замена плат, источников питания и

вентиляторов без остановки системы и выключения питания. Применяемые конструкции

допускают установку обеих систем в офисных помещениях, стандартных машинных

залах или на телефонных станциях. В системах используется много общих компонентов:

накопители на дисках, элементы памяти и микропроцессоры.

В 1991 году Tandem начала программу объединения лучших свойств обеих

систем в единую линию. Эта программа дает возможность гибкой реализации

целого ряда важнейших свойств: устойчивости к сбоям - восстановление после

проявления неисправности может выполняться как программными, так и аппаратными

средствами, масштабируемости - построение кластеров на базе модели распределенной

памяти и реализация мультипроцессорной обработки в разделяемой общей памяти,

а также использование нескольких ОС (NonStop Kernel, Unix и Windows NT).

Основой для объединения архитектур послужила разработка главного транспортного

средства - системной сети ServerNet, многоступенчатой пакетной сети, используемой

как для организации межпроцессорных связей, так и для реализации связей

с устройствами ввода/вывода. ServerNet обеспечивает эффективные средства

для обнаружения и изоляции неисправностей, а также реализует прямую поддержку

альтернативных каналов передачи данных для обеспечения непрерывной работы

при наличии отказов сети. Эта разработка предоставляет новые возможности

развития обеих линий, включая большую масштабируемость, интерфейсы с открытыми

стандартами шин и улучшенную поддержку мультимедийных приложений.


Содержание раздела