С ростом размеров локальных сетей все более остро встает вопрос обеспечения отказоустойчивости за счет дополнительных соединений, что обеспечивает допольнительные маршруты для передачи трафика. Другими словами, если по одному из маршрутов передача трафика на данный момент невозможна (например, из-за обрыва), то появится возможность передавать трафик по дополнительному маршруту – резервному.
Однако, подобная схема с дополнительным соединением позволяет организовать бродкастный шторм, в результате чего, коммутаторы сети будут передавать только бродкастный фрейм. Попытка же передать пользовательские данные приведет к отрицательному результату.
Для решения подобной проблемы есть целый ряд механизмов на канальном уровне, позволяющих предотвратить подобное явление. Одним из них является использование протокола STP(Spanning Tree Protocol), который разработала Радья Пельман в 1985 году. На данный момент этот протокол является стандартным, описан в IEEE 802.1d, поддерживается всеми производителями сетевого оборудования. Кроме того производители сетевого оборудования включают данный протокол по умолчанию, и, даже если объединить несколько коммутаторов в петлю, то получить на них бродкастный шторм не получится. Данный протокол позволяет логически блокировать передачу трафика через избыточные соединения, тем самым разрывая петлю и препятствуя возникновению бродкастных штормов. Данный механизм является надежным, однако время его сходимости на сети занимает 50 секунд, то есть, в течение 50 секунд по сети нет возможности для передачи пользовательского трафика, что является большим временем простоя . C момента создания протокола STP прошло достаточное количество времени, за которое появились реализации позволяющие значительно сократить время схождения сети в случае изменений и обеспечить балансировку (Rapid Spanning Tree Protocol - стандарт IEEE 802.1w и Multiple Spanning Tree Protocol - стандарт 802.1s). Тем не менее, тенденция «чем больше сеть тем больше потребуется времени на восстановление работоспособности» сохраняется при любой реализации.
У различных вендоров есть протоколы позволяющие отказаться от протокола STP, сократить время восстановления работоспособности сети при сохранении высокого уровня защиты от возникновения бродкастных штормов, например, Extreme Networks – Ethernet Automatic Protection Switching, Allied Telesis – Ethernet Protection Switching Ring. Подобный механизм есть и у компании Huawei, он носит название Rapid Ring Protection Protocol(в дальнейшем RRPP)
Данный протокол, разработанный компанией Huawei, позволяет предотвратить появление петель на сети и обеспечивает быструю сходимость, что влечет за собой уменьшение времени простоя сети. Общий принцип работы RRPP схож с принципом работы STP. Коммутаторы определяют наличие петель на сети, после чего устраняют их , путем блокирования интерфейсов, однако в случае возникновения проблем, например, при обрыве соединения, заблокированные интерфейсы перейдут в рабочее состояние и сохранят работоспособность сети. При этом, в отличие от протоколов RSTP и MSTP, независимо от размеров сети, скорость воcстановления работоспособности не превышает 50 мс.
Протокол RRPP поддерживается всеми коммутаторами компании Huawei, начиная с коммутатора уровня доступа S2700-EI. Но, в отличии от протокола STP, он не запущен по умолчанию и требует определенных знаний и навыков для его реализации.
Протокол Rapid Ring Protection Protocol не может работать параллельно с протоколами и механизмами Loopback Detection, SmartLink, MUX VLAN, STP, поэтому перед запуском RRPP их необходимо отключить.
Основные концепции RRPP
Коммутаторы с одинаковым номером домена и контрольной VLAN, образуют RRPP-домен. На сети может быть настроен как один единственный домен, так и несколько Этот механизм позволяет обеспечить балансировку нагрузки на сети, повышая тем самым её эффективность. Для этого применяются наработки из протокола MSTP (используется понятие instance). . Это позволяет обеспечить балансировку сразу для группы, а не только для отдельных VLAN.
Кольца сети называются RRPP-кольцами. В одном RRPP-домене может быть как одно, так и несколько колец. Если колец в домене несколько, то одно из них будет первичным или основным, а все остальные будут подкольцами
VLANы, которые присутствуют в домене, делятся на два типа:
Control VLAN - в ней передаются служебные сообщения протокола RRPP. Для основного кольца в этом случае необходимо указать VLAN самостоятельно, а для подкольца VLAN будет выбрана автоматически по формуле «номер Control VLAN + 1».
Вторым типом VLAN являются такие VLAN, в которых передается пользовательский трафик.
В зависимости от местонахождения в кольце коммутатора в RRPP-домене, он может быть в следующих режимах:
- Master: Коммутатор, выполняющий функции мастера, имеется один на каждом кольце и выполняет функции по определению кольца и его разрыву, независимо от того основное оно или нет.
- Transit: Все коммутаторы, кроме мастера, на основном кольце будут в режиме транзит. Если в домене несколько колец, то в режиме транзит будут все коммутаторы, кроме мастеров каждого кольца, а так же устройств, которые являются общими для основного и подколец.
- Edge: В данном режиме находится устройство, которое одновременно входит в состав как основного, так и подкольца.
- Assistant-edge: Этот режим используется на устройстве, которое входит в состав как основного кольца, так и подкольца. Коммутаторы в режимах Assistant-edge и Edge используются для проверки целостности основного кольца и защите от петель.
Каждое устройство в режиме Master или Transit имеет по два порта, которые ассоциируются с RRPP-кольцом, при этом один порт будет основным, а другой вторичным. Роли портов администратор указывает самостоятельно. На устройстве в режиме master основной порт используется для отправки RRPP-пакетов для определения петель. Вторичный порт блокирует пользовательский трафик, разрешая только трафик RRPP из Control VLAN, если проблем на сети нет. Если на кольце произошел обрыв, то вторичный порт разрешает передачу пользовательского трафика. Для устройств в режиме Transit нет разницы между основным и вторичным портами.
Для коммутаторов работающих в режимах Edge и Assistant-edge предусмотрены еще два типа портов: общий порт, который ассоциируется с основным кольцом и с подкольцом, а так же граничный порт, относящийся только к подкольцу.
Коммутатор в режиме Master использует два значения времени для отсылки и получения RRPP-пакетов:
- Hello-таймер
- Fail-таймер.
Hello-таймер используется для отправки RRPP-пакетов типа Health. Fail-таймер контролирует время ожидания вторичным портом Health пакета. Соответственно, пока вторичный порт получает Health-пакет до истечения таймера Fail, предполагается, что кольцо в порядке. Если таймер Fail истек, вторичный порт разрешает передачу пользовательского трафика. Значения таймеров могут быть изменены администратором, однако стоит помнить, что таймер Fail должен быть в три раза больше значения Hello-таймера.
RRPP пакеты
Тип | Описание |
Health | Коммутатор в режиме Master расслылает данные пакеты с целью проверки целостности кольца |
Link-Down | Данный пакет рассылают коммутаторы в режимах Transit, Edge или Assistant-edge для уведомления Master об исчезновении кольца в случае падения линка. |
Common-flash-FDB | Коммутатор в режиме Master рассылает данные сообщения с целью уведомить коммутаторы в режиме Transit для обновления из MAC и ARP записей, когда RRPP кольцо разрывается. |
Complete-Flush-FDB | Коммутатор в режиме Master рассылает данные сообщения с целью уведомить коммутаторы в режиме Transit для обновления их MAC и ARP записей, и освобождения от блокировки портов, когда целостность кольца восстановилась |
Edge-Hello | Данный пакет расслыается для проверки основного кольца между коммутаторами в режимах Edge и Assistant |
Major-Fault | Пакет рассылается коммутатором в режиме Assistant-edge для уведомления Edge о проблемах с линком мeжду edge и assistant-edge |
Принцип работы RRPP
Коммутатор в режиме Master переодически рассылает Health-пакеты через control VLAN. Если кольцо в рабочем состоянии, то вторичный порт получает эти сообщения и находится в заблокированном состоянии, не пересылая пользовательский трафик. Если Fail таймер сработал, а Health-пакеты не были получены, то вторичный порт начинает осуществлять передачу пользовательского трафика. Master в это время рассылает Common-flash-FDB с целью обновления MAC и ARP записей на остальных коммутаторах в сети.
Для увеличения скорости работы протокола предусмотрем механизм, согласно которому, коммутаторы в режимах Transit, Edge и Assistant-edge высылают Link-Down пакет сразу после фиксации падения одного из интерфейсов RRPP-домена. Master в этом случае выводит вторичный порт из заблокированного стотояния и рассылает Common-flash-FDB.
Когда порт на не-master восстановлен после сбоя, коммутатор пропускает через него только трафик из control VLAN. Частичная блокировка этого порта сделана для предотвращения петель и прекращается сразу, как только появится уверенность, что полная разблокировка не приведет к бродкастному шторму.
Можно сделать вывод, что компании Huawei посредствам протокола RRPP действительно удалось получить высокие показатели защиты сети от возникновения петель и восстановлению работоспособности при обрывах (не более 50 мс). Это стало возможно благодаря тому, что компания развивается и работает над улучшением качества своей продукции. Однако, следует заметить, что настройка подобных технологий требует определенных знаний при работе с оборудованием Huawei. Навыки и знания, необходимые для работы с оборудованием Huawei можно получить в учебном центре Эврика, который предоставляет не только качественное обучение, но и возможность поработать с реальным оборудованием в процессе обучения.