VRRPseverity: highresolved
PAS-K L4 스위치 VRRP 액티브-스탠바이 비정상 동작으로 인한 서비스 중단
증상 및 본문
2023년 10월 26일 14시 30분경, PAS-K2000 모델 L4 스위치 이중화 구성(펌웨어 v5.1.0) 중 액티브 장비 재부팅 후 스탠바이 장비로의 VRRP 절체가 이루어지지 않아 서비스에 약 10분간 장애가 발생했습니다. 대상 장비는 데이터센터의 웹 서비스 로드밸런싱을 담당하며, 장애 발생 시 해당 웹 서비스 접속이 불가했습니다. 초기 조치로 스탠바이 장비의 VRRP 상태를 수동으로 확인하였으나, 마스터로 전환되지 않았습니다. 액티브 장비가 재부팅 완료 후 다시 마스터 역할을 수행하며 서비스가 복구되었습니다. 이중화 구성에 대한 점검이 필요합니다.
근본 원인
VRRP 우선순위 설정 오류로 인해 스탠바이 장비가 액티브 장비의 장애 상황에서 마스터 역할을 정상적으로 인계받지 못했습니다.
조치
스탠바이 장비의 VRRP 우선순위를 액티브 장비보다 높게 설정하여 장애 발생 시 우선적으로 마스터가 되도록 변경했습니다. 'config vrrp group 1 priority 110' 명령어를 사용하여 우선순위를 조정했습니다.
코멘트 (1)
- 파트너2025. 09. 28. PM 05:22현장 도착, 장비 전원 상태 정상 확인. 콘솔 접속 가능.
연결된 발행물 (1) — Notice/FAQ/Case Report/지식 DB
- 장애 Notice#1published2025. 09. 29. AM 09:22장애 Notice — PAS-K L4 스위치 VRRP 절체 실패로 인한 서비스 중단
본문 펼치기
# 장애 Notice — PAS-K L4 스위치 VRRP 절체 실패로 인한 서비스 중단 ## 개요 2023년 10월 26일 14시 30분경, PAS-K2000 모델 L4 스위치(펌웨어 v5.1.0) 이중화 구성 환경에서 액티브 장비 재부팅 시 VRRP 절체가 정상적으로 이루어지지 않아 약 10분간 웹 서비스 접속 장애가 발생했습니다. 스탠바이 장비가 마스터 역할을 인계받지 못하여 서비스 중단이 발생했으며, 액티브 장비 복구 후 서비스가 정상화되었습니다. ## 영향 범위 - 영향 받은 시스템/서비스: 데이터센터 웹 서비스 로드밸런싱 - 영향 시간대: 2023년 10월 26일 14:30 ~ 14:40 (약 10분) - 영향 받은 고객사 수: 미상 ## 근본 원인 VRRP 우선순위 설정 오류로 인해 스탠바이 장비가 액티브 장비의 장애 상황에서 마스터 역할을 정상적으로 인계받지 못하여 서비스 절체가 실패했습니다. ## 조치 내역 1. 스탠바이 장비의 VRRP 상태를 수동으로 확인하였으나, 마스터로 전환되지 않음을 확인했습니다. 2. 액티브 장비 재부팅 완료 후 마스터 역할을 다시 수행하며 서비스가 복구되었습니다. 3. 스탠바이 장비의 VRRP 우선순위를 액티브 장비보다 높게 설정하여 장애 발생 시 우선적으로 마스터가 되도록 변경했습니다. - `config vrrp group 1 priority 110` (임시 조치 후 영구 적용) ## 재발 방지책 - VRRP 우선순위 및 Preempt 설정에 대한 정기적인 점검 및 가이드라인 준수 - 이중화 구성 장비의 펌웨어 최신 버전 유지 권장 - VRRP 상태 및 절체 이벤트에 대한 모니터링 강화 - 장애 발생 시 자동 절체 테스트 주기적 수행 ## 관련 정보 - 참고 케이스: #CASE-1 - 관련 KB: (있는 경우) - 담당: TAC [엔지니어] --- *본 Notice는 AI 초안입니다. 게시 전 담당 엔지니어와 PM의 검토·승인이 필요합니다.*
RMA 요청 (1)
- RMA #1교체approved2025. 09. 27. AM 07:22PSU(전원부) 단속 — 부팅 실패 반복SN: PSK476417