VRRPseverity: normalresolved
PAS-K2000 VRRP Hold Timer 부족으로 인한 플리핑 현상
증상 및 본문
2023년 9월 25일 14시경, PAS-K2000 (v5.1.0) 이중화 환경에서 네트워크 상황이 불안정할 때 VRRP 마스터 역할이 액티브-스탠바이 간에 빠르게 번갈아 바뀌는 플리핑(flipping) 현상이 발생했습니다. 이는 짧은 시간 동안 여러 번의 절체를 유발하여 서비스에 순간적인 지연 및 끊김을 야기했습니다. 특히, 네트워크 유지보수 작업 중 이러한 현상이 더욱 두드러지게 나타났습니다. VRRP Hold Timer 값이 너무 짧게 설정된 것으로 의심됩니다.
근본 원인
VRRP Hold Timer 값이 너무 짧게 설정되어 있어, 일시적인 네트워크 지연이나 패킷 손실에도 액티브 장비가 다운된 것으로 오인하여 불필요한 절체가 빈번하게 발생했습니다.
조치
VRRP Hold Timer 값을 기본값(3초)보다 긴 10초로 설정하여, 일시적인 네트워크 불안정에도 안정적으로 마스터 역할을 유지하도록 변경했습니다. 'config vrrp group 1 hold-timer 10' 명령어를 사용했습니다.
코멘트 (1)
- 엔지니어2025. 01. 02. AM 03:22원격 접속 후 `show vrrp summary`로 상태 확인 중. 액티브 노드 우선순위 정상.