케이스 #72

포스코케미칼

Memoryseverity: criticalresolved

PAS-K3232 L7 스위치 OOM 발생 후 장비 응답 불가 및 서비스 중단

고객사
장비
PAS-K 4500 (FW 4.5.1)
등록일시
2025. 02. 08. AM 02:24
종결일시
2025. 02. 09. PM 12:24

증상 및 본문

2024년 5월 20일 03시경, PAS-K3232 L7 스위치(펌웨어 v6.0.3)에서 Out Of Memory(OOM) 오류가 발생하며 장비가 응답하지 않는 현상이 발생했습니다. 이로 인해 해당 스위치를 통해 제공되던 모든 서비스가 약 15분간 중단되었습니다. 장애 발생 직전 SNMP 모니터링 상으로는 메모리 사용량이 급증하는 것이 확인되었으며, CLI 접속 또한 불가능했습니다. 강제 재부팅 후 서비스는 복구되었으나, 동일 현상 재발에 대한 우려가 큽니다. 비정상적인 트래픽 유입은 없었던 것으로 보입니다.

근본 원인

불필요한 대량의 캐시 데이터가 축적되면서 가용 메모리가 소진되어 OOM이 발생했습니다.

조치

캐시 클리어 스케줄링을 설정하고, 캐시 정책을 최적화하여 만료된 캐시가 즉시 제거되도록 조치했습니다. CLI 명령어로 'cache clear all'을 주기적으로 실행하도록 스크립트를 추가하고, 'cache policy default expire 3600'으로 설정했습니다.

코멘트 (0)

코멘트가 없습니다.