Configseverity: normalresolved
PAS-K4810 로드밸런싱 알고리즘 변경 후 특정 서버 부하 불균형
증상 및 본문
2024년 9월 3일 오전 11시, PAS-K4810 장비의 L4 로드밸런싱 알고리즘을 'Round Robin'에서 'Least Connection'으로 변경했습니다. 변경 후 특정 백엔드 서버로만 트래픽이 집중되고 다른 서버들은 유휴 상태로 남는 심각한 부하 불균형 현상이 발생했습니다. 해당 서버는 과부하로 인해 응답 속도가 현저히 저하되었으며, 간헐적으로 접속 불가 상태가 되었습니다. 영향을 받는 서비스는 대용량 데이터 처리 시스템으로, 약 1000명의 외부 사용자가 접속하고 있습니다. 변경 직후 모니터링 시스템에서 경고가 발생했으나, 원인 파악에 시간이 소요되어 약 45분간 서비스 품질 저하가 지속되었습니다.
근본 원인
Least Connection 알고리즘은 기존 커넥션 수를 기반으로 분배하지만, 기존 세션이 오래 유지되는 환경에서는 새로운 커넥션이 특정 서버로만 몰려 부하 불균형이 발생할 수 있습니다.
조치
로드밸런싱 알고리즘을 'Weighted Least Connection'으로 변경하고, 각 서버의 성능에 따라 가중치를 부여했습니다. 'config t' -> 'l4a pool <pool_name>' -> 'lb-method weighted-least-connection' -> 'server <server_ip> weight <value>' -> 'write memory' 명령어를 통해 설정을 반영했습니다. 각 서버의 CPU 및 메모리 사용률을 고려하여 가중치를 조정했습니다.
코멘트 (0)
코멘트가 없습니다.