가용성

가용성(Availability)은 권한을 가진 사용자나 애플리케이션이 원할 때 원하는 서비스를 지속적으로 사용할 수 있도록 보장하는 특성이다. 아무리 데이터를 잘 보호해도 필요할 때 접근할 수 없다면 쓸모가 없다는 점에서, 정보보호 3요소(CIA)의 한 축을 이룬다.

측정

가용성은 흔히 백분율과 “나인(nine)“으로 표현한다.

가용성연간 허용 다운타임
99%3.65일
99.9% (“three nines”)8.76시간
99.99% (“four nines”)52.6분
99.999% (“five nines”)5.26분

서비스 규모가 커질수록 나인 하나를 더 얻기 위한 비용은 기하급수적으로 늘어난다.

가용성을 위협하는 요인

  • 하드웨어 장애: 디스크·서버·전원
  • 소프트웨어 결함: 메모리 누수, 무한 루프
  • 과부하: DDOS, 트래픽 급증
  • 운영 실수: 배포 사고, 잘못된 설정
  • 자연재해: 정전, 지진, 화재

높이는 방법

  • 이중화(Redundancy): 같은 구성 요소를 여러 개 두기
  • 장애 조치(Failover): 장애 시 자동 전환
  • 로드 밸런싱: 트래픽 분산
  • 지역 분산(Multi-Region): 데이터센터 장애 대비
  • 자동 스케일링: 부하 변화에 따른 자동 확장

관련 개념과의 관계

  • 신뢰성: 연속해서 정상 동작할 확률
  • 가용성: 어느 시점에 사용 가능할 확률

신뢰성이 낮아도 빠른 복구(MTTR)가 가능하면 가용성은 높을 수 있다.

관련 노트