재해 : 비즈니스 연속성 또는 재무 상태에 부정적인 영향을 미치는 모든 이벤트
ex) 하드웨어/소프트웨어 장애, 네트워크 중단, 정전, 화재나 수해 등 거눔ㄹ의 물리적인 손상, 인간의 실수, 기타 일부 심각한 재해
재해 복구 : 사업 및 시스템이 발전함에 따라 지속적으로 수행해야 할 분석 및 개선 과정.
ex) 각 사업 서비스에 대해 수용 가능한 복구 시점과 시간을 결정
기존 재해 복구 방식
: 재해 시, 여분의 용량을 확보하기 위해 인프라를 복제
: 용량 확보, 설치 및 유지관리하여 예상되는 용량 요구 사항을 처리할 준비를 갖추어야 함
: 정상 운영 시 활용율이 낮거나 과다하게 프로비저닝되는 경우가 많음
AWS 재해 복구 방식
: 필요에 따라 인프라 확장 가능
: 확장성, 신뢰성, 보안성, 속도 보장
: 사용한 만큼만 비용 지불
: 최소 권한 설계가 가능하도록 역할 분리가 가능한 도구를 제공
재해 계획 두 가지 일반적인 업계 용어 - 복구 시간 목표 및 복구 시점 목표
(1) 복구 시간 목표(RTO)
: 비즈니스 프로세스가 재해(또는 중단) 후 복구되어야 하는 시간 및 서비스 수준을 말하는 것으로, 비즈니스 연속성이 중단되어 발생하는 수용 불가능한 결과를 예방하기 위해 필요하다.
ex) 오후 12시에 재해가 발생했고, RTO가 8시간이면, 재해 복구 절차는 수용 가능한 서비스 수준으로의 복구가 오후 8시까지는 가능하도록 조처해야 하는 것
(2) 복구 시점 목표(RPO)
: 시간적으로 측정한, 수용 가능한 데이터 손실량을 말한다.
ex) RPO가 1시간이라면 재해가 정오에 발생했으므로 복구된 시스템에는 최소 오전 11시까지의 모든 데이터가 포함되어야 한다
기존의 재해 복구 투자 관행
복제 환경을 지원하는 데 필요한 인프라에 포함되는 항목
: 전력 공급 및 냉각을 포함한 인프라 수용 시설
: 자산의 물리적 보호를 위한 보안 인프라
: 환경 확장을 위한 적합한 수용 능력
: 인프라를 수리, 교체 및 재생하기 위한 지원
: 최대 부하 환경에서의 대역폭 사용률을 견딜 수 있는 인터넷 연결을 제공하기 위한 인터넷 서비스 공급자(ISP)와의 계약
: 방화벽, 라우터, 스위치 및 로드 밸런서 같은 네트워크 인프라.
: 사용자 인증, DNS(도메인 네임 서비스), DHCP(동적 호스트 구성 프로토콜), 모니터링 및 경고 등의 애플리케이션 및 백앤드 서비스를 실행하는 서버 및 지원 데이터를 위한 스토리지 장치를 포함하는 모든 미션 크리티컬 서비스를 실행할 충분한 서버 용량.
서비스 중요도에 따라 복제 환경을 장애 내결함성 방식으로 구성 가능 -> 위에 나열된 전체 인프라를 복제하는 작업 수반
재해 복구에 필수적인 AWS 서비스 및 기능
- 지역(Region)
- 스토리지(S3, EBS, Import/Export, Storage Gateway)
- 컴퓨팅(EC2, AMI, 예약 인스턴스, 가용영역, VM Import)
- 네트워킹(Route 53, Elastic IP Address, ELB, VPC, Direct Connect)
- 데이터베이스(RDS, SimpleDB)
- 배포 오케스트레이션(CloudFormation)
- 보안
(1) 지역
: AWS는 여러 지역에서 사용 가능하므로, 시스템을 완전히 배포할 장소뿐만 아니라 재해(버지니아 북부), 미국 서부(캘리포니아 북부), EU(아일랜드), 아시아 태평양(싱가포르), 아시아 태평양(도쿄)의 다섯 개 지역에서 사용 가능하다.
(2) 스토리지
1) Amazon Simple Storage Service(Amazon S3)
- 미션 크리티컬한 데이터 및 기본 데이터 저장을 위한 내구성이 뛰어난 스토리지 인프라를 제공
- 객체는 지역 내에서 여러 시설의 여러 장치에 중복 저장됨.
- Amazon S3 버전 관리, AWS MFA(Multi-Factor Authentication), 버킷 정책 및 Identity and Access Management(IAM)을 통해 데이터 보존 및 보관을 위한 추가 보호 수단을 제공한다.
2) Amazon Elastic Block Store(Amazon EBS)
- 데이터 볼륨의 PIT(Point In Time) 스냅샷을 생성하는 기능을 제공한다.
- 스냅샷은 새로운 Amazon EBS 볼륨을 시작하는 기점이 될 수 있으며 데이터를 장기간 보호할 수 있다
- 일단 볼륨을 생성하면 실행 중인 Amazon EC2 인스턴스에 연결 할 수 있다
- 인스턴스 수명과 관계없이 지속되는 오프 인스턴스 스토리지를 제공함
3) AWS Import/Export
- 전송용 이동식 스토리지 장치를 사용하여 대용량 데이터를 AWS에서 더욱 빠르게 이동할 수 있도록 지원한다.
- AWS는 Amazon의 고속 내부 네트워크를 사용해 인터넷을 우회하여 스토리지 장치에서 직접 데이터를 송수신한다.
- 용량이 큰 데이터 세트의 경우 AWS Import/Export가 대개 인터넷 전송보다 빠르며,
연결을 업데이트하는 것보다 비용 효율성이 높다.
- Amazon S3 버킷 안팎으로 또는 EBS 스냅샷으로 데이터를 마이그레이션 할 수 있다.
4) AWS Storage Gateway
- AWS 클라우드 스토리지와 온 프레미스 애플리케이션 사이에 데이터를 원활하게 마이그레이션할 수 있습니다.
- AWS Storage Gateway는 볼륨 데이터를 사용자 인프라 및 AWS에 로컬로 저장한다.
-> 기존 온 프레미스 애플리케이션에서 데이터를 비용 효율적이고 안전하고 견고한 AWS 스토리지 인프라에 원활하게 저장하고 이 데이터에 액세스할 때의 지연 시간을 줄인다.
(3) 컴퓨팅
1) Amazon Elastic Compute Cloud(Amazon EC2)
- 클라우드에서 규모를 자유 자재로 변경할 수 있는 컴퓨팅 파워를 제공한다.
- 몇 분 이내에 EC2 인스턴스를 생성할 수 있는데, 이는 온전한 제어 권한이 귀하에게 있는 가상 머신이다.
- 재해 복구 측면에서는 이처럼 귀하가 제어할 수 있는 가상 머신을 신속하게 생성할 수 있는 기능이 필수적이다.
2) Amazon Machine Image(AMI)
- 운영체제에 맞춰 사전 구성되며, 일부 사전 구성된 AMI에는 애플리케이션 스택이 포함될 수도 있다.
- 사용자만의 AMI를 구성할 수도 있다.
- 재해 복구 측면에서는 사용자만의 AMI를 구성하여 구별해 둔 후 복구 절차의 일부로 실행하는 것이 좋다.
- AMI는 사용자가 선택한 운영체제 및 적절한 애플리케이션 스택과 사전 구성해야한다.
3) Amazon EC2 예약 인스턴스
- EC2 인스턴스의 운영 비용 절감을 위해 종종 사용되는데, 재해 복구와 특히 관련된 다른 장점이 있다.
- 예약 인스턴스는 필요한 용량을 실제로 필요할 때 사용할 수 있도록 해준다.
4) 가용 영역
- 다른 가용 영역에 장애가 발생할 경우 분리되도록 설계된 별개의 위치로,
동일 지역의 다른 가용영역에 저렴하고, 지연 시간이 짧은 네트워크 연결을 제공한다.
- 별도의 가용 영역에서 인스턴스를 시작함으로써 단일 위치에서 장애가 발생할 경우 애플리케이션을 보호할 수 있다.
- 지역은 하나 이상의 가용 영역으로 구성된다.
5) Amazon EC2 VM Import
- 머신 이미지를 기존 환경에서 Amazon EC2 인스턴스로 손쉽게 가져올 수 있다.
(4) 네트워킹 - 재해 처리시 다른 장소에서 장애 조치할 때 네트워크 설정을 수정해야할 가능성이 크다.
1) Amazon Route 53
- 가용성과 확장성이 높은 DNS(도메인 이름 시스템) 웹 서비스이다.
- 개발자와 기업이 매우 신뢰할 수 있고 비용 효율적인 방식으로 최종 사용자를 인터넷 애플리케이션에 라우팅
2) Elastic IP Address
- 동적 클라우드 컴퓨팅에 적합하게 설계된 고정 IP 주소이다.
- 그러나 기존의 고정 IP 주소와 달리 엘라스틱 IP 주소를 사용해 공인 IP 주소를 특정 지역 내에 있는 계정의 인스턴스에 프로그래밍 방식으로 다시 매핑하여 인스턴스 또는 가용영역 장애를 마스킹할 수 있다.
- 재해 복구를 위해 대부분의 필수 시스템에 대한 IP 주소를 사전 할당하여 재해가 발생하기 전에 IP 주소를 미리 알 수 있다.
-> 이로써 재해 복구 계획을 간단히 실행할 수 있다.
3) Elastic Load Balancing
- 수신되는 애플리케이션 트래픽을 여러 Amazon EC2 인스턴스에 자동으로 분산한다.
- 애플리케이션의 내결함성을 크게 높이고, 수신되는 애플리케이션 트래픽에 응답하는 데 필요한 로드 밸런싱 용량을 원활하게 제공할 수 있음.
- 엘라스틱 IP 주소를 사전 할당하는 것과 마찬가지로, Elastic Load Balancer를 사전 할당하여 DNS 이름을 미리 알 수 있어 재해 복구 계획을 간단히 실행할 수 있다.
4) Amazon Virtual Private Cloud(Amazon VPC)
- AWS 클라우드에서 개인적이고 격리된 공간을 프로비저닝하고, 가상 네트워크를 정의해 AWS 리소스를 시작할 수 있다.
- 또한, IP 주소 범위, 서브넷 생성, 라우팅 테이블과 네트워크 게이트웨이의 구성을 선택하는 등 가상 네트워킹 환경을 완벽히 제어할 수 있다.
- 이렇게 하면 기업 데이터 센터와 VPC를 VPN 으로 연결하여 AWS 클라우드를 기업 데이터 센터의 연장선으로 활용할 수 있다.
- 재해 복구 측면에서는 Amazon VPC를 사용하여 기존 네트워크 토폴로지를 클라우드까지 확장할 수 있다.
- 이는 특히 일반적으로 내부 네트워크에 있는 기업 애플리케이션을 복구할 때 적합하다.
5) Amazon Direct Connect
- 귀하의 프레미스에서 AWS로 전용 네트워크를 간편하게 연결할 수 있다.
- 많은 경우, 이 서비스는 네트워크 비용을 줄이고, 대역폭 처리량을 높이며, 인터넷 기반 연결보다 더 일관된 네트워크 환경을 제공한다.
(5) 데이터베이스
1) Amazon Relational Database Service(Amazon RDS)
- 클라우드에서 관계형 데이터베이스를 더욱 간편하게 설정, 관리 및 확장할 수 있다.
- Amazon RDS를 재해 복구 준비 단계에서 사용하여 이미 실행 중인 데이터베이스에 있는 중요 데이터를 보존하거나 복구 단계에서 사용하여 생산 데이터베이스를 실행할 수도 있다.
2) Amazon SimpleDB
- 데이터베이스 관리 작업 부담을 덜어주는 고가용성의 유연한 비관계형 데이터 스토리지이다.
- 이 스토리지는 재해 복구 준비 및 복구 단계에서도 사용할 수 있다.
(6) 배포 오케스트레이션 - 자동화 방식으로 필요한 리소스를 생성할 수 잇으므로 복구단계에서 매우 유용
1) AWS CloudFormation
- 개발자와 시스템 관리자가 관련 AWS 리소스 집합을 쉽게 생성하고, 예측 가능하게 순서대로 프로비저닝하도록 지원
- 사용자의 환경에 맞는 템플릿을 생성하고 필요한 만큼 관련 리소스(스택) 집합을 배포할 수 있다.
(7) 보안
참조 페이지 : d36cz9buwru1tt.cloudfront.net/ko/WP/AWS_Disaster_Recovery_01242012.pdf
'AWS > 서비스 개념' 카테고리의 다른 글
[AWS] AWS CloudFormation (0) | 2021.01.08 |
---|---|
[AWS] Amazon Kinesis Data Firehose (0) | 2021.01.08 |
[AWS] Amazon VPC(Virtual Private Cloud) (0) | 2021.01.07 |
[AWS] 재해복구(disaster recovery) (3) (0) | 2020.11.28 |
[AWS] 재해복구(disaster recovery) (2) (0) | 2020.11.27 |
댓글