에스케이씨앤씨(SK C&C) 판교데이터센터 화재로 카카오 서비스들이 ‘먹통’이 된지 나흘이 지나도록 카카오톡과 카카오·다음 메일 등 주요 서비스들이 완전히 복구되지 않고 있다. 카카오톡 같은 주요 서비스까지도 이중화(실시간 백업시스템 구축·운영) 등 화재·홍수·지진 같은 재난 사태에 대비하는 투자가 거의 안돼 있었다는 것을 보여준다. 구글·마이크로소프트(MS)·아마존 같은 글로벌 정보기술(IT) 기업들은 재난·재해 시 ‘회복력’에 초점을 맞춰 데이터센터를 구축·운영하는 것과 대비된다.
18일 <한겨레> 취재를 종합하면, 구글·메타·아마존·엠에스 등은 서버(서비스 제공에 사용되는 컴퓨터)를 여러 지역 데이터센터에 분산시켜 운용하고 있다. 화재와 홍수는 물론 지진과 핵전쟁까지 대비해 대륙과 나라와 지역을 달리해 데이터센터를 구축하고 서버를 분산시킨다. 또 인접 데이터센터끼리 짝을 지어 서비스 중요도에 따라 데이터를 백업하고 시스템을 이중화한다. 재난·재해로 먹통이 되거나 장애 발생 시 얼마나 빨리 복구할 수 있느냐에 초점을 맞춰 서버를 둘 위치를 고르고 배치한다고 업체들은 설명한다.
구글은 미국에만도 조지아, 아이오와, 네브래스카, 텍사스 등 26개 주에 데이터센터를 두고 있다. 자체 데이터센터도 있고, 임대해서 쓰기도 한다. 올해 들어서도 테네시, 버지니아, 오클라호마 등에 데이터센터를 추가 개설했다. 구글이 지난 5년 동안 미국 내 데이터센터 증설에 쓴 예산만도 370억달러에 달한다.
세계 최대 클라우드 서비스 회사 아마존은 분산돼 있는 데이터센터 여럿을 하나의 ‘가용 영역’(AZ)으로 묶고, 각 가용 영역의 전원과 보안장치 등을 물리적으로 분리한다. 인접 가용 영역들은 ‘리전’으로 한차례 더 묶인다. 특정 가용 영역에서 문제가 생기면 같은 리전의 다른 가용 영역이 초고속 전용 네트워크를 통해 데이터와 트래픽을 넘겨받아 서비스를 이어간다. 아마존은 북미, 남미, 유럽, 중국, 아시아·태평양, 남아프리카, 중동 등 각 대륙을 이런 식으로 커버하고 있다.
엠에스는 전세계 140개국에 분산된 데이터센터를 60여개 리전으로 관리한다. 우리나라에도 서울과 부산에 데이터센터를 각각 두고, 서로 백업 구실을 하도록 하고 있다. 비상 시 상호 대체가 가능하다.
이들은 서버 이중화 등 실시간 백업체제 구축 투자와 함께 주기적인 재해 복구 훈련도 하고 있다. 유럽 전역에 기록적인 폭염이 찾아온 지난 7월 영국 런던에 위치한 구글·오라클 데이터센터의 냉각장치가 고장나 전력 공급이 멈췄으나 몇시간 만에 복구돼 큰 피해로 이어지지 않았다. 구글은 이와 관련해 “해마다 두 차례 이상 전 직원을 실전처럼 투입해 재해 복구 훈련을 한다”고 밝혔다.
한 대형 시스템통합업체 임원은 “데이터센터를 얼마나 잘 구축해 운영하고 있는지가 아니라, 재해·재난 등으로 데이터센터에 문제가 생겨 서버가 먹통이 되거나 장애가 발생했을 때 얼마나 빨리 다른 데이터센터와 서버로 대체해 서비스를 복구할 수 있는지, 다시 말해 회복력이 더 중요하다”고 지적했다. 이 임원은 “외국 협력업체 엔지니어들에게, ‘국민 메신저’를 자처하며 행정 서비스까지 넘겨받아 대행 중인 카카오톡 서비스가 데이터센터 화재로 먹통이 된지 나흘이 지나도록 복구되지 않고 있다고 하면, 한결같이 이해할 수 없다고 한다”고 덧붙였다.
정인선 기자
ren@hani.co.kr