아마존웹서비스(AWS) 대규모 장애 사건, 대부분 복구되었으나 일부 오류 여전

[email protected]



아마존의 클라우드 서비스 플랫폼인 아마존웹서비스(AWS)에서 발생한 대규모 전산 장애가 대부분 복구되었으나, 여전히 일부 서비스에서 오류가 지속되고 있는 것으로 확인되었다. 아마존은 20일(현지시간) 온라인 공지에서 “모든 AWS 서비스의 복구 작업이 진행 중이며, 미 동부 지역 대부분에서 정상적인 서비스 접속이 이루어지고 있다”고 전했다. 그러나 일부 임대 서버 서비스를 사용하는 업체들은 네트워크 연결 문제로 인해 간헐적인 오류가 발생할 수 있다고 덧붙였다.

이번 장애는 북미 동부 시간 기준으로 20일 자정을 조금 넘은 시간에 시작되었으며, 버지니아 북부 지역의 AWS 서비스에서 최초로 보고되었다. 두 시간 후, 아마존 측은 주요 데이터베이스 서비스인 다이나모(DB)의 도메인 이름 시스템(DNS)에서 문제가 발생했다고 밝혔다. DNS는 웹사이트의 주소를 IP 주소로 변환해 브라우저와 다른 애플리케이션이 접근할 수 있도록 돕는 핵심 시스템이다.

AWS는 전 세계 클라우드 서비스 시장의 약 1/3을 차지하고 있는 만큼, 이 네트워크의 장애는 다수의 대기업 운영 서비스에 온전한 차질을 주었고, 수많은 사용자에게 영향을 미쳤다. 미국의 온라인 장애 추적 사이트인 다운디텍터(Downdetector)에서는 디즈니+, 리프트, 맥도날드 앱, 뉴욕타임스, 레딧, 로빈후드, 스냅챗, 유나이티드 항공, 페이팔 등 여러 회사를 포함한 서비스에 접속 불가 보고가 잇따랐다. 영국 정부 기관의 주요 웹사이트들도 장애를 겪은 것으로 전해졌다.

또한 아마존의 전자상거래 배송 시스템과 여러 자회사 사이트들도 일시적으로 다운되었다. 소셜미디어 사용자들은 로블록스와 포트나이트와 같은 클라우드 기반 게임에서의 장애에 대한 불만을 제기하였다. 특히, 가상화폐 거래소인 코인베이스에서는 서비스 중단으로 인해 많은 이용자가 불편을 겪었고, 경제적 피해는 수십억 달러에 이를 것이라는 우려가 제기되었다.

인터넷 성능 모니터링 회사 캐치포인트의 CEO 메디 다우디는 이번 AWS 장애 사건으로 인한 경제적 영향이 수천억 달러에 달할 수 있다고 주장했다. 그는 “이번 사건은 인터넷의 복잡성과 취약성을 여과없이 드러내며, 우리 사회가 얼마나 인터넷에 의존하고 있는지를 상기시켜준다”며, “수백만 근로자들의 업무 불능 상태와 공장 및 항공편 지연 등을 고려했을 때, 그 피해는 상당할 것”이라고 밝혔다.

전 국가안보국(NSA) 컴퓨터 과학자인 마이크 채플은 CNBC와의 인터뷰에서 “초기 보고에 따르면 데이터베이스 자체에는 문제가 없었던 것으로 보이며, 데이터는 안전하다고 판단된다. 이번 장애는 특정 시스템에서 각 데이터의 위치를 알려주는 기록에 문제가 발생한 것으로 추측된다”고 설명했다. 그는 또 “이 사건은 세계가 소수의 클라우드 서비스 제공업체에 얼마나 의존하고 있는지를 다시 한 번 되새기게 한다”며 “한 클라우드 제공자가 불편을 겪으면 인터넷 전체가 영향을 받을 수 있는 상황”이라고 경고했다.

이번 사건은 지난해 7월 크라우드스트라이크의 소프트웨어 업데이트 과정에서 발생한 마이크로소프트 윈도우 시스템의 마비와 유사하게, 세계적인 혼란의 흐름을 나타내고 있다. 데이터의 안정성과 클라우드 서비스의 신뢰성에 대한 강한 의문을 제기하고 있으며, 앞으로의 시스템 보완이 필요함을 시사한다.

Leave a Comment