10월, 2025의 게시물 표시

북부 버지니아(US-EAST-1) 지역의 Amazon DynamoDB 서비스 장애 요약

https://aws.amazon.com/message/101925/ 2025년 10월 19일과 20일에 북부 버지니아(us-east-1) 지역에서 발생한 서비스 장애에 대한 추가 정보를 제공하고자 합니다. 이 이벤트는 10월 19일 오후 11:48 PDT에 시작되어 10월 20일 오후 2:20 PDT에 종료되었으며, 고객 애플리케이션에 영향을 미친 세 가지 뚜렷한 기간이 있었습니다. 첫째, 10월 19일 오후 11:48에서 10월 20일 오전 2:40까지 Amazon DynamoDB는 북부 버지니아(us-east-1) 지역에서 API 오류율이 증가했습니다. 둘째, 10월 20일 오전 5:30에서 오후 2:09까지 네트워크 로드 밸런서(NLB)는 북부 버지니아(us-east-1) 지역의 일부 로드 밸런서에서 연결 오류가 증가했습니다. 이는 NLB 플릿의 상태 확인 실패로 인해 일부 NLB에서 연결 오류가 증가한 결과였습니다. 셋째, 10월 20일 오전 2:25에서 오전 10:36까지 새로운 EC2 인스턴스 시작이 실패했으며, 오전 10:37부터 인스턴스 시작이 성공했지만, 일부 새로 시작된 인스턴스는 오후 1:50까지 연결 문제가 해결되었습니다. #### DynamoDB 10월 19일 오후 11:48 PDT에서 10월 20일 오전 2:40 PDT까지, 고객은 북부 버지니아(us-east-1) 지역에서 Amazon DynamoDB API 오류율 증가를 경험했습니다. 이 기간 동안 고객 및 DynamoDB에 의존하는 다른 AWS 서비스는 서비스에 새로운 연결을 설정할 수 없었습니다. 이 사건은 서비스의 자동 DNS 관리 시스템 내의 잠재적 결함으로 인해 DynamoDB의 엔드포인트 해석 실패로 촉발되었습니다. AWS의 많은 대규모 서비스는 원활한 확장, 장애 격리 및 복구, 낮은 지연 시간, 그리고 지역성을 제공하기 위해 DNS에 크게 의존합니다. DynamoDB와 같은 서비스는 각 지역에서 매우 큰 이종 로드 밸런서 플릿을 운영하기 위해 수십만 개의 DNS 레코...