Amazon은 인터넷의 일부를 제거한 실패 원인을 설명합니다.
Amazon은 12월 7일 정전의 이유를 설명하고 향후 사건과 그 출처를 더 잘 보고할 것을 약속합니다.
Amazon은 이미 12월 7일 몇 시간 동안 캔버스의 일부에 액세스할 수 없게 만든 웹 서비스 의 버그 원인을 설명 하고 그 동안 다시 발생할 수 있는 경우 더 명확하게 약속했습니다. CNBC에 따르면 Amazon은 자동 확장 기능이 내부 네트워크 고객의 “예기치 않은 동작”으로 이어진 것을 발견했습니다. 이 내부 네트워크를 AWS에 연결한 장치가 과부하되어 데이터 중단이 발생했습니다.
아마존, 12월 7일 정전 이유 설명
미국 거대 기업에 따르면 이 사건의 특성상 실제로 팀이 문제를 식별하고 수정하는 것을 막았습니다. 무슨 일이 일어났는지 알아보기 위해 로그를 사용해야 했고 일부 내부 도구도 영향을 받았습니다. 이해 관계자는 여전히 작동하는 모든 서비스를 중단하지 않도록 다양한 서비스를 복원하는 데 “매우 신중”했습니다. 그들은 네트워크 클라이언트가 종료되는 것을 방지하고 시스템이 복구할 수 있는 기회를 제공하는 “숨겨진 문제”를 해결해야 했습니다.
AWS는 문제를 일으킨 이 조정 기능을 일시적으로 비활성화했으며 적절한 솔루션을 찾을 때까지 다시 활성화하지 않을 것입니다. Amazon에 따르면 숨겨진 버그에 대한 수정 사항이 앞으로 2주 이내에 도착할 것이라고 합니다. 반복적인 장애가 발생할 경우 장치를 보호하기 위한 추가 네트워크 구성 계층도 있습니다.
그리고 앞으로 사건과 그 기원을 더 잘 보고할 것을 약속합니다.
다음에 이러한 오류가 발생하면 이에 대해 더 잘 알고 있어야 합니다. 실제로 AWS 서비스 상태 대시보드의 새 버전은 다양한 현재 문제에 대한 더 나은 시각화 및 설명을 제공하기 위해 2022년에 출시될 예정이며, 다중 지역 도움말 시스템이 이에 도움이 될 것입니다. Amazon은 고객에게 더 쉽게 연락합니다. 사고 발생 시 AWS 서비스가 더 빨리 복구되지는 않겠지만 적어도 고객은 질문에 대한 답변을 얻을 수 있을 것입니다. 이는 Disney+ 또는 Roomba 진공 청소기의 경우 매우 중요합니다.
답글 남기기