Amazon wyjaśnia przyczynę awarii, która doprowadziła do usunięcia części internetu

Amazon wyjaśnia przyczynę awarii, która doprowadziła do usunięcia części internetu

Amazon wyjaśnia przyczynę awarii z 7 grudnia i obiecuje lepsze zgłaszanie incydentów i ich źródeł w przyszłości.

Amazon wyjaśnił już pochodzenie błędu w swoich usługach internetowych, które sprawiły, że część płótna była niedostępna przez kilka godzin 7 grudnia i obiecał w międzyczasie większą jasność, jeśli sytuacja się powtórzy. Według CNBC Amazon odkrył, że funkcja automatycznego skalowania doprowadziła do „nieoczekiwanego zachowania” klientów sieci wewnętrznej. Urządzenia, które łączyły tę sieć wewnętrzną z AWS, były przeciążone, co spowodowało przerwy w transmisji danych.

Amazon wyjaśnia przyczynę przerwy w dostawie prądu 7 grudnia

Według amerykańskiego giganta sam charakter tego incydentu faktycznie uniemożliwił zespołom zidentyfikowanie problemu i jego naprawienie. Musieliśmy użyć dzienników, aby dowiedzieć się, co się stało, a także niektóre narzędzia wewnętrzne zostały naruszone. Interesariusze byli „niezwykle ostrożni” przy przywracaniu różnych usług, aby nie zepsuć wszystkiego, co jeszcze działało. Musieli rozwiązać „ukryty problem”, który uniemożliwiał zamykanie klientów sieciowych i dawał systemom szansę na przywrócenie.

AWS tymczasowo wyłączył tę funkcję skalowania, która spowodowała problem, i nie włączy jej ponownie, dopóki nie zostanie znalezione odpowiednie rozwiązanie. Według Amazona poprawka ukrytego błędu pojawi się w ciągu najbliższych dwóch tygodni. Istnieje również dodatkowa warstwa konfiguracji sieci, która chroni urządzenia w przypadku powtarzającej się awarii.

i zapowiada się lepsze zgłaszanie incydentów i ich źródeł w przyszłości

Pamiętaj, że następnym razem, gdy wystąpi taki błąd, powinieneś być bardziej świadomy. Rzeczywiście, nowa wersja AWS Service Health Dashboard ma się ukazać w 2022 roku, aby zapewnić lepszą wizualizację i wyjaśnienia różnych bieżących problemów, a wieloregionalny system pomocy Ci w tym pomoże. Amazon, aby łatwiej kontaktować się z klientami. Usługi AWS nie wrócą szybciej podczas incydentu, ale przynajmniej klienci będą mogli uzyskać odpowiedzi na swoje pytania, co jest bardzo ważne, jeśli chodzi o odkurzacze Disney+ czy Roomba.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *