▶AWS ponownie uległ awarii i usunął dużą liczbę stron internetowych; teraz wiemy dlaczego

Porównanie
Computing
AWS ponownie uległ awarii i zamknął dużą liczbę stron internetowych; teraz wiemy dlaczego

AWS ponownie uległ awarii i zamknął dużą liczbę stron internetowych; teraz wiemy dlaczego

Aktualizuj

2021-12-15T15: 52: 08.933Z

To się powtórzyło: otrzymaliśmy kilka raportów o awariach AWS powodujących problemy w kilku znanych witrynach.

2021-12-15T15: 54: 56.568Z

Jak wspomniano, tysiące skarg dotarło do DownDetector, a wszyscy użytkownicy w USA, Europie i Azji zgłaszali problemy z AWS.

Wywarło to pozytywny wpływ na inne popularne witryny hostowane w usługach AWS, które również wydają się działać w trybie offline.

Według DownDetector problemy miały Hulu, Intuit QuickBooks i DoorDash, podobnie jak Amazon.com.

2021-12-15T15: 57: 07.012Z

Usługi Downdetector, na które ma wpływ awaria AWS

(Zdjęcie: Future/DownDetector)

Wydaje się, że szczególnie dotknięte są usługi gier wideo, a problemy występują w PlayStation Network, Twitch, League of Legends, Valorant, Apex Legends i Halo.

2021-12-15T15: 59: 56.430Z

Oficjalny panel kontrolny AWS Service Health nie pokazuje jeszcze żadnych większych problemów, ale sama witryna ładuje się bardzo wolno, co może wskazywać, że coś jest nie tak.

Jedynymi aktualnie wyświetlanymi problemami są problemy z łącznością internetową AWS w regionach Północnej Kalifornii i Oregonu, które są częścią regionu AWS US-WEST-1.

AWS twierdzi, że „bada problemy z łącznością internetową w regionie US-WEST-1”.

2021-12-15T16: 01: 31.050Z

Awaria AWS niszczy aplikację Disneyland, a ludzie tutaj są wspaniali 15 grudnia 2021 r

Zobacz więcej

Wygląda na to, że obecnie nie jest to „najszczęśliwsze miejsce na Ziemi”…

2021-12-15T16: 03: 58.873Z

Wygląda na to, że problemy dotyczą regionów AWS US-WEST-1 i US-WEST-2, czyli dwóch ogromnych obszarów biznesowych i będących domem dla dużej liczby klientów.

Może to być przyczyną awarii wielu witryn i narzędzi – DownDetector pokazuje, że dotyczy to również innych usług, takich jak Zoom, Okta, Salesforce i Crunchyroll.

2021-12-15T16: 08: 45.442Z

AWS twierdzi, że problem może być pod ręką – najnowsza aktualizacja pulpitu nawigacyjnego stanu AWS zauważa:

„Zidentyfikowaliśmy pierwotną przyczynę łączności internetowej w regionie US-WEST-1 i podjęliśmy kroki w celu przywrócenia łączności. W ciągu ostatnich kilku minut zauważyliśmy pewną poprawę w łączności internetowej, ale wciąż pracujemy nad pełnym przywróceniem. "

2021-12-15T16: 11: 06.622Z

Raporty o przerwach w działaniu usługi Downdetector AWS

(Źródło zdjęcia: DownDetector)

W DownDetector zaczynają pojawiać się raporty o awariach. Czy da się to naprawić i wrócić do normy?

2021-12-15T16: 15: 19.705Z

Duża aktualizacja: AWS twierdzi, że problem z regionem US-WEST-1 w Północnej Kalifornii został już naprawiony.

„Naprawiliśmy problem wpływający na łączność internetową w regionie US-WEST-1”, informuje strona stanu AWS. „To zdarzenie nie miało wpływu na łączność wewnątrz regionu. Problem został rozwiązany, a usługa działa normalnie”.

Region US-WEST-2 w stanie Oregon jest nadal badany, ale raporty DownDetector szybko spadają, więc trzymam kciuki, aby to również wkrótce zostało rozwiązane…

2021-12-15T16: 19: 39.587Z

Proszę bardzo: region Oregonu jest również zasiedlony.

„Rozwiązaliśmy problem dotyczący łączności internetowej w regionie US-WEST-2” — mówi AWS. „To zdarzenie nie miało wpływu na łączność wewnątrz regionu. Problem został rozwiązany, a usługa działa normalnie”.

2021-12-15T16: 21: 45.702Z

Cóż, to był szalony bieg, prawda?

Jeśli do nas dołączasz, w dwóch głównych regionach AWS, US-WEST-1 i US-WEST 2, wystąpiły problemy z połączeniem internetowym.

Dotknęło to dużą liczbę witryn działających w usługach AWS, powodując problemy, w tym Hulu, PlayStation Network, a nawet Amazon.com.

AWS twierdzi, że problemy zostały już rozwiązane, więc trzymamy kciuki, aby aktualizacje po naszej stronie dobiegły końca. Dziękujemy za przeczytanie TechRadar Pro!

2021-12-15T22: 29: 01.877Z

Ponieważ wszystkie systemy są teraz zielone, przynajmniej według AWS Dashboard, AWS dodał kontekst do drugiej poważnej awarii w ciągu tylu tygodni. Identyczne problemy dotyczyły regionów US-WEST-1 i WEST-2. Pozwólmy im wyjaśnić:

„Pomiędzy 7:14 czasu PST a 7:59 czasu PST klienci doświadczyli znacznej utraty pakietów sieciowych, co miało wpływ na łączność z podzbiorem miejsc docelowych w Internecie. Nie ma to wpływu na ruch w regionach AWS, pomiędzy regionami AWS i do innych miejsc docelowych w Internecie.

„Problem był spowodowany przeciążeniem sieci pomiędzy częściami szkieletu AWS a podzbiorem dostawców usług internetowych, co było spowodowane inżynierią ruchu AWS przeprowadzoną w odpowiedzi na przeciążenia poza naszą siecią.

„Ta inżynieria ruchu nieprawidłowo przeniosła więcej ruchu, niż oczekiwano, do części szkieletu AWS, wpływając na łączność z podzbiorem miejsc docelowych w Internecie. Problem został rozwiązany i nie spodziewamy się, że się powtórzy”.

Wygląda na to, że problemy zaczęły się od inżynierii ruchu AWS, która odnotowała duży ruch, ale potem wykonała złe połączenie i przeniosła się za bardzo do szkieletu AWS, utrudniając uruchomienie. Łączność internetowa z niektórymi ulubionymi miejscami docelowymi.

W tym momencie wszystko powinno działać poprawnie na większości systemów opartych na AWS, ale wciąż widzieliśmy na Twitterze kilka raportów o sporadycznych i długich przerwach w działaniu (łączność z zestawem Oculus VR, kusi Cię?). Być może rano wszystko zostanie całkowicie rozwiązane.

AWS ponownie uległ awarii i zamknął dużą liczbę stron internetowych; teraz wiemy dlaczego