Jedna z największych odnotowanych przerw w dostępie do internetu miała miejsce w weekend

Jedna z największych odnotowanych przerw w dostępie do internetu miała miejsce w weekend

W wyniku błędnej konfiguracji w jednym ze swoich centrów danych, amerykański dostawca usług internetowych (ISP) CenturyLink doznał poważnej awarii technicznej, która przetoczyła się przez Internet, zamykając w niedzielę wiele popularnych witryn i usług. Błąd w centrum danych firmy rozprzestrzenił się poza jej sieć i wpłynął również na innych dostawców usług internetowych, powodując problemy z łącznością dla wielu innych firm, w tym Amazon, Twitter, NameCheap, OpenDNS, Reddit, Discord, Hulu, Steam i innych. Cloudflare został również poważnie dotknięty awarią CenturyLink, a we wpisie na blogu dyrektor generalny i współzałożyciel firmy zajmującej się bezpieczeństwem witryn i infrastrukturą internetową, Matthew Prince, wyjaśnił, w jaki sposób incydent wpłynął na cały Internet, mówiąc: „Ponieważ ta awaria wydawało się, że wyłącza całą sieć CenturyLink / Level (3), ludzie, którzy są klientami CenturyLink, nie byliby w stanie skontaktować się z Cloudflare ani żadnym innym dostawcą usług internetowych, dopóki nie wystąpiłby problem. nie został rozwiązany. Globalnie odnotowaliśmy 3,5% spadek globalnego ruchu podczas przerwy, co było prawie w całości spowodowane prawie całkowitą awarią usługi CenturyLink ISP w USA”.

Nieprawidłowa reguła specyfikacji przepływu

Na podstawie informacji na stronie stanu CenturyLink wydaje się, że problem dotyczy centrum danych CA3 dostawcy usług internetowych w Mississauga, w kanadyjskiej prowincji Ontario. Ponieważ awaria dotknęła jej własne usługi, Cloudflare zwrócił szczególną uwagę i uważa, że ​​przyczyną mogła być niepoprawna reguła Flowspec, która pojawiła się na końcu długiej listy aktualizacji BGP. Gdyby tak było, każdy router w sieci CenturyLink/Level(3) otrzymałby regułę Flowspec, zaczął blokować BGP, co spowodowałoby, że przestałby otrzymywać regułę. Następnie urządzenia uruchamiałyby się ponownie, przechodziły przez wszystkie reguły BGP, aż trafiły na niewłaściwą regułę Flowspec, a BGP zostałby ponownie usunięty, tworząc pętlę, która będzie kontynuowana w procesie w kółko. Trasy BGP to rodzaj wiadomości, w której firmy internetowe na zmianę informują każdego dostawcę Internetu, jaka pula adresów IP jest dostępna w ich sieci. Jednak nieprawidłowa reguła Flowspec firmy CenturyLink spowodowała również wyrwanie się niektórych routerów z jej sieci, które zaczęły ogłaszać nieprawidłowe trasy BGP do innych usług internetowych poziomu 1, powodując awarie innych sieci. , powodując największą awarię internetu w weekend. Na szczęście CenturyLink był w stanie rozwiązać ten problem, nakazując wszystkim pozostałym dostawcom usług internetowych Tier 1 ignorowanie całego ruchu przychodzącego z ich sieci. Tego typu działanie jest zwykle ostatecznością, gdyż skutkuje utratą łączności z Internetem u wszystkich klientów firmy. Przez ZDNet