Firma CrowdStrike, odpowiedzialna za awarię 8,5 mln urządzeń z Windowsem, obwinia wadliwe oprogramowanie testowe
CrowdStrike przyznał się do odpowiedzialności za globalną awarię milionów komputerów z systemem Windows. Przyczyną problemu okazała się wadliwa aktualizacja oprogramowania antywirusowego Falcon, która zawierała błędną regułę wykrywania zagrożeń.

Spis treści:
Firma CrowdStrike, dostarczająca oprogramowanie zabezpieczające dla milionów komputerów z systemem Windows na całym świecie, przyznała się do odpowiedzialności za awarię, która 19 lipca 2024 unieruchomiła aż 8,5 mln urządzeń. Według ich wstępnego raportu, przyczyną problemu okazała się wadliwa aktualizacja oprogramowania antywirusowego Falcon.
Co się stało?
Oprogramowanie Falcon, stworzone przez CrowdStrike, jest powszechnie wykorzystywane przez najróżniejsze podmioty do ochrony przed złośliwym oprogramowaniem i atakami hakerskimi. W miniony piątek firma wydała aktualizację, która miała zbierać dane telemetryczne na temat potencjalnych nowych zagrożeń. Niestety, spowodowała ona awarię systemu operacyjnego Windows na milionach urządzeń.
Błąd w oprogramowaniu testowym
CrowdStrike wyjaśnia, że przyczyną awarii była aktualizacja zestawu reguł, które pozwalają oprogramowaniu Falcon szybko reagować na nowe zagrożenia. W wyniku błędu w procesie aktualizacji, wadliwa reguła powodowała awarię systemu Windows.
Firma podkreśla, że błąd ten nie wynikał z niedopatrzenia w kodzie samego programu Falcon, ale z problemu w narzędziu weryfikującym aktualizacje (Content Validator). Narzędzie to nie wykryło wadliwej reguły, co doprowadziło do jej wdrożenia na komputery użytkowników.
Firma przyznaje, że mimo przeprowadzania zarówno automatycznych, jak i ręcznych testów kodu wykrywającego błędy, procedury te okazały się niewystarczające. Zbytnie zaufanie do systemu weryfikacji, wynikające z wcześniejszych udanych aktualizacji, doprowadziło do błędnego założenia, że nowa aktualizacja nie spowoduje problemów.
Opinia eksperta potwierdza przyczynę problemu
Emerytowany inżynier oprogramowania z Microsoftu, Dave Plummer, w swoim filmie na platformie YouTube również odniósł się do awarii. Jego wyjaśnienia dotyczące przyczyn i przebiegu zdarzenia pokrywają się z wersją przedstawioną przez CrowdStrike, potwierdzając, że przyczyną globalnej awarii był błąd w oprogramowaniu testowym, który nie wychwycił wadliwej aktualizacji.
CrowdStrike przeprasza za awarię
Choć CrowdStrike przyznało się do błędu, ich pierwsze próby zadośćuczynienia nie przebiegły zgodnie z planem. Firma wysłała do niektórych partnerów e-maile z przeprosinami i voucherami na Uber Eats o wartości 10 dolarów. Jednak, jak donosi portal TechCrunch, część osób nie mogła zrealizować tych voucherów, napotykając komunikat o błędzie informujący, że kupon został anulowany.