„Facebook“ nesėkmė rodo, kodėl neturėtume juo pasikliauti viskuo

click fraud protection

Key Takeaways

  • Techninės „Facebook“ problemos buvo apgailėtinos, tačiau greičiausiai problema būtų išspręsta daug greičiau, jei ji nebūtų pagrįsta tiek daugybe tarpusavyje susijusių sistemų.
  • Nėra būdo visiškai išvengti sistemos gedimų, tačiau yra būdų, kaip sumažinti jų tikimybę.
  • Turėdami atsarginius planus, kada (ne tada, kada) sistema sugenda, galite skirti „erzinantį“ ir „katastrofišką“.
Balta nykščio žemyn piktograma ant juodo klaviatūros klavišo.

fongfong2 / Getty Images

Neseniai įvykęs „Facebook“ žlugimas parodo, kaip tarpusavyje sujungtos sistemos sugenda ir kodėl neturėtume jų naudoti viskam.

Prarasti „Facebook“, „WhatsApp“ ir „Instagram“ kelioms valandoms pirmadienį buvo nepatogu, kenkia įmonėmso kai kuriais atvejais beveik katastrofiška. Pasak Facebook, visa tai įvyko dėl konfigūracijos pakeitimų savo tinklą koordinuojantiems maršrutizatoriams.

Tai pagrįstas paaiškinimas, tačiau tai, kad viena tokia klaida gali sustabdyti ne tik „Facebook“, bet ir kitų „Facebook“ priklausančių sistemų šlifavimą, kelia nerimą.

Dėl vieno netinkamo maršrutizatoriaus konfigūracijos pakeitimo kelios paslaugos ir net VR ausinės visiškai nustojo veikti. Be to, paties „Facebook“ pripažinimu, tai taip pat turėjo pakopinį poveikį bendrovės duomenų centrų bendravimui ir sustabdė visas jų paslaugas.

„Pasikliovimas tarpusavyje sujungtomis sistemomis kelia įgimtą sistemos ar net paslaugos gedimo riziką“, – sakė Francesco Altomare, GlobalDots vyresnysis techninis pardavimo inžinierius, interviu el. paštu su Lifewire,

„Siekdamos įveikti šią bauginančią riziką, įmonės taip pat naudoja SRE (System Reliability Engineering) principą. kaip ir kiti įrankiai, kurie visi susiję su įvairiais atleidimo lygiais, įtaisytais kiekviename sistemos lygmenyje infrastruktūra“.

„Facebook“ rodomas išmaniajame telefone, sėdinčiame šalia nešiojamojo kompiuterio ant stiklinio stalo.

Timothy Halesas Bennettas / Unsplash

Kas gali suklysti

Verta paminėti, kad kai tokia sistema sugenda, paprastai reikia audros, kad viskas klostytųsi ne taip. Tai mažiau kaip kortų namelis, laukiantis krintimo, o labiau į atvirą šiluminio išmetimo angą mažo mėnulio dydžio kosminėje stotyje.

Daugelis įmonių imasi veiksmų, siekdamos užtikrinti, kad vienas dalykas, galintis viską suvesti į chaosą, niekada neįvyktų, bet nepaisant to, tai gali atsitikti.

„Netikėtos gedimai yra verslo dalis ir gali kilti dėl darbuotojo aplaidumo, interneto paslaugų teikėjo tinklo gedimų ar net debesų saugyklos paslaugų problemų“, – sakė jis. Sally Stevens, FastPeopleSearch įkūrėjas, interviu el. paštu.

„...Kol bus atlikti būtini sistemos apsaugos veiksmai, pvz., atsarginės kopijos, maršruto parinktuvas ir pakopinė prieiga. Tokie gedimai yra mažai tikėtini. nepavyks.

Jei sugenda sistema, valdanti tokius dalykus kaip pirminės kontakto formos, prietaisai, durys ir kt., rezultatai gali būti reikšmingi. Nuo lengvų nepatogumų iki visiško katastrofiško, priklausomai nuo to, kiek asmenys ir įmonės visa tai pasitiki.

Inžinierių grupė susitinka prie stalo biure.

Hinterhaus Productions / Getty Images

„Taip pat yra rizika, kad įsilaužėliai pateks į sistemą iš bet kurio mažiausiai apsaugoto įrenginio, pvz., šaldytuvai ir orkaitės skrudintuvai“, – pridūrė Stevensas, – dėl to gali pavogti duomenys ir ransomware“.

Kaip galime pasiruošti

Nėra jokio būdo garantuoti, kad sistema niekada nesuges, tačiau yra veiksmų, kurių galima imtis siekiant sumažinti gedimo tikimybę arba sklandžiau pašalinti gedimą. Idealus būtų šių dviejų metodų derinys, kuris suderintų su gedimų apsauga ir atsakomąsias priemones su nenumatytų atvejų planais ir atsarginėmis sistemomis.

„Siekiant pašalinti šiuos pavojus, kuriuos sukelia efektyviai valdomi trečiųjų šalių produktai ir paslaugos, vaidmenys ir pareigos Trečiosios šalies rizikos valdymas turi būti griežtai apibrėžtas“, – sakė Daniela Sawyer, įkūrėja ir vyriausioji technologijų pareigūnė. apie „FindPeopleFast“., interviu el. paštu: „Norėdami klestėti šioje naujoje aplinkoje, rizikos valdytojai turi suvokti esmines tokios sudėtingos ekosistemos dalis“.

Tai, kas nutiko „Facebook“, „WhatsApp“ ir „Instagram“, buvo gaila, bet, tikėkimės, atveria akis. Žmonės, kurie pasitiki tarpusavyje sujungtomis sistemomis, turi suprasti, kad viskas, kas vyksta neteisingai, gali viską sujaukti. Be to, turi būti įdiegtos (arba kruopščiai išnagrinėtos ir patobulintos) priemonės, kad tokie sutrikimai būtų mažiau tikėtini ir jų poveikis būtų mažesnis.

„Facebook“ atveju jo problema buvo ne maršrutizatoriaus problemos, o beveik visa jo ekosistema, susijusi su viskuo. Taigi, „Facebook“ (paslaugai) neveikiant, „Facebook“ (įmonei) teko skirti daug daugiau laiko ir energijos paprasčiausiai tvarkydamas ir spręsdamas problemą. Jei jis nenaudotų tokios giliai įsišaknijusios, tarpusavyje sujungtos sistemos arba būtų turėjęs atsarginių planų, kaip susidoroti su tokiu gedimu, greičiausiai tai būtų užtrukę daug mažiau laiko.