A Facebook kudarca megmutatja, miért nem hagyatkozhatunk rá mindenben

Kulcs elvitelek

  • A Facebook technikai problémái sajnálatosak voltak, de a probléma valószínűleg sokkal gyorsabban megoldódott volna, ha nem támaszkodik ennyi összekapcsolt rendszerre.
  • Nincs mód a rendszerhibák teljes megelőzésére, de vannak módok arra, hogy csökkentsék azok valószínűségét.
  • Ha biztonsági mentési terveket készítünk arra vonatkozóan, hogy mikor (nem ha, mikor) a rendszer meghibásodik, akkor különbséget tehet a „bosszantó” és a „katasztrófa” között.
Fehér hüvelykujj lefelé ikon a fekete billentyűzet gombján.

fongfong2 / Getty Images

A Facebook közelmúltbeli összeomlása megmutatja, hogy az összekapcsolt rendszerek tönkremennek, és miért ne használjuk őket mindenre.

A Facebook, a WhatsApp és az Instagram elvesztése több órára hétfőn kényelmetlen volt, kárt okoz a vállalkozásoknakés bizonyos esetekben szinte katasztrofális. A Facebook szerint az egész a konfigurációs változások miatt volt hálózatkoordináló útválasztóihoz.

Ez egy ésszerű magyarázat, de az a tény, hogy egy ilyen hiba nem csak a Facebook, hanem más Facebook tulajdonában lévő rendszerek őrlődését is leállíthatja, kissé riasztó.

Egy rossz útválasztó konfigurációs módosítás miatt több szolgáltatás, sőt a VR headset is teljesen leállt. Ráadásul a Facebook saját bevallása szerint a cég adatközpontjainak kommunikációját is lépcsőzetesen befolyásolta, és minden szolgáltatásukat leállította.

"Az összekapcsolt rendszerekre való támaszkodás magában hordozza a rendszer vagy akár a szolgáltatás meghibásodásának kockázatát" - mondta Francesco Altomare, a GlobalDots vezető műszaki értékesítési mérnöke a Lifewire-nek adott e-mailes interjújában,

„E ijesztő kockázat leküzdésére a vállalatok az SRE (System Reliability Engineering) elvét is alkalmazzák. mint más eszközök, amelyek mindegyike a rendszer minden rétegébe beépített redundancia különböző szintjével foglalkozik infrastruktúra."

Facebook egy okostelefonon, egy laptop mellett ülve egy üveglapos asztalon.

Timothy Hales Bennett / Unsplash

Mi romolhat el

Érdemes megjegyezni, hogy ha egy ilyen rendszer meghibásodik, általában tökéletes viharra van szükség a rossz dolgokra. Kevésbé olyan, mint egy kártyavár, amely arra vár, hogy leessen, és inkább egy kis hold méretű űrállomás termikus kipufogónyílása.

A legtöbb vállalat lépéseket tesz annak biztosítására, hogy az egyetlen dolog, ami mindent káoszba sodorhat, soha ne történjen meg – de ettől függetlenül megtörténhet.

"A váratlan meghibásodások az üzlet részét képezik, és előfordulhatnak a dolgozók hanyagságából, az internetszolgáltató hálózatának hibáiból, vagy akár a felhőalapú tárolási szolgáltatások problémáiból" Sally Stevens, a FastPeopleSearch társalapítója egy e-mailes interjúban.

"...Amíg megtörténik a rendszer védelméhez szükséges lépések – mint például a biztonsági mentések, a helyszíni útválasztó és a többszintű hozzáférés – helyen, ezek a meghibásodások meglehetősen valószínűtlenek." Bár még egy sereg hibabiztosítóval is előfordulhat, hogy a kulcstartó nem sikerül.

Ha az olyan dolgokat vezérlő rendszer, mint az elsődleges érintkezési formák, készülékek, ajtók stb., meghibásodik, az eredmények jelentősek lehetnek. Az enyhe kényelmetlenségtől a teljes katasztrofálisig, attól függően, hogy az egyének és a vállalatok mennyire számítanak rájuk.

Mérnökök egy csoportja találkozik egy asztal körül egy irodában.

Hinterhaus Productions / Getty Images

"Fennáll annak a veszélye is, hogy hackerek a legkevésbé védett eszközök bármelyikéről bejutnak a rendszerbe, mint például a hűtőszekrények és a sütőben lévő kenyérpirítók – tette hozzá Stevens –, amelyek adatlopáshoz és adatlopáshoz vezethetnek ransomware."

Hogyan készülhetünk

Semmilyen módon nem garantálható, hogy egy rendszer soha nem fog meghibásodni, de vannak olyan lépések, amelyekkel csökkenthető a meghibásodás valószínűsége, vagy zökkenőmentesen kezelhető a hiba. Ideális lenne a két megközelítés kombinációja, amely a hibabiztosságot és az ellenintézkedéseket vészhelyzeti tervekkel és tartalékrendszerekkel párosítja.

"A hatékonyan kezelt harmadik fél termékei és szolgáltatásai által okozott veszélyek kiküszöbölésére, szerepek és kötelezettségek a harmadik fél kockázatkezelését szigorúan körvonalazni kell” – mondta Daniela Sawyer, alapító és technológiai igazgató nak,-nek FindPeopleFast, egy e-mail-interjúban: "Ahhoz, hogy ebben az új környezetben virágozzanak, a kockázatkezelőknek meg kell érteniük egy ilyen kifinomult ökoszisztéma lényeges részeit."

Ami a Facebookkal, a WhatsApp-pal és az Instagrammal történt, az sajnálatos volt, de remélhetőleg fel is nyitotta a szemet. Az összekapcsolt rendszerekre támaszkodó embereknek meg kell érteniük, hogy a megfelelő dolog, ami rosszul megy, mindent megzavarhat. És intézkedéseket kell bevezetni (vagy alaposan meg kell vizsgálni és finomítani kell), hogy az ilyen fennakadásokat kevésbé valószínűsítsék és kevésbé befolyásolják.

A Facebook esetében nem a router-problémák okozták a problémát, hanem az, hogy szinte a teljes ökoszisztémája minden máshoz kapcsolódik. Így a Facebook (a szolgáltatás) megszűnésével a Facebooknak (a cégnek) sokkal több időt és energiát kellett fordítania a probléma egyszerű megszervezésére és megoldására. Ha nem használna ilyen mélyen gyökerező, összekapcsolt rendszert, vagy ha biztonsági mentési tervei vannak egy ilyen leállás kezelésére, akkor valószínűleg sokkal kevesebb időbe telt volna a javítás.