A Facebook kudarca megmutatja, miért nem hagyatkozhatunk rá mindenben
Kulcs elvitelek
- A Facebook technikai problémái sajnálatosak voltak, de a probléma valószínűleg sokkal gyorsabban megoldódott volna, ha nem támaszkodik ennyi összekapcsolt rendszerre.
- Nincs mód a rendszerhibák teljes megelőzésére, de vannak módok arra, hogy csökkentsék azok valószínűségét.
- Ha biztonsági mentési terveket készítünk arra vonatkozóan, hogy mikor (nem ha, mikor) a rendszer meghibásodik, akkor különbséget tehet a „bosszantó” és a „katasztrófa” között.

fongfong2 / Getty Images
A Facebook közelmúltbeli összeomlása megmutatja, hogy az összekapcsolt rendszerek tönkremennek, és miért ne használjuk őket mindenre.
A Facebook, a WhatsApp és az Instagram elvesztése több órára hétfőn kényelmetlen volt, kárt okoz a vállalkozásoknakés bizonyos esetekben szinte katasztrofális. A Facebook szerint az egész a konfigurációs változások miatt volt hálózatkoordináló útválasztóihoz.
Ez egy ésszerű magyarázat, de az a tény, hogy egy ilyen hiba nem csak a Facebook, hanem más Facebook tulajdonában lévő rendszerek őrlődését is leállíthatja, kissé riasztó.
Egy rossz útválasztó konfigurációs módosítás miatt több szolgáltatás, sőt a VR headset is teljesen leállt. Ráadásul a Facebook saját bevallása szerint a cég adatközpontjainak kommunikációját is lépcsőzetesen befolyásolta, és minden szolgáltatásukat leállította.
"Az összekapcsolt rendszerekre való támaszkodás magában hordozza a rendszer vagy akár a szolgáltatás meghibásodásának kockázatát" - mondta Francesco Altomare, a GlobalDots vezető műszaki értékesítési mérnöke a Lifewire-nek adott e-mailes interjújában,
„E ijesztő kockázat leküzdésére a vállalatok az SRE (System Reliability Engineering) elvét is alkalmazzák. mint más eszközök, amelyek mindegyike a rendszer minden rétegébe beépített redundancia különböző szintjével foglalkozik infrastruktúra."

Timothy Hales Bennett / Unsplash
Mi romolhat el
Érdemes megjegyezni, hogy ha egy ilyen rendszer meghibásodik, általában tökéletes viharra van szükség a rossz dolgokra. Kevésbé olyan, mint egy kártyavár, amely arra vár, hogy leessen, és inkább egy kis hold méretű űrállomás termikus kipufogónyílása.
A legtöbb vállalat lépéseket tesz annak biztosítására, hogy az egyetlen dolog, ami mindent káoszba sodorhat, soha ne történjen meg – de ettől függetlenül megtörténhet.
"A váratlan meghibásodások az üzlet részét képezik, és előfordulhatnak a dolgozók hanyagságából, az internetszolgáltató hálózatának hibáiból, vagy akár a felhőalapú tárolási szolgáltatások problémáiból" Sally Stevens, a FastPeopleSearch társalapítója egy e-mailes interjúban.
"...Amíg megtörténik a rendszer védelméhez szükséges lépések – mint például a biztonsági mentések, a helyszíni útválasztó és a többszintű hozzáférés – helyen, ezek a meghibásodások meglehetősen valószínűtlenek." Bár még egy sereg hibabiztosítóval is előfordulhat, hogy a kulcstartó nem sikerül.
Ha az olyan dolgokat vezérlő rendszer, mint az elsődleges érintkezési formák, készülékek, ajtók stb., meghibásodik, az eredmények jelentősek lehetnek. Az enyhe kényelmetlenségtől a teljes katasztrofálisig, attól függően, hogy az egyének és a vállalatok mennyire számítanak rájuk.

Hinterhaus Productions / Getty Images
"Fennáll annak a veszélye is, hogy hackerek a legkevésbé védett eszközök bármelyikéről bejutnak a rendszerbe, mint például a hűtőszekrények és a sütőben lévő kenyérpirítók – tette hozzá Stevens –, amelyek adatlopáshoz és adatlopáshoz vezethetnek ransomware."
Hogyan készülhetünk
Semmilyen módon nem garantálható, hogy egy rendszer soha nem fog meghibásodni, de vannak olyan lépések, amelyekkel csökkenthető a meghibásodás valószínűsége, vagy zökkenőmentesen kezelhető a hiba. Ideális lenne a két megközelítés kombinációja, amely a hibabiztosságot és az ellenintézkedéseket vészhelyzeti tervekkel és tartalékrendszerekkel párosítja.
"A hatékonyan kezelt harmadik fél termékei és szolgáltatásai által okozott veszélyek kiküszöbölésére, szerepek és kötelezettségek a harmadik fél kockázatkezelését szigorúan körvonalazni kell” – mondta Daniela Sawyer, alapító és technológiai igazgató nak,-nek FindPeopleFast, egy e-mail-interjúban: "Ahhoz, hogy ebben az új környezetben virágozzanak, a kockázatkezelőknek meg kell érteniük egy ilyen kifinomult ökoszisztéma lényeges részeit."
Ami a Facebookkal, a WhatsApp-pal és az Instagrammal történt, az sajnálatos volt, de remélhetőleg fel is nyitotta a szemet. Az összekapcsolt rendszerekre támaszkodó embereknek meg kell érteniük, hogy a megfelelő dolog, ami rosszul megy, mindent megzavarhat. És intézkedéseket kell bevezetni (vagy alaposan meg kell vizsgálni és finomítani kell), hogy az ilyen fennakadásokat kevésbé valószínűsítsék és kevésbé befolyásolják.
A Facebook esetében nem a router-problémák okozták a problémát, hanem az, hogy szinte a teljes ökoszisztémája minden máshoz kapcsolódik. Így a Facebook (a szolgáltatás) megszűnésével a Facebooknak (a cégnek) sokkal több időt és energiát kellett fordítania a probléma egyszerű megszervezésére és megoldására. Ha nem használna ilyen mélyen gyökerező, összekapcsolt rendszert, vagy ha biztonsági mentési tervei vannak egy ilyen leállás kezelésére, akkor valószínűleg sokkal kevesebb időbe telt volna a javítás.