הכישלון של פייסבוק מראה למה אנחנו לא צריכים לסמוך על זה לכל דבר

click fraud protection

טייק אווי מפתח

  • הבעיות הטכניות של פייסבוק היו מצערות, אך סביר להניח שהבעיה הייתה נפתרת הרבה יותר מהר אם היא לא הייתה מסתמכת על כל כך הרבה מערכות מקושרות.
  • אין דרך למנוע תקלות מערכת לחלוטין, אבל יש דרכים להפחית את הסבירות שלהן.
  • קיום תוכניות גיבוי מתי (לא אם, מתי) מערכת נכשלת יכולה לעשות את ההבדל בין 'מעצבן' ל'קטסטרופלי'.
סמל לבן על מקש מקלדת שחור.

fongfong2 / Getty Images

התקלה האחרונה בפייסבוק מדגימה כיצד מערכות מקושרות עלולות להיכשל ומדוע לא כדאי לנו להשתמש בהן לכל דבר.

מאבד את פייסבוק, וואטסאפ ואינסטגרם לכמה שעות ביום שני היה לא נוח, פגיעה לעסקים, ובמקרים מסוימים, כמעט קטסטרופלי. לפי פייסבוק, הכל נבע משינויי תצורה לנתבים המתאמים את הרשת שלה.

זה הסבר הגיוני, אבל העובדה ששגיאה בודדת כזו עלולה להפסיק לא רק את פייסבוק אלא גם מערכות אחרות בבעלות פייסבוק היא קצת מדאיגה.

שינוי אחד שגוי בתצורת הנתב גרם למספר שירותים, ואפילו אוזניות VR, להפסיק לפעול לחלוטין. נוסף על כך, על פי הודאתה של פייסבוק עצמה, הייתה לזה גם השפעה מדורגת על האופן שבו מרכזי הנתונים של החברה מתקשרים, והביאו להפסקת כל השירותים שלהם.

"ההסתמכות על מערכות מקושרות טומנת בחובה סיכון מובנה של כשל במערכת או אפילו בשירות", אמר

פרנצ'סקו אלטומארה, מהנדס מכירות טכני בכיר ב-GlobalDots, בראיון במייל עם Lifewire,

"כדי להתמודד עם הסיכון המרתיע הזה, חברות משתמשות גם בעקרון של SRE (מערכת מהימנות הנדסת מערכות). ככלים אחרים, שכולם מתמודדים עם רמות שונות של יתירות המוכללות בכל שכבה של מערכת תַשׁתִית."

פייסבוק מוצג בסמארטפון, יושב ליד מחשב נייד על שולחן מזכוכית.

טימותי היילס בנט / Unsplash

מה יכול להשתבש

ראוי לציין שכאשר מערכת כזו נכשלת, זה בדרך כלל דורש סערה מושלמת של דברים משתבשים. זה פחות כמו בית קלפים שמחכה ליפול ויותר כמו יציאת פליטה תרמית חשופה בתחנת חלל בגודל של ירח קטן.

רוב החברות נוקטות בצעדים כדי לנסות להבטיח שהדבר היחיד שיכול להכניס הכל לכאוס לעולם לא יקרה - אבל בלי קשר, זה יכול לקרות.

"כשלים בלתי צפויים הם חלק מהעסק ויכולים להיווצר כתוצאה מרשלנות עובדים, תקלות ברשת של ספק שירותי האינטרנט, או אפילו שירותי אחסון בענן שעוברים בעיות", אמרו. סאלי סטיבנס, מייסד שותף של FastPeopleSearch, בראיון באימייל.

"... כל עוד הצעדים הדרושים להגנה על המערכת - כגון גיבויים, נתב באתר וגישה מדורגת - מוכנסים במקום, הכשלים האלה הם די לא סבירים." למרות שאפילו עם צבא של כספות תקלות, זה עדיין אפשרי עבור הלינצ'מפין לְהִכָּשֵׁל.

אם המערכת השולטת בדברים כמו צורות מגע ראשוניות, מכשירי חשמל, דלתות וכו', נכשלת, התוצאות יכולות להיות משמעותיות. מאי נוחות קלה ועד קטסטרופלית מלאה, תלוי עד כמה אנשים וחברות מסתמכים על הכל.

קבוצת מהנדסים נפגשת סביב שולחן במשרד.

Hinterhaus Productions / Getty Images

"יש גם סיכון של האקרים להיכנס למערכת מכל אחד מהמכשירים הכי פחות מוגנים, כגון מקררים וטוסטרים לתנור," הוסיף סטיבנס, "שיכול להוביל לגניבת נתונים ו כופרה."

איך נוכל להתכונן

אין דרך להבטיח שמערכת לעולם לא תיכשל, אבל יש צעדים שניתן לנקוט כדי להפחית את הסיכוי לכשל או לטפל בכשל בצורה חלקה יותר. שילוב של שתי הגישות המשלב כספות ואמצעי נגד עם תוכניות מגירה ומערכות גיבוי יהיה אידיאלי.

"לחיסול סיכונים אלה שנוצרו על ידי מוצרים ושירותים של צד שלישי המטופלים ביעילות, תפקידים וחובות לגבי ניהול סיכונים של צד שלישי חייב להיות מתואר בקפדנות", אמרה דניאלה סוייר, מייסדת ומנהלת טכנולוגיה ראשית. שֶׁל FindPeopleFast, בראיון באימייל, "כדי לפרוח בסביבה החדשה הזו, מנהלי סיכונים חייבים לתפוס את החלקים החיוניים של מערכת אקולוגית כה מתוחכמת."

מה שקרה עם פייסבוק, וואטסאפ ואינסטגרם היה מצער, אבל אני מקווה גם מאיר עיניים. אנשים שמסתמכים על מערכות מקושרות זה לזה חייבים להבין שהדבר הנכון שישתבש יכול לשבש הכל. ויש לנקוט אמצעים (או לבחון ולחדד) כדי להפוך שיבושים כאלה לפחות סבירים ופחות משפיעים.

במקרה של פייסבוק, הבעיה שלו לא הייתה הבעיות בנתב, אלא העובדה שכמעט כל המערכת האקולוגית שלו הייתה מחוברת לכל השאר. לפיכך, כשפייסבוק (השירות) מושבת, פייסבוק (החברה) נאלצה להשקיע הרבה יותר זמן ואנרגיה פשוט בארגון וטיפול בבעיה. אם היא לא הייתה משתמשת במערכת כה עמוקה ומקושרת או שהיו לה תוכניות גיבוי כדי להתמודד עם הפסקה כזו, סביר להניח שהיה לוקח הרבה פחות זמן לתקן.