يظهر فشل Facebook لماذا لا يجب أن نعتمد عليه في كل شيء

click fraud protection

الماخذ الرئيسية

  • كانت المشكلات الفنية على Facebook مؤسفة ، ولكن من المحتمل أن يتم حل المشكلة بشكل أسرع إذا لم تعتمد على العديد من الأنظمة المترابطة.
  • لا توجد طريقة لمنع أعطال النظام تمامًا ، ولكن هناك طرق لتقليل احتمالية حدوثها.
  • إن وجود خطط احتياطية لوقت (وليس إذا ، متى) يفشل النظام يمكن أن يُحدث فرقًا بين "المزعج" و "الكارثي".
أيقونة بيضاء على مفتاح لوحة المفاتيح السوداء.

fongfong2 / جيتي إيماجيس

توضح كارثة Facebook الأخيرة كيف ستفشل الأنظمة المترابطة ولماذا لا نستخدمها في كل شيء.

فقدان Facebook و WhatsApp و Instagram لعدة ساعات في يوم الاثنين كان غير مريح ، الإضرار بالأعمال، وفي بعض الحالات ، تقريبا كارثي. وفقًا لفيسبوك ، كان كل ذلك بسبب تغييرات التكوين لأجهزة توجيه تنسيق الشبكة الخاصة بها.

إنه تفسير معقول ، لكن حقيقة أن خطأ واحدًا كهذا قد يؤدي ليس فقط إلى توقف Facebook ولكن أيضًا في توقف الأنظمة الأخرى المملوكة لـ Facebook ، أمر مثير للقلق بعض الشيء.

تسبب تغيير واحد خاطئ في تكوين جهاز التوجيه في توقف العديد من الخدمات ، وحتى سماعات الرأس VR ، عن العمل تمامًا. علاوة على ذلك ، من خلال قبول Facebook الخاص ، كان له أيضًا تأثير متتالي على كيفية تواصل مراكز بيانات الشركة ، مما أدى إلى توقف جميع خدماتها.

قال "الاعتماد على الأنظمة المترابطة يحمل معه مخاطر متأصلة في النظام أو حتى فشل الخدمة" فرانشيسكو التوماري، مهندس مبيعات تقني أول في GlobalDots ، في مقابلة عبر البريد الإلكتروني مع Lifewire ،

"لمواجهة هذه المخاطر الرهيبة ، تستخدم الشركات أيضًا مبدأ SRE (هندسة موثوقية النظام) كأدوات أخرى ، والتي تتعامل جميعها مع مستويات مختلفة من التكرار المدمج في كل طبقة من طبقات النظام البنية الاساسية."

Facebook معروض على هاتف ذكي ، جالسًا بجوار كمبيوتر محمول على طاولة زجاجية.

تيموثي هالز بينيت / أنسبلاش

ما الذي يمكن أن يحدث خطأ

من الجدير بالذكر أنه عندما يفشل نظام كهذا ، فإنه عادة ما يتطلب عاصفة كاملة من الأشياء التي تسير بشكل خاطئ. إنه ليس مثل منزل من البطاقات ينتظر السقوط بل إنه يشبه إلى حد كبير منفذ عادم حراري مكشوف على محطة فضائية بحجم قمر صغير.

تتخذ معظم الشركات خطوات لمحاولة التأكد من أن الشيء الوحيد الذي يمكن أن يلقي بكل شيء في حالة من الفوضى لن يحدث أبدًا - ولكن بغض النظر ، يمكن أن يحدث.

قال "الإخفاقات غير المتوقعة هي جزء من الأعمال ويمكن أن تنشأ نتيجة إهمال العمال ، أو أخطاء في شبكة مزود خدمة الإنترنت ، أو حتى خدمات التخزين السحابية التي تواجه مشكلات ،" سالي ستيفنز، أحد مؤسسي FastPeopleSearch ، في مقابلة عبر البريد الإلكتروني.

"... طالما تم وضع الخطوات الضرورية لحماية النظام - مثل النسخ الاحتياطية وجهاز التوجيه في الموقع والوصول المتدرج - مكان ، فإن هذه الإخفاقات غير مرجحة تمامًا. "على الرغم من وجود جيش من الخزائن الفاشلة ، لا يزال من الممكن أن يقوم يفشل.

إذا فشل النظام الذي يتحكم في أشياء مثل الأشكال الأساسية للاتصال والأجهزة والأبواب وما إلى ذلك ، فقد تكون النتائج مهمة. من الإزعاج البسيط إلى الكارثة الكاملة ، اعتمادًا على مدى اعتماد الأفراد والشركات على كل ذلك.

مجموعة من المهندسين يجتمعون حول طاولة في مكتب.

هينترهاوس برودكشنز / جيتي إيماجيس

"هناك أيضًا خطر دخول المتسللين إلى النظام من أي من الأجهزة الأقل حماية ، مثل الثلاجات ومحمصات الفرن ، "أضاف ستيفنز ، مما قد يؤدي إلى سرقة البيانات و برامج الفدية ".

كيف يمكننا الاستعداد

لا توجد طريقة لضمان عدم فشل النظام أبدًا ، ولكن هناك خطوات يمكن اتخاذها إما لتقليل احتمالية الفشل أو معالجة الفشل بشكل أكثر سلاسة. سيكون الجمع بين النهجين اللذين يزاوجان بين إجراءات الأمان من الفشل والتدابير المضادة مع خطط الطوارئ وأنظمة النسخ الاحتياطي أمرًا مثاليًا.

"للقضاء على هذه المخاطر الناتجة عن منتجات وخدمات الجهات الخارجية التي يتم التعامل معها بشكل فعال ، والأدوار والواجبات فيما يتعلق بإدارة مخاطر الطرف الثالث ، يجب تحديدها بدقة "، قالت دانييلا سوير ، المؤسس وكبير مسؤولي التكنولوجيا من FindPeopleFast، في مقابلة عبر البريد الإلكتروني ، "للازدهار في هذه البيئة الجديدة ، يجب على مديري المخاطر استيعاب الأجزاء الأساسية لمثل هذا النظام البيئي المعقد."

ما حدث مع Facebook و WhatsApp و Instagram كان مؤسفًا ، ولكن نأمل أيضًا أن يفتح العين. يجب على الأشخاص الذين يعتمدون على الأنظمة المترابطة أن يفهموا أن الخطأ الصحيح يمكن أن يعطل كل شيء. ويجب وضع تدابير (أو تمحيصها وصقلها) لتقليل احتمالية حدوث مثل هذه الاضطرابات وأقل تأثيرًا.

في حالة Facebook ، لم تكن مشكلته هي مشاكل جهاز التوجيه ، ولكن بالأحرى وجود نظامه الإيكولوجي بالكامل متصلاً بكل شيء آخر. وبالتالي ، مع تعطل Facebook (الخدمة) ، كان على Facebook (الشركة) أن ينفق الكثير من الوقت والطاقة ببساطة في تنظيم ومعالجة المشكلة. إذا لم يستخدم نظامًا متجذرًا ومترابطًا كهذا أو كان لديه خطط احتياطية للتعامل مع انقطاع مثل هذا ، فمن المحتمل أن يستغرق إصلاحه وقتًا أقل بكثير.