لماذا استغرق إصلاح خلل منصات فيسبوك نحو 7 ساعات وما احتمال حدوث ذلك مرة أخرى

كتب وجدي نعمان

تعرّض كل من “فيسبوك” و”إنستغرام” و”واتس آب” لانقطاع عالمي هائل بالأمس، دام

نحو سبع ساعات تقريبا.

وبدأت المشكلات في حوالي الساعة 16:45 بتوقيت غرينتش، ما ترك المستخدمين غير قادرين على الوصول إلى المنصات الثلاث، بالإضافة إلى “مسنجر” وOculus، لبقية المساء.

وألقى “فيسبوك”، الذي يمتلك تلك الخدمات جميعها، باللوم في انقطاع الخدمة على تحديث خادم في عملية فاشلة، ويصر على أنه لم يكن هجوما إلكترونيا من خارج الشركة.

وقالت شركة التكنولوجيا الأمريكية العملاقة إن المشكلة ناتجة عن تحديث خاطئ أُرسل إلى خوادمها الأساسية، ما أدى إلى فصلها فعليا عن الإنترنت.

ولكن، لماذا استغرق الأمر أكثر من سبع ساعات لإصلاحه؟

عندما أصبحت منصات “فيسبوك” غير متصلة بالإنترنت، هرع المهندسون إلى مراكز بيانات الشركة لإعادة تعيين الخوادم يدويا، ففوجئوا بأنهم لا يستطيعون الولوج إلى الداخل.

وقالت مراسلة التكنولوجيا في نيويورك تايمز، شيرا فرنكل، لبرنامج “توداي” على قناة “بي بي سي”، إن هذا كان جزءا من السبب الذي جعل حل المشكلة يستغرق وقتا طويلا.

وأوضحت: “الأشخاص الذين يحاولون معرفة ماهية هذه المشكلة لم يتمكنوا حتى من الدخول جسديا إلى المبنى” لمعرفة الخطأ الذي حدث.

وما زاد الطين بلة، إدعاء أحد المطلعين بأن الانقطاع تفاقم لأن أعدادا كبيرة من الموظفين يعملون من المنزل في أعقاب “كوفيد”، ما يعني أن وصولهم إلى مراكز البيانات استغرق وقتا أطول.

ولم تقدم الشركة الكثير من التفاصيل حول كيفية إصلاح المشكلة أخيرا، لكن من المفهوم أنه كان على المهندسين إعادة تعيين الخوادم يدويا حيث نشأت المشكلة.

وقال خبير اختبار البرمجيات، آدم ليون سميث من BCS، معهد Chartered لتكنولوجيا المعلومات: “من غير المحتمل أن تكون المشكلات ناجمة عن أشخاص يعملون من المنزل، ولكن من الممكن تماما أن يستغرق الأمر وقتا طويلا لاستعادة الخدمة بسبب انخفاض عدد الموظفين داخل مركز البيانات. وهذا من شأنه أن يفاقم المشكلة لأن طبيعة الفشل تعني أن الوصول عن بعد إلى مركز البيانات لم يكن متاحا أيضا”.

كم عدد الأشخاص الذين تأثروا؟

قالت Downdetector، التي تتعقب حالات الانقطاع، إن هذا كان أكبر فشل تشهده على الإطلاق، مع وجود 10.6 مليون إبلاغ عن المشكلة في جميع أنحاء العالم.

وفي المجموع، لدى “فيسبوك” 2.9 مليار مستخدم نشط شهريا.

وبدأت المشكلات في الساعة 16:44 بتوقيت غرينتش، مع ما يقرب من 80000 إبلاغ لتطبيق “واتس آب”، وأكثر من 50000 تقرير لـ “فيسبوك”، وفقا لـ DownDetector.

ومن زهاء الساعة 22:30 بتوقيت غرينتش، أبلغ بعض المستخدمين أنهم تمكنوا من الوصول إلى الأنظمة الأساسية مرة أخرى. ومع ذلك، لم يعمل “فيسبوك” مرة أخرى لدى العديد من الأشخاص إلا بعد ساعة على من ذلك الأقل.

وقال “واتس آب” إنه عاد للعمل “بنسبة 100%” اعتبارا من الساعة 3:30 بتوقيت غرينتش.

هل يمكن أن يكون هجوما إلكترونيا؟

من المثير للاهتمام أن بيان “فيسبوك” مكتوب بعناية ولا يستبعد التلاعب. ومع ذلك، فإن احتمالية أن يكون هجوما إلكترونيا خارجيا تبدو غير مرجحة، وفقا لتقرير “ديلي ميل”.

ويتطلب الاختراق الهائل لوقف الخدمة الذي قد يطغى على أحد أشهر المواقع في العالم، إما التنسيق بين الجماعات الإجرامية القوية أو تقنية مبتكرة للغاية.

ومع ذلك، فإن التخريب من قبل شخص من الداخل سيكون ممكنا من الناحية النظرية، وفقا لخبراء التكنولوجيا.

وما يثير الانتباه أيضا هو أن الانقطاع أعاق قدرة “فيسبوك” على معالجة المشكلة، لأنه أوقف الأدوات الداخلية اللازمة لإصلاحها.

وهذا يعني أن المشكلة استمرت لما يقرب من سبع ساعات، وهو أمر غير معتاد للغاية.

وضاعف الأمر أسبوعا صعبا على “فيسبوك”، ليواجه اتهامات بالتخفيف من جهود وقف المعلومات المضللة، والسماح بتضخيم الكراهية على منصاته وإدراكه أن “إنستغرام” يمكن أن يضر بالصحة العقلية للفتيات المراهقات.

وحدث الاضطراب أيضا بعد 24 ساعة فقط من إجراء موظف سابق في “فيسبوك” مقابلة مع CBS News، بعد تسريب وثائق حول الشبكة الاجتماعية.

وقال المخبر فرانسيس هوغن، الذي من المقرر أن يدلي بشهادته أمام لجنة فرعية بمجلس الشيوخ اليوم، إن الشركة أعطت الأولوية “للنمو على السلامة”.

وأصر “فيسبوك” على أنه “ليس صحيحا” أن تشير إلى أن الشركة شجعت المحتوى السيئ، أو لم تفعل شيئا ردا على ذلك.

وقال المتخصص في الأمن السيبراني، جيك مور: “من المثير للاهتمام أن بيان فيسبوك لم يستبعد التلاعب. مثل الأقفال الموجودة على خزنة البنك، فإن الأموال الموجودة بالداخل تكون آمنة فقط مثل الشخص الذي لديه المفاتيح – الأمن السيبراني يتعلق بإجراءات الأمن الداخلي الخاصة بالشركة بقدر ما يتعلق بصد الهجمات الخارجية”.

وكرر أن ذلك “لم يكن بسبب هجوم إلكتروني خارجي” لأن التعتيم على الويب ينشأ في كثير من الأحيان من خطأ برمجي غير مكتشف أو خطأ بشري.

فهل أخطأ شخص ما داخل “فيسبوك”؟

هناك الكثير من الاحتمالات أنه قد يكون حادثا وليس عملا تخريبيا متعمدا.

وزُعم أن أحد موظفي “فيسبوك” ربما يكون حذف عن طريق الخطأ أقساما كبيرة من الكود الذي يبقي الموقع متصلا بالإنترنت.

وقال فيسبوك إن فرقه الهندسية حددت “تغييرات التكوين” في أجهزة التوجيه الأساسية الخاصة بها، والتي أوقفت خدماتها.

وقالت الشركة إن هذه التغييرات تسببت في تعطيل الشبكة وحجب الاتصال بين مراكز البيانات الخاصة بها. وبحسبما ورد تأثرت تصاريح عمل الموظفين والبريد الإلكتروني بالمشكلة الداخلية.

ما هي احتمالات حدوث ذلك مرة أخرى؟

يعد الانقطاع العالمي الضخم الذي شهده “فيسبوك” غير شائع إلى حد ما، على الرغم من عدم وجود الكثير الذي يمكن للشركة القيام به لتجنب موقف مماثل بسبب نظامها الخلفي المركزي.

وإلى جانب الانقطاع السريع في يونيو – بسبب تغيير عميل واحد لإعداداته – وظهور Cloudflare في وضع عدم الاتصال في عام 2020، فإنه يُظهر مشكلة وجود نقطة فشل واحدة لعدد كبير من الخدمات التي يستخدمها الأشخاص.

ولا توجد حاليا حلول واضحة لهذا الأمر، ولكن من المرجح أن يؤدي هذا الانقطاع الأخير إلى إعادة إشعال الجدل حول البنية التحتية للإنترنت.

وبالنسبة للعديد من الأفراد والشركات أيضا، أظهر الحدث مدى اعتمادهم على “فيسبوك” وخدماته ليس فقط للتواصل، ولكن أيضا لتسجيل الدخول إلى منصات أخرى.

واستجابة لذلك، شُجّع الأشخاص على التفكير في استخدام بيانات اعتماد أخرى بخلاف تفاصيل تسجيل الدخول إلى “فيسبوك”، للوصول إلى خدمات أخرى عبر الإنترنت.