تعرضت جميع خدمات شركة فيسبوك لعطل شامل يوم أمس، وقد استمر العطل لأكثر من ست ساعات، وهي حادثة لا تتكرر كثيرًا. وقد شمل العطل كلًا من فيسبوك، وإنستاجرام، وواتساب، وماسنجر، وأيضًا Oculus VR.


وقد تكاثرت التقارير التي تفسر أسباب حدوث هذا العطل. ومن ناحية أخرى فقد أشارت بعض المصادر إلى أنه ناتج عن محاولة اختراق ضخمة تعرضت لها الشركة. إلا أن هذا لم يكن صحيحًا. وكان السبب الرئيسي وراء ذلك يكمن في مشكلة في عناوين DNS الخاصة بخدمات وتطبيقات فيسبوك.


وحدثت المشكلة بشكل رئيسي بسبب تغيير في بروتوكول BGP (Border Gateway Protocol) الذي تستخدمه فيسبوك وآلاف الشركات غيرها، ويتم الاعتماد على هذا البروتوكول في توجيه الزيارات – والتي تعرف بالترافيك – إلى أماكنها الصحيحة ضمن خوادم فيسبوك.


ما هو بروتوكول BGP


يعد بروتوكول BGP واحد من أهم البروتوكولات التي تنظم الحركة على الإنترنت. حيث إنه مسؤول عن نقل حزم البيانات من المستخدم إلى الخادم المناسب والعكس. ويوصف هذا النظام باسم “نظام مكاتب البريد” أو “منظّم المرور” توضيحًا لوظيفته.


ولكن الوصف الأكثر دقة وسهولة له هو أنه عبارة عن مجموعة من الأشخاص الذين ينظمون خارطة الوصول لأماكن معينة ويرشدون المسافرين إليها.


وعند التعامل مع هذا البروتوكول فإنه من الممكن وصف شبكة الإنترنت بأنها عبارة عن مجموعة من الشبكات الضخمة المتصلة ببعضها البعض. ويتم الربط بين هذه الشبكات بالاعتماد على مزوّد معين للخدمة. وبالنسبة للمواقع والمنصات الضخمة مثل فيسبوك فإنه من الصعب ربط تلك الشبكات بسلاسة.

 

ونظرًا لضخامة وتعقيد هذا النظام فإن أي مشكلة يمكن أن يكون لها أثر كبير جدًا. وهذا الخطأ سيؤثر على جميع مستخدميه.


ومن ناحية أخرى فإنه من الممكن وصف بروتوكول BGP بأنه الوسيط بين عمليات الاتصال. مثلًا إن كنت تستخدم مزوّد إنترنت يحمل الاسم DecadeConnect وتريد أن تدخل إلى موقع ما يستخدم مزوّد إنترنت يحمل الاسم NetSend فإن عملية الاتصال بين مزوديّ الخدمة لا يمكن أن تتم بدون هذا البروتوكول.


ويستخدم هذا البروتوكول كما سلف الذكر في تحديد أسهل وأقصر مسار ممكن للبيانات بين كل شبكة وأخرى. وذلك لكي يتمكن المستخدم من استخدام خدمات فيسبوك في هذه الحالة بأعلى أداء ممكن وأقل وقت تحميل.


توقف فيسبوك


بالحديث عن فيسبوك بشكل محدد فإنها لا تستخدم هذا البروتوكول من طرف مزود خدمة معين. بل إنها تستخدم بروتوكول خاص بها ومن تصميمها. ولذل فإن الخدمة قد تعطلت على الأغلب بسبب خطأ بشري معتاد عند تحديث البروتوكول الخاص بالشركة.


وبالفعل، صرّحت الشركة موضحة أن المشكلة قد حدثت بسبب “تغييرات في الإعدادات التي تقوم بتوجيه حركة البيانات ضمن الشبكة التي تضم جميع مراكز بيانات الشركة”.


ولعل للمشكلة بعد آخر متعلق بعناوين DNS (Data Nameservers) وهي خاصية تستخدم في توجيه الزيارات. وبتبسيط بالغ فإن خاصية DNS تخبر المتصفح بوجهته عند الدخول لرابط أي موقع، ومن ثم يلعب بروتوكول BGP دورًا آخر، وهو تحديد أقصر طريق ممكن للوصول لهذه الوجهة.