لینک کوتاه مطلب : https://hsgar.com/?p=6366

چگونه یک خطای کدگذاری باعث از کار افتادن راجرز شد که میلیون ها نفر را بدون خدمات رها کرد

مردم در 8 جولای از وای فای داخل مرکز خرید فیرویو تورنتو استفاده می کنند.یاد گوزمان/ گلوب اند میل

مهندسان شرکت Rogers Communications Inc. RCI-BT ششمین مرحله از یک فرآیند هفت مرحله ای که برای ارتقای زیرساخت اصلی که از شبکه های بی سیم و پهنای باند شرکت پشتیبانی می کند، در ساعت 2:27 بامداد روز 8 جولای آغاز کردند.

دو ساعت و 16 دقیقه بعد، یک خطای کدنویسی معرفی شد که باعث وقوع موجی از رویدادها شد و منجر به قطعی گسترده شد که میلیون‌ها کانادایی را حداقل برای یک روز بدون تلفن همراه، اینترنت یا خدمات تلفن خانگی رها کرد.

تعطیلی یکی از شبکه های مخابراتی غالب کانادا، هرج و مرج گسترده ای را ایجاد کرد. راجرز قادر به ارائه چهار هشدار اضطراری نبود به مشتریان بی سیم خود در ساسکاچوان، از جمله سه هشدار گردباد و یک گزارش شخص خطرناک.

مشتریان راجرز قادر به تماس با 911 نبودند و سیستم بدهی اینتراک نیز تحت تأثیر قرار گرفت و مشکلاتی را برای مصرف کنندگان و مشاغل ایجاد کرد. در تورنتو، اختلال، خواننده و ترانه سرای کانادایی Weeknd را مجبور کرد کنسرتی را که قرار بود در آن شب در مرکز راجرز برگزار می شد، به تعویق بیندازد.

در ابتدا، حتی خود راجرز هم مطمئن نبود که چه چیزی باعث اختلال در سرویس شده است. اما هفته‌ها بعد، در یک ارسال دقیق در پاسخ به سؤالات کمیسیون رادیو تلویزیون و مخابرات کانادا، این شرکت گزارش کاملی از رویدادهای خود ارائه کرد.

وزیر صنعت می‌گوید، مدیرعامل راجرز باید در ابتدای قطع برق در سراسر کشور تماس می‌گرفت

نظر: قطع راجرز یادآور شکست کانادا در راه اندازی یک شبکه بی سیم امن برای خدمات اضطراری

این اسناد، که توسط CRTC به صورت ویرایش شده در روز جمعه به طور علنی فاش شد، جزئیات جدیدی را در مورد این قطعی ارائه می دهد و نگاهی اجمالی به مجموعه حقایقی ارائه می دهد که مدیران راجرز در روز دوشنبه از آنها استفاده خواهند کرد، زمانی که انتظار می رود در مورد این حادثه شهادت دهند. یک جلسه استماع عمومی در کمیته صنعت و فناوری مجلس عوام.

مانند بسیاری از همتایان خود، راجرز در حال حاضر یک شبکه اصلی دارد که از تمام خدماتی که ارائه می کند پشتیبانی می کند. هسته اساساً مغز شبکه است. تمام ترافیک صوتی، داده های بی سیم، اینترنت و تلویزیون را دریافت، پردازش، انتقال و متصل می کند.

مخابرات در ماه فوریه، پس از آنچه که شرکت در ارسال CRTC خود به عنوان یک فرآیند برنامه ریزی جامع که شامل تصویب بودجه و پروژه، ارزیابی ریسک و آزمایش می باشد، توصیف کرد، فرآیند هفت مرحله ای را برای ارتقاء هسته آغاز کرده بود.

پنج مرحله اول به آرامی پیش رفته بود. اما در ساعت 4:43 صبح روز 8 جولای، کدی معرفی شد که یک فیلتر مسیریابی را حذف کرد. در شبکه‌های مخابراتی، بسته‌های داده توسط دستگاه‌هایی به نام روتر هدایت و هدایت می‌شوند و فیلترها با محدود کردن تعداد مسیرهای احتمالی که به آن‌ها ارائه می‌شود، از هدر رفتن آن روترها جلوگیری می‌کند.

حذف فیلتر باعث شد همه مسیرهای ممکن به اینترنت از طریق روترها عبور کنند و در نتیجه چندین دستگاه از ظرفیت حافظه و پردازش خود فراتر رفتند. این باعث شد که شبکه اصلی خاموش شود.

راجرز از تجهیزات تولیدکنندگان مختلف در هسته شبکه خود استفاده می کند و دو فروشنده ای که شرکت روتر را از آنها خریداری می کند، طرح ها و رویکردهای متفاوتی برای مدیریت ترافیک و محافظت از تجهیزات در برابر بارگذاری بیش از حد دارند. این تفاوت ها هسته اصلی قطعی است که راجرز تجربه کرد، این شرکت در اسناد اعلام کرد.

اما، در ساعات اولیه، تکنسین های شرکت هنوز علت فاجعه را مشخص نکرده بودند. راجرز ظاهراً این احتمال را در نظر گرفت که شبکه هایش توسط مجرمان سایبری مورد حمله قرار گرفته باشند. در ساعت 6 صبح، خورخه فرناندز، که در آن زمان مدیر ارشد فناوری شرکت بود، با همتایان خود در Telus Corp. TT و BCE Inc. Bell Canada BCE-T تماس گرفت تا آنها را از قطعی مطلع کند و به آنها هشدار دهد که بررسی کنند. برای حملات سایبری، شرکت در ارائه خود گفته است.

اگرچه بل و تلوس پیشنهاد کمک کردند، راجرز به سرعت تشخیص داد که نمی‌تواند مشتریان خود را به شبکه‌های رقبای خود منتقل کند، زیرا برخی از عناصر شبکه راجرز، مانند پایگاه داده متمرکز کاربران آن، در نتیجه قطع شدن غیرقابل دسترس بودند. مخابرات گفت، در هر صورت، شبکه های رقیب نمی توانستند با افزایش ناگهانی ترافیک 10.2 میلیون مشترک بی سیم راجرز مقابله کنند.

Champagne می‌گوید، قطع کار راجرز ممکن است بر تصمیم در مورد تصاحب 26 میلیارد دلاری Shaw تأثیر بگذارد.

به گفته دو منبع آگاه از محل اختفا، آقای فرناندز در پرتغال بود و بلافاصله مقدمات بازگشت به کانادا را آغاز کرد. گلوب منابع را شناسایی نمی کند زیرا آنها مجاز به صحبت علنی در مورد این موضوع نبودند.

در همین حال، تیم شبکه راجرز در مرکز عملیات شبکه این شرکت در برامپتون، آنتی گرد هم آمدند و دوباره دسترسی به شبکه را برقرار کردند و شروع به تلاش برای کشف علت قطع کردند.

به منظور برقراری ارتباط با یکدیگر و هماهنگی تلاش‌های بازیابی، برخی از کارمندان شروع به تعویض سیم‌کارت‌های خود با سیم‌کارت‌های Bell یا Telus کردند که در سال ۲۰۱۵ به‌عنوان بخشی از یک طرح اضطراری ایجاد شده بین شرکت‌های مخابراتی بی‌سیم دریافت کرده بودند.

تا ساعت 8:54 صبح – تقریباً چهار ساعت پس از شروع قطعی – که شرکت علناً وضعیت را تأیید کرد. مخابرات از طریق حساب خدمات مشتری خود در توییتر نوشت: «ما می دانیم که ارتباط با مشتریانمان چقدر مهم است. ما از مسائلی که در حال حاضر شبکه‌هایمان را تحت تأثیر قرار می‌دهند آگاه هستیم و تیم‌های ما کاملاً درگیر حل این مشکل در اسرع وقت هستند. ما همچنان شما را در جریان خواهیم گذاشت زیرا اطلاعات بیشتری برای به اشتراک گذاشتن داریم.”

افشای اطلاعات شرکت به CRTC نشان می دهد که واکنش تاخیری ممکن است به مشکلات ورود به حساب های آنلاین مورد استفاده برای ارتباط با مشتریان مربوط باشد. مخابرات گفت که در آینده مطمئن خواهد شد که تیم های واکنش به بحران آن روش های جایگزینی برای دسترسی به حساب های رسانه های اجتماعی دارند که با احراز هویت دو مرحله ای مرتبط با دستگاه های راجرز محافظت می شوند.

تمام روز طول کشید تا تیم شبکه بتواند شبکه را بازیابی کند. آنها مجبور بودند تجهیزاتی را که باعث مشکل شده بود قطع کنند، ترافیک را تغییر مسیر دهند و قبل از اینکه به آرامی سرویس ها را آنلاین کنند، پایداری شبکه را تأیید کنند. این شرکت گفت که این فرآیند باید به صورت روشمند انجام می شد تا از بارگذاری بیش از حد شبکه و ایجاد یک قطعی دیگر جلوگیری شود.

این شرکت اندکی قبل از ساعت 10 شب در توییتر خود نوشت: “خدمات بی سیم ما شروع به بهبودی می کنند و تیم های فنی ما سخت کار می کنند تا همه در سریع ترین زمان ممکن آنلاین شوند.”

صبح روز بعد، راجرز اعلام کرد که خدمات را برای “اکثریت قریب به اتفاق” مشتریان خود بازیابی کرده است. اما مسائل متناوب در طول آخر هفته ادامه داشت.

امروز یکشنبه، در نامه ای سرگشاده به مشتریان، تونی استافیری، مدیرعامل راجرز قول داد که برای بهبود قابلیت اطمینان شبکه های شرکت، روی تست، نظارت و هوش مصنوعی سرمایه گذاری بیشتری کند. او قیمت این تغییرات را در حدود 10 میلیارد دلار طی سه سال اعلام کرد.

آقای Staffieri گفت که غول بی‌سیم همچنین شبکه‌های اصلی بی‌سیم و بی‌سیم خود را جدا می‌کند تا اطمینان حاصل شود که هرگونه قطعی در آینده بر هر دو سرویس تأثیر نمی‌گذارد.

هفته گذشته، این شرکت ران مک کنزی را جایگزین آقای فرناندز، مدیر سابق وودافون کرد. آقای مک‌کنزی قبلاً رئیس Rogers for Business بود، بخشی که خدمات بی‌سیم و اینترنت را به مشتریان شرکت ارائه می‌دهد.

آقای مک کنزی نقش جدید خود را با حضور در مقابل کمیته مجلس عوام که در حال بررسی این قطعی است آغاز خواهد کرد. این کمیته که متشکل از اعضای پارلمان از هر چهار حزب اصلی فدرال است، انتظار می‌رود او، آقای استافیری و تد وودهد، مدیر نظارتی ارشد راجرز، اعتبار صورت‌حساب پنج روزه‌ای را که شرکت برای جبران خسارات مشتریانش ارائه می‌کند، بپذیرد. قطع شدن کمیته همچنین ممکن است در مورد تغییرات شبکه و عملیاتی که برنامه‌های مخابراتی برای جلوگیری از قطعی‌های آینده ایجاد می‌کند، سوال کند.

در حالی که همه این اتفاقات در حال رخ دادن است، راجرز منتظر تایید نظارتی برای تصاحب 26 میلیارد دلاری شرکت Shaw Communications Inc، قبل از مهلت 31 جولای است. دفتر رقابت در تلاش است تا از ادغام جلوگیری کند، با این استدلال که این ادغام منجر به خدمات ضعیف تر و قیمت های بالاتر برای مشتریان تلفن همراه خواهد شد.

وقت شما ارزشمند است خبرنامه سرفصل های کسب و کار برتر را به راحتی در صبح یا عصر به صندوق ورودی خود تحویل دهید. امروز ثبت نام کنید.

لینک منبع

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.