آنچه در این مقاله خواهید خواند
نقطه تکی شکست (Single Point of Failure) یا SPOF به هر بخشی از یک سیستم اشاره دارد که در صورت از کار افتادن یا متوقف شدن آن، کل سیستم از کار خواهد افتاد. عدم وجود نقطه تکی خرابی یکی از اهداف اصلی در جهت داشتن دسترسی بالا (High Availability) در شبکههای رایانش، نرم افزارها، شیوههای کسب و کار یا هر نوع سیستم صنعتی است.
تعریف نقطه تکی شکست یا خرابی (SPOF)
نقطه تکی شکست یک ریسک احتمالی محسوب میشود که توسط خطایی در طراحی، پیادهسازی، یا تنظیم یک مدار یا سیستم به وجود آمده است. به عبارتی دیگر، SPOF یک خطا یا اختلال در عملکرد بوده که میتواند به از کار افتادن یک سیستم یا شبکه منجر شود. وجود نقطه تکی خرابی در یک دیتاسنتر یا هر نوع محیط آیتی محور دیگر، با توجه موقعیت نقطه و بخشهای وابسته به آن، ممکن است در ظرفیت کاری یا حتی فعالیت کل دیتاسنتر اختلال ایجاد نماید.
یک سرور متمرکز، بهترین مثال از نقطه تکی شکست
یک دیتاسنتر را در نظر بگیرید که در آن یک سرور به تنهایی یک اپلیکیشن را اجرا میکند. در این حالت، سخت افزار این سرور یک نقطه تکی شکست برای دسترسی به اپلیکیشن مذکور است؛ یعنی اگر سخت افزار سرور با مشکل مواجه شود، اپلیکیشن متوقف یا از دسترس خارج خواهد شد. در چنین حالتی، کاربران امکان استفاده از اپلیکیشن را نخواهند داشت و احتمال از دست رفتن دادههای مهم هم وجود دارد.
امروزه فناوری کلاسترینگ (Clustering) یا خوشهبندی سرور از به وجود آمدن چنین شرایطی جلوگیری میکند. با خوشهبندی سرورها، یک کپی از اپلیکیشن روی سروری دیگر و با سخت افزار جداگانه اجرا میشود تا اگر سرور اول با مشکل مواجه شد، سرور دوم جایگزین آن شود و اختلالی در عملکرد اپلیکیشن به وجود نیاید. بنابراین این نوع نقطه تکی شکست به سادگی از بین میرود.
تنها سوئیچ شبکه، نمونهای دیگر از نقطه تکی شکست
در یک نمونه دیگر از SPOF، تعدادی از سرورها صرفا از طریق یک سوئیچ شبکه (Network Switch) به یکدیگر متصل شدهاند. در نتیجه اگر مشکلی برای سوئیچ به وجود بیاید یا حتی اگر از منبع تغذیه خود جدا شود، سرورهای متصل به آن هم از سایر سرورهای شبکه جدا خواهند شد. در این حالت، سوئیچ شبکه یک نقطه تکی شکست است و از کار افتادن آن میتواند دسترسی به سرورهای زیادی مختل کند.
برای مقابله با چنین سناریویی، سوئیچها و ارتباطات اضافی مورد استفاده قرار میگیرند تا سرورهای یک شبکه راههای ارتباطی جایگزین داشته باشند و اگر مشکلی برای سوئیچ اصلی پیش آمد، فعالیتشان بدون اختلال ادامه پیدا کند.
شناسایی نقطه تکی شکست یا خرابی
تقریبا هر بخش از یک دیتاسنتر میتواند یک نقطه تکی شکست باشد، زیرا در اکثر مواقع تنها یک سیستم اصلی در آنها مورد استفاده قرار میگیرد. سرورها، فضای ذخیرهسازی اطلاعات، تجهیزات برقی و محیطهای مدیریت سیستم از جمله SPOFهای احتمالی در یک دیتاسنتر هستند.
از دسترس خارج شدن یک سیستم مهم مانند، یک سرور اختصاصی که پشتیبان ندارد، ممکن است به توقف فعالیت بخشهای مهم یک شرکت منجر شود. برای مقابله با چنین شرایطی، باید هر نقطه تکی خرابی را شناسایی و آنها را قبل از وقوع فاجعه برطرف کرد.
بسیاری از SPOFها زمانی به وجود میآیند که یک سیستم به تنهایی وظایف خاصی را بر عهده داشته باشد. از دست رفتن چنین سیستمی، به خصوص اگر تحمل خطا نداشته باشد، فعالیت کل دیتاسنتر و حتی یک کسب و کار را با مشکلات جدی مواجه خواهد کرد. در حالی که شناسایی برخی نقاط تکی شکست آسان است، پیدا کردن تعدادی از آنها به تلاش بیشتری نیاز دارد. برای پیدا کردن SPOF در دیتاسنتر میتوان از روشهای زیر اقدام کرد:
- بررسی نقشه دیتاسنتر که تمامی بخشها و مکانهای آنها را شامل میشود.
- بررسی فیزیکی دیتاسنتر و تجهیزات و کابلهای مخلتف آن.
- بررسی دیاگرام شبکه دیتاسنتر و قسمتهای دیگر ساختمان.
- بررسی کابلهای خارجی، مانند کابلهای ارتباطی و منبع تغذیه و نقاط ورودی آنها.
- اطمینان حاصل کردن از به روز بودن دیاگرامهای فنی.
جلوگیری از به وجود آمدن سینگل پوینت آف فیلیر
سازنده هر دیتاسنتر وظیفه شناسایی و برطرف کردن هر نقطه تکی شکست را بر عهده دارد. با این حال، بر طرف کردن SPOF هم هزینههای قابل توجهی به همراه دارد و قیمت سرورها، کابلها و سوئیچهای اضافی میتواند به رقم بالایی برسد. بنابراین سازنده باید اهمیت هر بخش و هزینه مورد نیاز برای برطرف کردن نقاط تکی خرابی آن را مورد در نظر بگیرد و سپس مواردی که ارزش هزینه کردن را دارند، برطرف نماید.
برخی از روشهای برطرف یا حذف کردن نقطه تکی شکست به شرح زیر هستند:
- استفاده از سیستمهای پشتیبان و نرم افزارهایی که از توقف فعالیت سیستم اصلی جلوگیری میکنند.
- به کار گیری کانال یا پل ارتباطی دوم برای کابلهای اضافی شبکه که در صورت قطعی اینترنت، از ایجاد اختلال جلوگیری میکنند.
- متعادل کردن بار ترافیکی و ارسال درخواستهای کاربران به سرورهایی که در آن لحظه خاص آنلاین و فعال هستند.
- استفاده از سامانه برق اضطراری برای مقابله با شرایطی مانند قطعی برق.
- بروزرسانی زیرساخت امنیتی برای مقابله با حملات سایبری.
در پایان به این موضوع هم اشاره کرد که افراد هم میتوانند نقطه تکی شکست باشند. برای مثال فردی که اطلاعات کاملی از یک سیستم مهم دارد، یک ریسک احتمالی محسوب میشود و بهتر است کارمندان دیگر هم اطلاعاتی مشابه او داشته باشند تا همه چیز به یک نفر بستگی نداشته باشد.
نبود نقطه تکی شکست در شبکههای بلاک چینی
امکان استفاده از یک پایگاه داده مبتنی بر فناوری بلاک چین در شبکهای متمرکز هم وجود دارد، اما این کار متداول نیست و توجیه خاصی ندارد. یکی از ویژگیهای اصلی تکنولوژی زنجیره بلوکی فراهم کردن امکان کار روی یک دیتابیس مشخص توسط تعداد زیادی گره است، بدون این که تناقضی رخ بدهد. از جمله مهمترین دستاوردهای غیرمتمرکز کردن یک شبکه کامپیوتری، از بین رفتن SPOF است.
بیت کوین را در نظر بگیرید. این نتورک از دستبهدست هم دادن تعداد زیادی کامپیوتر واقع در سراسر دنیا تشکیل شده است. هر کدام، تحت عنوان نود یا گره شبکه، ممکن است در گوشهای دورافتاده از دنیا قرار داشته باشد؛ به منظور راهاندازی یک نود بیت کوین، داشتن کامپیوتری با توانایی اجرای نرم افزار بیت کوین کور و دسترسی به اینترنت کفایت میکند. در ادامه این دستگاه به یک سرور مستقل داخل نتورک تبدیل خواهد شد.
تصور کنید به هر دلیل، تعداد قابل توجهی از گرههای بیت کوین از دسترس خارج شوند. از آن جایی که هیچ کدام نقطه تکی شکست نیستند، شبکه از کار نخواهد افتاد. البته سرویسدهی به کاربران کمی کند میشود، اما متوقف نخواهد شد.
سخن پایانی
وجود نقطه تکی شکست در یک محیط به این معناست که اگر یک بخش از سیستم با مشکل مواجه شود، احتمال از دست رفتن اطلاعات مهم یا امکان خدماترسانی به کاربران وجود دارد. امروزه سیستمهای مدرن با بررسیهای دقیق و ایجاد سرورهای پشتیبان و راههای ارتباطی جایگزین، اطمینان حاصل میکنند که شکست یک بخش از سیستم، موجب توقف کامل فعالیت آن نشود.
تهیه شده در بیت 24