ریست شدن سرور بدون هیچ خطایی، مرموز ترین و کلافه کننده ترین اتفاق برای هر مدیر فنی است. هنگامی که سیستم بی سر و صدا ری استارت می شود و در لاگ ها هیچ اثری از علت حادثه باقی نمی ماند، روند عیب یابی بسیار پیچیده خواهد شد.
این مشکل که به ظاهر ریشه ای نامرئی دارد، اغلب ناشی از مشکلات پنهان در لایه های سختافزار، ناسازگاری های نرم افزاری یا تنظیمات پیشرفته ای است که در نگاه اول دیده نمی شوند.
در این مقاله، قصد داریم پرده از دلایل اصلی این رویداد مرموز برداریم و با ارائه یک راهنمای عملی، شما را گام به گام برای تشخیص و رفع این مشکل شایع و اساسی همراهی کنیم.
جهت کسب اطلاعات بیشتر کلیک کنید
دلایل سخت افزاری ریست شدن سرور بدون خطا
ریست شدن سرور بدون هیچ خطایی، به دلیل مشکلات متعددی از جمله مشکلات سخت افزاری انجام می گیرد. با شناسایی این عوامل، قادر خواهید شد از خاموش شدن ناگهانی سرور جلوگیری نمایید. این عوامل شامل؛
منبع تغذیه
پاور قلب تپنده سرور است و اگر دچار مشکل شود CPU خاموش می شود. در ساده ترین شکل خاموشی ناشی از شل بودن کابل می باشد. اما، در سرور هایی که دو منبع تغذیه دارند، خرابی یکی از پاور ها شاید فقط در گزارش ها ثبت شود اما، در نهایت، باعث ریست ناگهانی سرور گردد. برای حل این مشکل، پس از بررسی برق ورودی و تحلیل لاگ ها، پاور معیوب باید با نمونه اصلی جایگزین شود.
اختلال در رم و ماژور
اگر در رم اختلالی وجود داشته باشد از همان لحظه روشن شدن سرور آشکار می شود. استفاده از رم نامناسب، نصب اشتباه رم و فرسودگی ماژول دلیل این اختلال می باشد. این خطا ها گاهی دلیل ریست شدن سرور بدون هیچ خطایی می شوند.
خرابی هارد دیسک
از جمله مشکلات کلیدی سرور، خرابی هارد دیسک است. این اختلال با کرش های مکرر، کندی عملکرد و تغییر رنگ چراغ ها خود را نشان می دهد.
اختلال در فن سرور
افت سرعت یا خاموشی ناگهانی سرور، گاهی به دلیل خرابی فن اتفاق می افتد. این خرابی و اختلال تهدید جدی برای سلامت سخت افزار سرور محسوب می شود که، ناشی از تجمع گرد و غبار یا تهویه نامناسب رک سرور خواهد بود.
خرابی مادربرد
یکی از شدید ترین اختلالات، خرابی مادربورد در سرور ها HPE می باشد. از رایج ترین علائم آن؛ عدم راه اندازی، فریز شدن سیستم حین کار و خطای شناسایی سخت افزار است.
دلایل نرم افزاری ریست شدن سرور بدون خطا
دلایل نرم افزاری، ریست شدن سرور بدون هیچ خطایی، بسیار آزار دهنده و مشکل ساز هستند زیرا گاهی هیچ خطا و اخطار واضحی ثبت نمی گردد. علت اصلی این ریست ها شامل؛
مشکلات فریمور
فریمور مغز متفکر سخت افزار محسوب می شود. معمولا در نسخه های قدیمی و باگ دار، دستور ریست یا خاموشی نا به جا صادر می نماید. گاهی نصب قطعه ای جدید مانند کارت شبکه غیر از hp باعث ناسازگاری سخت افزاری می گردد. Bioe برق آن را به درستی مدیریت نخواهد کرد در نتیجه منجرب به ریست می شود.
تنظیمات سیستم عامل و مدیریت انرژی
در ویندوز سرور و Hyper-V، برخی تسک های زمان بندی شده یا تنظیمات پیش فرض مدیریت انرژی (Power Management) در خود ویندوز باعث خاموشی یا ریست می شوند. همچنین، وجود قابلیت های مثل ASR یا بازیابی خودکار به گونه ای تنظیم شده اند که، در صورت تشخیص مشکل بلافاصله سرور را ریست می کنند. چون این ریست از طرف سیستم عامل صادر می گردد، در گزارش های سخت افزاری iLO هیچ خطایی ثبت نمی گردد.
به روز رسانی شکست خورده
گاهی نصب یک آپدیت ناپایدار یا قطع به روز رسانی فاجعه بار می شود. در نتیجه فایل های حیاتی سیستم مختل یا باعث عدم بوت شدن سیستم در حین نصب گردد در نتیجه اختلال جدی و پنهانی ایجاد خواهد کرد و ریست های پی در پی را بوجود می آورد.
جهت کسب اطلاعات بیشتر تماس بگیرید
راهنمای گام به گام رفع مشکلات ریست شدن سرور بدون هیچ خطایی
حالا که به طور کامل با عوامل ریست شدن ناگهانی سرور بدون هیچ خطایی آشنا شدید، باید راهکار های رفع این خطا ها شناسایی و به کار ببرید. این راه کار ها عبارتند از؛
1. بررسی فیزیکی
در ابتدا، اتصال محکم کابل و شبکه را بررسی و همچنین چراغ های روی سرور را برای تشخیص الگوی غیر عادی چک نمایید. برای اطمینان از عملکرد صحیح فن ها از دمای مناسب، اتاق سرور مطمئن شوید.
2. بررسی کنسول مدیریت از راه دور سرور (iLO , iDRAC)
به IP اختصاصی ماژول مدیریت سرور متصل شوید. گزارش ها و داده های دقیق سنسور های دما، ولتاژ و توان مصرف را قبل از بازه زمانی ریست شدن، در بخش IML بررسی و در نظر بگیرید.
3. اجرای تست های تشخیصی
تقریبا همه سرور ها یک نرم افزار تست داخلی دارند. حتما آن را به کار ببرید. برای مثال، استفاده از کلید F2 هنگام روشن کردن، باعث چک کردن نرم افزار های رم و پردازنده خواهد شد. پیکر بندی حداقلی (Minimum Configuration) بسازید. یعنی سرور را خاموش و تمام قطعات غیر ضروری مثل کارت های شبکه، هارد دیسک های اضافی(به جز یک عدد) و ماژول های رم (یک عدد باقی بماند) را خارج و روشن کنید. در صورتی که، مشکل حل شود به معنای خرابی یکی از قطعات جدا شده در غیر این صورت، آن ها را یکی یکی وصل تا قطعه معیوب شناسایی شود.
4. بررسی لایه نرم افزار و تظیمات
گاهی مشکل از خوده سیستم عامل است. در این مرحله سرور را ریست و در برنامه Event Viewer بخش Logs > System Windows به دنبال خطا ها یا هشدار های قرمز رنگ در لحظات قبل از ریست بگردید یا تنظیمات مدیریت انرژی را بازبینی نمایید. زیرا، گاهی این تنظیمات بیش از حد حساس می شوند.
تنظیمات خواب و بیداری در ویندوز مشکل ساز هستند. بنابراین، در قسمت Control Panel > Power Options. حالت های آن را موقتا غیر فعال کنید. گاهی با برگرداندن، آپدیت یا درایو جدیدی که نصب شده، مشکل به راحتی حل می شود.
5. اقدام نهایی و پیشگیرانه
آخرین به روز رسانی های فریمور و درایو کنترلر را از سایت سازنده، دانلود و به کار ببرید. . خیلی از باگ ها به این شکل حل می گردند. برای پیشگیری از مشکلات آینده، از تمام یافته ها و راه حل های نهایی گزارش و مستنداتی تهیه نمایید. اگر هیچ کدام از این اقدامات پاسخ گوی شما نبود با پشتیبانی فنی سازنده سرور تماس بگیرید.
سخن پایانی
در این مقاله به طور کامل با دلایل ریست شدن سرور بدون هیچ خطایی و راه کار های رفع آن آشنا شدید. می دانید که کلید موفقیت، حرکت از ساده به پیچیده و استفاده از ابزار های مناسب مانند کنسول های مدیریتی برای جمع آوری سرنخ های حیاتی است.
به یاد داشته باشید که پیشگیری با به روز رسانی های منظم فریمور، نظارت مستمر بر سلامت سخت افزار و مستند سازی دقیق تجربیات بهترین استراتژی برای دستیابی به پایداری است. با به کارگیری این اصول، قابلیت اطمینان سیستم های خود را به سطح جدیدی می رسانید. برای تهیه رک و تجهیزات شبکه مطابق با نیاز خود به سایت آماد سیستم مراجعه نمایید.
سوالات متداول
- ریست شدن سرور بدون هیچ خطایی از کجا شروع می شود؟
از برق و دمای سرور. اول پاور (برق ورودی/خروجی)، فن ها (گرمای بیشازحد) و چراغ های جلوی سرور را چک کنید.
- اگر در iLO هم خطایی نبود، کجا را بررسی کنیم؟
در گزارش پیشرفته AHS (Active Health System) درون iLO/iDRAC. این گزارش نوسانات لحظه ای دما و برق را نشان می دهد.
- آیا تنظیمات نرم افزار هم باعث این ریست می شود؟
بله. تنظیمات مدیریت انرژی ویندوز یا قابلیت ASR در BIOS، به اشتباه دستور ریست می دهند و رد پایی در لاگ سخت افزار باقی نمی گذارند.

