اگر مدیر شبکه یا مسئول نگهداری سرور باشید، احتمالاً حداقل یک بار با این وضعیت روبهرو شدهاید؛ سروری که تا دیروز بدون مشکل کار میکرد، امروز ناگهان با افت شدید سرعت مواجه شده است. کاربران از کند شدن نرمافزارها شکایت میکنند، ماشینهای مجازی دیر بالا میآیند، دیتابیس با تأخیر پاسخ میدهد و حتی کپی کردن فایلهای ساده نیز زمان زیادی میبرد. در بسیاری از این مواقع، اولین قطعهای که باید بررسی شود، هارد سرور است.
اما آیا همیشه خود هارد مقصر است؟ پاسخ منفی است. کند شدن هارد سرور میتواند به دلایل مختلفی از جمله مشکلات سختافزاری، تنظیمات اشتباه RAID، خرابی کنترلر، کمبود منابع سیستم، افزایش بار کاری یا حتی مشکلات سیستمعامل رخ دهد. در این مقاله به صورت کامل بررسی میکنیم که چرا هارد سرور ناگهان کند میشود، چگونه علت اصلی را تشخیص دهیم و چه اقداماتی برای رفع این مشکل انجام دهیم.
قبل از بررسی دلایل، بهتر است بدانیم کند شدن هارد معمولاً با چه علائمی همراه است.
رایجترین نشانهها عبارتاند از:
اگر چند مورد از این علائم را همزمان مشاهده میکنید، احتمال وجود مشکل در زیرسیستم ذخیرهسازی بسیار زیاد است.
یکی از رایجترین دلایل افت سرعت، خراب شدن تدریجی هارد است. برخلاف تصور بسیاری از افراد، هارد همیشه ناگهانی خراب نمیشود. معمولاً قبل از خرابی کامل، سرعت آن کاهش پیدا میکند. به عنوان مثال:
در این شرایط RAID هنوز فعال است اما کنترلر مجبور میشود چندین بار اطلاعات را از هارد بخواند که همین موضوع باعث کاهش شدید Performance میشود.
اگر یکی از هاردها خراب شده باشد، ممکن است RAID وارد مرحله Rebuild شده باشد. در زمان Rebuild:
در نتیجه:
این وضعیت کاملاً طبیعی است اما باید مدت زمان Rebuild را کنترل کنید.
یکی از سادهترین اما مهمترین دلایل کند شدن هارد سرور، پر شدن فضای ذخیرهسازی است. وقتی ظرفیت هارد از حدود ۸۵ تا ۹۰ درصد بیشتر شود:
در SSD نیز پر بودن حافظه باعث کاهش سرعت نوشتن میشود زیرا فضای کافی برای عملیات Garbage Collection وجود ندارد.

گاهی مشکل اصلاً از هارد سرور نیست. RAID Controller وظیفه مدیریت تمام عملیات ذخیرهسازی را بر عهده دارد. در صورت خرابی کنترلر ممکن است:
به همین دلیل همیشه سلامت RAID Controller را نیز بررسی کنید.
یکی از مهمترین عوامل افزایش سرعت هارد سرور، Write Cache است. اگر Battery یا Cache Module دچار مشکل شود، بسیاری از کنترلرها برای جلوگیری از از دست رفتن اطلاعات، Write Cache را غیرفعال میکنند.
نتیجه آن:
این مشکل معمولاً در سرورهای HPE و Dell بسیار مشاهده میشود.
کنترلرهای حرفهای دارای باتری مخصوص هستند. اگر باتری:
کنترلر برای محافظت از اطلاعات، Cache را خاموش میکند. همین موضوع میتواند سرعت نوشتن اطلاعات را چند برابر کاهش دهد.
هر هارد محدودیت مشخصی در تعداد عملیات ورودی و خروجی (IOPS) دارد. وقتی تعداد درخواستها بیشتر از توان هارد سرور باشد:
این اتفاق معمولاً در شرایط زیر رخ میدهد:
بسیاری تصور میکنند هر کندی مربوط به هارد سرور است. در حالی که اگر حافظه RAM پر شود: سیستم مجبور میشود از Page File استفاده کند. در نتیجه:
وقتی پردازنده به شدت درگیر باشد:
بنابراین همیشه CPU و Disk را همزمان بررسی کنید.
Bad Sector یکی از مهمترین دلایل کند شدن هاردهای HDD است. وقتی سیستم به بخشی آسیبدیده برسد:
اگر تعداد Bad Sector رو به افزایش باشد، بهتر است هارد سرور در اولین فرصت تعویض شود.
دمای زیاد میتواند روی عملکرد هارد تأثیر بگذارد. اگر سیستم خنککننده دچار مشکل شود:
دمای مناسب معمولاً بین ۳۰ تا ۴۵ درجه سانتیگراد است و دماهای بالاتر، بهویژه در رکهای متراکم، نیازمند بررسی جریان هوا و فنها هستند.
گاهی مشکل از خود هارد سرور نیست. بلکه:
دچار اختلال شدهاند.
در این شرایط:
گاهی Firmware هارد یا RAID Controller دارای باگ است. نشانهها:
به همین دلیل همیشه Firmware تجهیزات ذخیرهسازی را به نسخه توصیهشده توسط سازنده بهروزرسانی کنید.
گاهی هیچ خرابی وجود ندارد. بلکه همزمان عملیات زیر اجرا شدهاند:
تمام این عملیات باعث اشغال شدید دیسک میشوند.

به جای حدس زدن، بهتر است مرحلهبهمرحله وضعیت سرور را بررسی کنید:
موارد زیر را کنترل کنید:
اگر هر یک از این شاخصها وضعیت غیرعادی داشته باشند، احتمال خرابی هارد زیاد است.
موارد مهم:
اگر مقدار Disk Queue بهطور مداوم بالا باشد، یعنی تعداد درخواستهای دیسک بیشتر از توان پاسخگویی آن است و باید علت این فشار بررسی شود.
همزمان موارد زیر را نیز بررسی کنید:
گاهی گلوگاه سیستم در بخشی غیر از هارد سرور قرار دارد.
چند ابزار کاربردی برای تحلیل وضعیت ذخیرهسازی عبارتاند از:
این ابزارها اطلاعات دقیقی درباره سرعت خواندن و نوشتن، میزان تأخیر، سلامت دیسک، وضعیت RAID و خطاهای احتمالی ارائه میدهند و به تشخیص سریعتر مشکل کمک میکنند.
پیشگیری همیشه کمهزینهتر از رفع مشکل است. رعایت نکات زیر احتمال بروز افت عملکرد را کاهش میدهد:
کند شدن ناگهانی هارد سرور همیشه به معنی خراب شدن خود هارد نیست. عواملی مانند خرابی تدریجی دیسک، وضعیت RAID، غیرفعال شدن Write Cache، خرابی باتری کنترلر، افزایش IOPS، کمبود RAM، فشار روی CPU، دمای بالا، مشکلات Firmware و حتی اجرای همزمان پردازشهای سنگین میتوانند باعث افت محسوس عملکرد شوند.
بهترین روش برای رفع این مشکل، بررسی سیستماتیک تمام اجزای زیرسیستم ذخیرهسازی است. استفاده از ابزارهای مانیتورینگ، تحلیل لاگهای RAID Controller، پایش سلامت هاردها و کنترل منابع سیستم کمک میکند علت اصلی بهسرعت شناسایی شود. با انجام سرویسهای دورهای، بهروزرسانی Firmware، حفظ ظرفیت آزاد دیسک و مانیتورینگ مستمر، میتوان از بسیاری از مشکلات عملکردی جلوگیری کرد و پایداری و سرعت سرور را در بلندمدت حفظ نمود.