در دنیای دیتاسنترهای مدرن و زیرساختهای حیاتی فناوری اطلاعات، اطمینان از عملکرد بدون اختلال سرورها نقشی حیاتی دارد. سرورهای HP (یا HPE) یکی از محبوبترین گزینهها در بین سازمانها و شرکتها هستند. اما صرف خرید یک سرور قدرتمند کافی نیست؛ باید بهطور مداوم سلامت سختافزاری سرور HP بررسی شود. خوشبختانه HPE برای این موضوع راهکاری کارآمد در اختیار کاربران قرار داده است: iLO یا Integrated Lights-Out.
این مقاله به بررسی دقیق و عملی نحوه استفاده از iLO برای بررسی سلامت سختافزاری سرور HP میپردازد. از آشنایی با محیط iLO گرفته تا گزارشگیری از وضعیت پاور، فنها، دما، و حافظه، در ادامه به همهی این موارد خواهیم پرداخت.
iLO مخفف عبارت Integrated Lights-Out است؛ یک چیپ مستقل در سرورهای HP که به مدیر شبکه اجازه میدهد حتی بدون روشن بودن سیستمعامل، سرور را از راه دور کنترل کند. این قابلیت نه تنها امکان ریبوت و دسترسی به کنسول را میدهد، بلکه ابزار کاملی برای نظارت بر وضعیت سلامت قطعات فیزیکی سرور نیز فراهم میکند.
نسخههای مختلفی از iLO تاکنون عرضه شدهاند، مانند iLO 4، iLO 5 و iLO 6. هر کدام امکاناتی نظیر مانیتورینگ پیشرفته، لاگگیری از خطاهای سختافزاری، ارسال هشدار ایمیلی و حتی یکپارچگی با نرمافزارهای مدیریت دیتاسنتر را در خود جای دادهاند.
برای دسترسی به iLO مراحل زیر طی میشود:
یکی از مهمترین عوامل خرابی سختافزار در دیتاسنترها، دمای بالا و گردش ناکافی هواست. بخش “Thermal” در iLO بهصورت لحظهای دمای اجزای کلیدی مانند CPU، چیپست، ماژولهای RAM و درایوها را نمایش میدهد.

در این بخش میتوان مشاهده کرد که آیا فنها با سرعت مناسب کار میکنند یا نه. اگر دمای یک قطعه از حد مجاز بالاتر برود، iLO آن را با رنگ قرمز یا زرد نشان داده و هشدار ارسال میکند. این هشدار میتواند بهصورت ایمیل برای مدیر شبکه فرستاده شود.
بخش “Power” در iLO به شما امکان میدهد تا:
را مشاهده کنید. اگر یکی از پاورها خراب یا غیرفعال شده باشد، این بخش بلافاصله آن را مشخص میکند. همچنین میتوان برنامهای برای خاموش یا روشن کردن خودکار سرور تعریف کرد.
یکی دیگر از بخشهای حیاتی در بررسی وضعیت فیزیکی سرورها، سلامت رمها است. iLO ماژولهای رم را بهصورت جداگانه بررسی کرده و در صورت وجود خطاهای ECC یا خرابی احتمالی، آن را ثبت میکند.
در بخش “Memory” میتوان اطلاعاتی نظیر:
را مشاهده کرد. تشخیص زودهنگام خطای رم میتواند جلوی بسیاری از کرشهای سیستمعامل و خرابی دیتابیس را بگیرد.
اگر کنترلر RAID بهدرستی پیکربندی شده باشد، iLO میتواند وضعیت درایوها را از طریق ابزارهایی مانند HPE Smart Array نمایش دهد. در برخی موارد، نیاز به نصب نرمافزار HPE System Management Agent برای نمایش این اطلاعات در iLO هست.
در این بخش میتوانید ببینید:

iLO دارای بخشی بهنام “Integrated Management Log” یا IML است که تمامی رخدادهای مهم سختافزاری را ثبت میکند، از جمله:
این لاگها بهشدت برای تشخیص و عیبیابی دقیق مشکلات به کار میآیند. همچنین میتوان آنها را برای تیم فنی یا گارانتی ارسال کرد.
اگر از نسخه پیشرفته یا لایسنسدار iLO استفاده میکنید، قابلیتهایی نظیر موارد زیر را هم خواهید داشت:
این امکانات باعث میشوند بدون نیاز به مراجعه فیزیکی به محل سرور، بتوانید تمام وضعیت سلامت و مدیریت را از راه دور انجام دهید.

فرض کنید یک سرور HP DL380 G10 در اختیار دارید. پس از ورود به iLO:
این مثال ساده نشان میدهد چطور iLO به شما در تشخیص زودهنگام مشکلات کمک میکند و جلوی خسارتهای بزرگ را میگیرد.
ابزار iLO در سرورهای HP، یک پل ارتباطی هوشمند بین مدیر سیستم و سختافزار فیزیکی است. با استفاده درست از این ابزار، میتوان بهصورت دقیق و لحظهای وضعیت اجزای مختلف سرور را کنترل و مدیریت کرد. این موضوع، نهتنها از بروز اختلالات در سرور جلوگیری میکند بلکه به افزایش طول عمر و بهرهوری تجهیزات نیز کمک میکند.
در شرایطی که سلامت سختافزاری سرور HP برای پایداری کسبوکار حیاتی است، هیچ ابزاری بهاندازهی iLO نمیتواند شفاف، دقیق و قابل اعتماد باشد. با بررسی منظم اطلاعات ارائهشده توسط این سیستم، میتوان با اطمینان کامل سرورها را در وضعیت پایدار نگه داشت و در زمان لازم تصمیمات فنی مناسبی گرفت.