جشنواره پاییزه توسینسو ، تا 90% تخفیف + گارانتی، مدرک و منتورینگ
پایان تخفیف تا:
مشاهده دوره‌ها
0

هارد spare در سرور اچ پی - چراغ هارد خاموش شده است

سلام. وقت بخیر
برای سرور 4 عدد هارد ssf2.4t خرید و نصب و راه اندازی شده
3 عدد هارد رو با رید 5 استفاده کردیم
و هارد چهارم رو بعنوان spare تنظیم کردیم . چند روز اول چراغ هارد چهارم نارنجی رنگ بود
توسط ilo که سیستم رو چک کردیم هیچ خطایی وجود نداشت و وضعیت رو عادی نشون میداد. تنظیمات استورج هم نشون میداد که سه تا هارد بصورت رید 5 فعال هستند و هارد چهارم بصورت spare
بعد از تقریبا یک هفته  الان چراغ هارد چهارم کامل خاموش شده  و پیغام خطا در ilo  برای استوریج نشون داده میشه با عنوان
Degraded
اما روی اتوریج که میزنم وضعیت تمام هاردها رو اوکی نشون میده
نشون میده 3 تا هارد در رید 5 و هارد چهارم در حالت اسپیر استندبای  هستش

@Redfish.WriteablePropertiesLocationIndicatorActive,HotspareReplacementMode,HotspareType
Id5
Name2.4TB 12G SAS HDD
Status.StateStandbySpare
Status.HealthOK


ممنون میشم راهنمایی کنید واقعا مشکلی دارد یا خیر هارد
و اینکه راه بهتر و دقیقتر برای چک کردن وضعیت هاردها چی هستش

پرسیده شده در 1403/12/06 توسط

3 پاسخ

1

به دلیل پیغام خطای "Degraded" در iLO، نیاز به بررسی دقیق‌تری داره

بررسی وضعیت هاردها با استفاده از ابزارهای مدیریت سرور -  از ابزارهای مدیریت سرور مانند iLO، HPE Smart Storage Administrator یا نرم‌افزارهای مشابه استفاده کنید تا وضعیت دقیق هاردها را بررسی کنید. این ابزارها معمولاً اطلاعات دقیقی در مورد سلامت هاردها و وضعیت RAID ارائه می‌دهند

بررسی لاگ‌های سیستم لاگ‌های سیستم و iLO را بررسی کنید تا اطلاعات بیشتری در مورد خطای "Degraded" به دست آورید. این لاگ‌ها ممکن است نشان دهند که آیا هارد چهارم واقعاً مشکلی دارد یا خیر

تست سلامت هاردها از ابزارهای تست سلامت هارد مانند `CHKDSK` در ویندوز یا `smartctl` در لینوکس استفاده کنید تا وضعیت سلامت هاردها را بررسی کنید. این ابزارها می‌توانند به شما کمک کنند تا مشکلات احتمالی هاردها را شناسایی کنید

تعویض هارد اسپیر  اگر پس از بررسی‌ها متوجه شدید که هارد چهارم واقعاً مشکلی دارد، می‌توانید آن را با یک هارد جدید تعویض کنید و مجدداً به عنوان اسپیر تنظیم کنید

بررسی تنظیمات RAID : مطمئن شوید که تنظیمات RAID به درستی انجام شده است و هیچ مشکلی در پیکربندی RAID وجود ندارد




پاسخ در 1403/12/06 توسط
1

از خوندن کامنت دوستان کلی اطلاعات مفید یاد گرفتم ممنون از همتون

پاسخ در 1403/12/08 توسط
1

اینکه وضعیت Degraded در iLO نمایش داده میشه اما همه هاردها در Storage Configuration به‌صورت OK نشان داده می‌شوند، نشون‌دهنده یک تناقض در وضعیت ذخیره‌سازی هست که معمولاً به یکی از دلایل زیر اتفاق می‌افته:

1. بررسی علت خطای "Degraded" در iLO

دلایل احتمالی: ✅ حالت Standby Spare: چراغ خاموش هارد Spare نشون میده که در حالت آماده‌باش (Standby Spare) قرار داره، که طبیعی هست، ولی نمایش Degraded در iLO کمی مشکوک به نظر میاد.
مشکل در فریمور iLO یا RAID Controller: گاهی اوقات نسخه‌های قدیمی iLO یا کنترلر RAID، وضعیت را اشتباه نمایش می‌دهند.
وجود سکتورهای خراب در هاردی که هنوز اعلام نشده: ممکنه یک یا چند سکتور در هاردهای RAID دچار مشکل شده باشند ولی هنوز به‌عنوان خرابی گزارش نشده‌اند.
مشکل در ارتباط بین iLO و RAID Controller: گاهی iLO اطلاعات رو با تأخیر یا اشتباه دریافت می‌کنه.

2. راه دقیق‌تر برای بررسی وضعیت هاردها

✅ بررسی وضعیت از طریق RAID Controller

بهترین راه برای بررسی دقیق وضعیت هارد و RAID، استفاده از ابزار RAID Controller هست. اگر سرور HPE هست، می‌تونی از HPE SSA (Smart Storage Administrator) استفاده کنی:

🔹 اگر سرور در حال اجراست:
از طریق سیستم‌عامل، دستور زیر رو اجرا کن (در سرورهای HPE):

ssacli ctrl slot=0 show config

یا

hpssacli ctrl slot=0 show config

🔹 در محیط UEFI/BIOS:
هنگام بوت، با فشردن F10 وارد HPE SSA شو و وضعیت RAID و هاردها رو چک کن.


✅ بررسی لاگ‌های iLO

از طریق iLO به صفحه Log یا Diagnostics برو و پیام‌های مربوط به Storage رو بررسی کن.
اگر مورد خاصی نشون داده شده، مثلاً Predictive Failure، یعنی هارد ممکنه به‌زودی خراب بشه.

✅ بررسی S.M.A.R.T هاردها

اگه به سیستم‌عامل دسترسی داری، می‌تونی با ابزار smartctl (در لینوکس) یا HPE Insight Diagnostics (ویندوز) وضعیت هاردها رو دقیق‌تر چک کنی:

🔹 برای بررسی وضعیت هاردها در لینوکس:

smartctl -a /dev/sdX

🔹 در ویندوز، می‌تونی از HPE Insight Diagnostics استفاده کنی.

3. راهکار پیشنهادی بر اساس نتایج بررسی

🔵 اگر همه هاردها OK بودن و خطایی در S.M.A.R.T نبود:

  1. یکبار کنترلر RAID رو ریست کن.
    از داخل iLO یا سرور، کنترلر RAID رو ریبوت کن تا ببینی مشکل حل میشه یا نه.
  2. iLO رو آپدیت کن.
    بعضی مواقع، خطای نمایش داده‌شده در iLO یک باگ نرم‌افزاریه و با آپدیت رفع میشه.

🟠 اگر سکتور خراب یا هشدار در S.M.A.R.T دیده شد:

  1. هارد مشکل‌دار رو از طریق SSA یا iLO عوض کن.
  2. به لاگ‌های RAID Controller دقت کن.
  3. یک تست سلامت کامل روی RAID انجام بده.

🔹 اگر فقط iLO خطای Degraded رو میده ولی RAID وضعیت هاردها رو OK نشون میده، احتمالاً باگ نرم‌افزاری هست.
🔹 اگر هارد Spare در Standby هست، چراغ خاموش بودنش طبیعیه، ولی همچنان از طریق RAID SSA و S.M.A.R.T وضعیت رو چک کن.
🔹 بهترین راه بررسی دقیق، استفاده از HPE SSA و دستور hpssacli برای چک کردن RAID است.
🔹 اگر بعد از این بررسی‌ها همچنان مشکل داشتی، یکبار فریمور RAID Controller و iLO رو آپدیت کن.

نتیجه بررسی‌هات رو بگو تا دقیق‌تر راهنمایی کنم! 😎

پاسخ در 1403/12/07 توسط

پاسخ شما