ハウジング自動通報監視 アラート早見表 | |||||
お客様へ通報される文面とは異なる場合がございます。 | |||||
監視メニュー | 監視内容 (監視項目) |
検出内容 | アラート内容 | 想定される原因、対処例等 | |
PING監視(自動通報) | |||||
Ping死活監視 | |||||
PING OK - Packet loss = 0%, RTA = 3.79 ms | 正常にPing応答があります。(復旧しました。) | - | |||
PING CRITICAL - Packet loss = 100% | Pingの応答がありません。 | 監視対象ノードが停止しているか、監視サーバ、監視対象ノード間のネットワークに問題がある可能性があります。 | |||
PING CRITICAL - Packet loss = 0%, RTA = 1840.00 ms | Pingの応答はあるものの、応答時間がしきい値(1800msec)を超えています。 | 監視対象ノードが高負荷状態にある、監視サーバ、監視対象ノード間のネットワークで遅延や、輻輳が起きている可能性があります。 | |||
TCPポート監視(自動通報) | |||||
TCPポート監視 | |||||
TCP OK - 0.001 second response time on port 12345 | 正常にTCP12345ポートの応答があります。(復旧しました。) | - | |||
CRITICAL - Socket timeout after 12 seconds | タイムアウト値(12秒)以内に該当ポートの応答がありません。 | 該当TCPポートを利用しているプロセス(デーモン)や、サービスが停止した可能性があります。 プロセスや、サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 |
|||
Webサーバ監視(自動通報) | |||||
Webサーバ監視 (SSLも同様) | |||||
HTTP OK HTTP/1.1 200 OK - 314 bytes in 0.011 seconds | 正常にHTTP応答があります。(復旧しました。) | ||||
CRITICAL - Socket timeout after 20 seconds | タイムアウト値(20秒)以内にHTTPの応答がありません。 | Webサーバのプロセス(デーモン)や、サービスが停止した可能性があります。 プロセスや、サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 |
|||
Windowsリソース監視(自動通報) | |||||
CPU使用率監視 | |||||
OK - WINDOWS CPU CORE_Total 79.46% Used:Critical=90.00%:Warning=85.00%:Recovery=80.00% | CPU使用率がRecoveryのしきい値を下回りました。 | - | |||
CRITICAL - WINDOWS CPU CORE_Total 90.33% Used:Critical=90.00%:Warning=85.00%:Recovery=80.00% | CPU使用率がCriticalのしきい値を超えました。 | 一時的に監視対象サーバが高負荷になった可能性があります。発生頻度が多い場合は、CPUリソースの不足が考えられます。 | |||
WARNING - WINDOWS CPU CORE_Total 87.66% Used:Critical=90.00%:Warning=85.00%:Recovery=80.00% | CPU使用率がWarningのしきい値を超えました。 | 一時的に監視対象サーバが高負荷になった可能性があります。発生頻度が多い場合は、CPUリソースの不足が考えられます。 | |||
メモリ使用率監視 | |||||
OK - WINDOWS Memory 80.38% Used:Critical=95.00%:Warning=90.00%:Recovery=85.00% | メモリ使用率がRecoveryのしきい値を下回りました。 | - | |||
CRITICAL - WINDOWS Memory 95.33% Used:Critical=95.00%:Warning=90.00%:Recovery=85.00% | メモリの使用率がCriticalのしきい値を超えました。 | 一時的に監視対象サーバが高負荷になった可能性があります。発生頻度が多い場合は、メモリ不足が考えられます。 | |||
WARNING - WINDOWS Memory 92.50% Used:Critical=95.00%:Warning=90.00%:Recovery=85.00% | メモリの使用率がWarningのしきい値を超えました。 | 一時的に監視対象サーバが高負荷になった可能性があります。発生頻度が多い場合は、メモリ不足が考えられます。 | |||
ディスク使用率監視 | |||||
OK - WINDOWS DISK E: 89.77% Used:Critical=95.00%:Warning=90.00%:Recovery=85.00% | Eドライブのディスク使用率がRecoveryのしきい値を下回りました。 | - | |||
CRITICAL - WINDOWS DISK E: 95.01% Used:Critical=95.00%:Warning=90.00%:Recovery=85.00% | Eドライブのディスク使用率がCriticalのしきい値を超えました。 | Eドライブのディスクの使用量が増加しています。不要なファイルを削除するなどの対応が必要です。 | |||
WARNING - WINDOWS DISK E: 90.18% Used:Critical=95.00%:Warning=90.00%:Recovery=85.00% | Eドライブのディスク使用率がWarningのしきい値を超えました。 | Eドライブのディスクの使用量が増加しています。不要なファイルを削除するなどの対応が必要です。 | |||
Windowsサービス監視(自動通報) | |||||
Windowsサービス監視 | |||||
OK - W3SVC Service is Running | W3SVCサービス(IIS)が稼働しています。(停止状態から復旧) | - | |||
CRITICAL - W3SVC Service is Stopped | W3SVCサービス(IIS)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
Windowsプロセス監視(自動通報) | |||||
Windowsプロセス監視 | |||||
OK - example.exe 1 Process:Critical=0 Under:Warning=0 Under:Recovery=1 Over | example.exeプロセス数が1であり稼働しています。(停止状態から復旧) | - | |||
CRITICAL - example.exe 0 Process:Critical=0 Under:Warning=0 Under:Recovery=1 Over | example.exeプロセス数が0となり稼働していません。 | 該当プロセスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
OK - example.exe 47 Process:Critical=90 Over:Warning=70 Over:Recovery=50 Under | example.exeプロセス数が47であり、しきい値を下回りました。(過負荷状態から復旧) | - | |||
CRITICAL - example.exe 104 Process:Critical=90 Over:Warning=70 Over:Recovery=50 Under | example.exeプロセス数が104であり、想定以上にプロセスが稼働しています。(過負荷状態) | 該当プロセスが想定以上に起動しています。利用者数の増加や、プロセス、アプリケーションの不具合等により、正常に終了しないことの原因が推測されます。 | |||
Linuxプロセス監視(自動通報) | |||||
Linuxプロセス監視 | |||||
OK - example.exe 1 Process:Critical=0 Under:Warning=0 Under:Recovery=1 Over | example.exeプロセス数が1であり稼働しています。(停止状態から復旧) | - | |||
CRITICAL - example.exe 0 Process:Critical=0 Under:Warning=0 Under:Recovery=1 Over | example.exeプロセス数が0となり稼働していません。 | 該当プロセスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
OK - example.exe 47 Process:Critical=90 Over:Warning=70 Over:Recovery=50 Under | example.exeプロセス数が47であり、しきい値を下回りました。(過負荷状態から復旧) | - | |||
CRITICAL - example.exe 104 Process:Critical=90 Over:Warning=70 Over:Recovery=50 Under | example.exeプロセス数が104であり、想定以上にプロセスが稼働しています。(過負荷状態) | 該当プロセスが想定以上に起動しています。利用者数の増加や、プロセス、アプリケーションの不具合等により、正常に終了しないことの原因が推測されます。 | |||
Linuxリソース監視(自動通報) | |||||
CPU使用率監視 | |||||
OK - UNIX cpu 0.13% Used:Critical=90.00%:Warning=85.00%:Recovery=80.00% | CPU使用率がRecoveryのしきい値を下回りました。 | - | |||
CRITICAL - UNIX cpu 92.33% Used:Critical=90.00%:Warning=85.00%:Recovery=80.00% | CPU使用率がCriticalのしきい値を超えました。 | 一時的に監視対象サーバが高負荷になった可能性があります。発生頻度が多い場合は、CPUリソースの不足が考えられます。 | |||
WARNING - UNIX cpu 87.66% Used:Critical=90.00%:Warning=85.00%:Recovery=80.00% | CPU使用率がWarningのしきい値を超えました。 | 一時的に監視対象サーバが高負荷になった可能性があります。発生頻度が多い場合は、CPUリソースの不足が考えられます。 | |||
ロードアベレージ監視 | |||||
OK - UNIX LoadAverage 1.33 Used;Critical=8.00;Warning=6.00;Recovery=4.00 | ロードアベレージがRecoveryのしきい値を下回りました。 | - | |||
CRITICAL - UNIX LoadAverage 8.53 Used;Critical=8.00;Warning=6.00;Recovery=4.00 | ロードアベレージがCriticalのしきい値を超えました。 | 一時的に監視対象サーバが高負荷になった可能性があります。ロードアベレージが上がる原因は多岐にわたるため、調査が必要です。 | |||
WARNING - UNIX LoadAverage 7.86 Used;Critical=8.00;Warning=6.00;Recovery=4.00 | ロードアベレージがWarningのしきい値を超えました。 | 一時的に監視対象サーバが高負荷になった可能性があります。ロードアベレージが上がる原因は多岐にわたるため、調査が必要です。 | |||
メモリ使用率監視 | |||||
OK - UNIX Memory 11.87% Used:Critical=95.00%:Warning=90.00%:Recovery=85.00% | メモリ使用率がRecoveryのしきい値を下回りました。 | - | |||
CRITICAL - UNIX Memory 96.33% Used:Critical=95.00%:Warning=90.00%:Recovery=85.00% | メモリの使用率がCriticalのしきい値を超えました。 | 一時的に監視対象サーバが高負荷になった可能性があります。発生頻度が多い場合は、メモリ不足が考えられます。 | |||
WARNING - UNIX Memory 92.66% Used:Critical=95.00%:Warning=90.00%:Recovery=85.00% | メモリの使用率がWarningのしきい値を超えました。 | 一時的に監視対象サーバが高負荷になった可能性があります。発生頻度が多い場合は、メモリ不足が考えられます。 | |||
ディスク使用率監視 | |||||
OK - UNIX DISK /home 0.60% Used;Critical=95.00%;Warning=90.00%;Recovery=85.00% | /homeのディスク使用率がRecoveryのしきい値を下回りました。 | - | |||
CRITICAL - UNIX DISK /home 96.4% Used;Critical=95.00%;Warning=90.00%;Recovery=85.00% | /homeのディスク使用率がRecoveryのしきい値を超えました。 | /homeのディスクの使用量が増加しています。不要なファイルを削除するなどの対応が必要です。 | |||
CRITICAL - UNIX DISK /home 96.4% Used;Critical=95.00%;Warning=90.00%;Recovery=85.00% | /homeのディスク使用率がWarningのしきい値を超えました。 | /homeのディスクの使用量が増加しています。不要なファイルを削除するなどの対応が必要です。 | |||
サーバ監視(自動通報)/サーバ監視SNMP(HP・NEC)(自動通報)/Linuxテキストログ監視(自動通報) | |||||
Windowsイベントログ監視 | |||||
YYYY/MM/DD hh:mm:ss [イベントログ名:通知:ログ監視サービス:] 監視条件に該当するログレコードが10件を超えています。最初の10件のみ通報しました。 | Windowsイベントログ(ApplicationまたはSystem)に1度の監視間隔内で監視条件(エラーまたは警告)に該当するイベントが10件以上となった場合に11件目以上は通報対象としない旨のメッセージです。 | 対象となるイベントログを確認いただき、左記イベント検出時間前後で通報された10件以外の監視条件(エラーまたは警告)に一致するイベントがないか確認、対応が必要です。 | |||
YYYY/MM/DD hh:mm:ss [イベントログ名:通知:ログ監視サービス:] 該当ログファイルに、大量のレコードが出力されました。最初の1000件のみ監視対象となります。 | Windowsイベントログ(ApplicationまたはSystem)に1度の監視間隔内でイベントが1000件以上となった場合に、最初の1000件を監視対象とする旨のメッセージです。 | 対象となるイベントログを確認いただき、左記イベント検出時間前後のイベントで監視条件(エラーまたは警告)に一致するイベントがないか確認、対応が必要です。 仮に、1度の監視間隔内で1001件目が監視条件に一致するイベントであった場合でもイベント内容についてお客様へ通報は行われません。 |
|||
Linuxテキストログ監視 | |||||
[ログファイル名] 監視条件に該当するログレコードが10件を超えています。最初の10件のみ通報しました。 | 指定したログファイル名に1度の監視間隔内で監視条件(指定した一致条件)に該当するログ行が10件以上となった場合に11件目以上は通報対象としない旨のメッセージです。 | 対象となるログファイルを確認いただき、左記イベント検出時間前後で通報された10件以外の監視条件(指定した一致条件)に一致するログがないか確認、対応が必要です。 | |||
[ログファイル名] 該当ログファイルに、大量のレコードが出力されました。最初の1000件のみ監視対象となります。 | 指定したログファイル名に1度の監視間隔内で書き込まれたログが1000行以上となった場合に、最初の1000行を監視対象とする旨のメッセージです。 | 対象となるログファイルを確認いただき、左記イベント検出時間前後のログで監視条件(指定した一致条件)に一致するログがないか確認、対応が必要です。 仮に、1度の監視間隔内で1001行目が監視条件に一致するログであった場合でもログ内容についてお客様へ通報は行われません。 |
|||
サーバ監視SNMP(HP・NEC)(自動通報) | |||||
HPサーバ監視 | |||||
Event Name: (SNMP) NIC Connectivity Lost Trap (18012) URL: https://IPアドレス:2381/ Event originator: 顧客ID(ホスト名)IPアドレス Event Severity: メジャー Event received: dd-mmm-yyyy, hh:mm:ss Event description: This trap will be sent any time the status of a logical adapter changes to the Failed condition. This occurs when the adapter in a single adapter configuration fails, or when the last adapter in a redundant configuration fails. This can be caused by loss of link due to a cable being removed from the adapter or the Hub or Switch. Internal adapter, Hub, or Switch failures can also cause this condition. User Action: Check the cables to the adapter and the Hub or Switch. If no cable problems are found, the adapter, Hub, or Switch may need replacement. |
NIC接続性喪失'トラップは、論理ネットワークアダプタに障害が起こり、接続を喪失したことを示します。
ネットワーク通信ができない状態です。 |
原因
サーバのNIC(Network Interface
Card)の故障か、対象のNICが接続されている先のネットワーク機器かケーブルで、通信障害が発生していると考えられます。 対処 NICの故障の場合には、NICの交換が必要です。ネットワーク機器・ケーブルでの通信障害の場合には、障害個所の復旧作業が必要です。保守会社に対処を依頼してください。 |
|||
Event Name: (SNMP) POST Errors Occurred (6027) URL: https://IPアドレス:2381/ Event originator: 顧客ID(ホスト名)IPアドレス Event Severity: マイナー Event received: dd-mmm-yyyy, hh:mm:ss Event description:One or more POST errors occurred. Power On Self-Test (POST) errors occur during the server restart process. Details of the POST error messages can be found in Integrated Management Log |
対象ホストの再起動中に、1件以上のPOST(パワー オン セルフ テスト)エラーが発生しました。 | 原因
ハード障害の可能性があります。 対処 保守会社に対処を依頼してください。 |
|||
Event Name:Tape Drive Cleaning Required (5008) URL: https://IPアドレス:2381/ Event originator: 顧客ID(ホスト名)IPアドレス Event Severity: クリティカル Event received: dd-mmm-yyyy, hh:mm:ss Event description:Tape Drive Cleaning Tape Needs Replacing. The agent has detected that an autoloader tape unit has a cleaning tape that has been fully used and therefore needs to be replaced with a new cleaning tape. |
テープドライブ クリーニング要求'トラップは、テープドライブにクリーニングテープを挿入して実行する必要があることを示します。これはテープドライブのヘッドの汚れを取り除くためです。 | 原因
テープドライブのヘッドが汚れています。 対処 クリーニングが必要です。 |
|||
Event Name:System is unreachable URL: https://IPアドレス:2381/ Event originator: 顧客ID(ホスト名)IPアドレス Event Severity: クリティカル Event received: dd-mmm-yyyy, hh:mm:ss Event description:The current system is no longer reachable from the central management server. hardware status polling has marked this system as not responding.. |
デバイス
アクセス不能'のアラートは、[中央管理サーバ]が現在そのサーバからネットワーク応答を受けていないことを示しています。 アラート内容 何らかの原因で、監視機器([中央管理サーバ])と対象ホストとの通信ができない状態です。 |
原因
ping応答有 監視エージェントが停止しているか、サーバの負荷が非常に高くなっており監視機器からのリクエストに応答しない状態であると予想されます。
ping応答無 サーバが停止しているか、NICの障害、あるいはネットワーク機器の障害が考えられます。 対処 ping応答有 監視エージェントが停止している場合には、起動させてください。また、サーバの負荷が高い場合には、長時間 高負荷の状態が続くようであれば、サーバの再起動や、必要であれば負荷軽減の対策(サーバの増強計画)が必要だと思われます。 ping応答無 サーバが停止している場合には起動。NICの障害・ネットワーク機器の障害の場合には、不具合の出た機器のパーツ交換が必要です。保守会社に対処を依頼してください。 |
|||
Event Name: (SNMP) Physical Drive Status Change (3046) URL: https://IPアドレス:2381/ Event originator: 顧客ID(ホスト名)IPアドレス Event Severity: クリティカル Event received: dd-mmm-yyyy, hh:mm:ss Event description:Physical Drive Status Change. This trap signifies that the agent has detected a change in the status of a drive array physical drive. The variable cpaDaPhyDrvStatus indicates the current physical drive status. User Action: If the physical drive status is failed(3) or predictiveFailure(4), replace the drive. |
物理ドライブのステータスの変化のトラップは、物理ドライブの状態が変化したことを示しています。 ・アラート内容 障害の場合 HDDで障害が発生しています。保守会社に対処を依頼してください。 回復の場合 HDDの障害が回復しました。 |
原因
障害の場合 HDDで、復旧できないハード障害が発生しました。 回復の場合 障害が発生していたHDDが回復しました。 対処 障害の場合 保守会社に対処を依頼してください。 回復の場合 特に対処は必要ありません。 |
|||
Event Name: (SNMP) Logical Drive Status Change (3034) URL: https://IPアドレス:2381/ Event originator: 顧客ID(ホスト名)IPアドレス Event Severity: クリティカル Event received: dd-mmm-yyyy, hh:mm:ss Event description:Logical Drive Status Change. This trap signifies that the agent has detected a change in the status of a drive array logical drive. The variable cpqDaLogDrvStatus indicates the current logical drive status. Location: Slot 1 Board Status: recovering |
論理ドライブのステータスの変化のトラップは、論理ドライブの状態が変化したことを示しています。 アラート内容 論理ドライブステータスに変化が発生しました。以下の状態が考えられます。 1.物理ドライブに変化が生じた。(HDD障害 または HDD回復) 2. RAID構成に変化が生じた。(物理ドライブの変化が原因) |
原因 左記、1.、2.の原因が考えられます。 対処 HDD障害に起因する場合、HDDの交換が必要です。保守会社に対処を依頼してください。 |
|||
Event Name: fanfailed URL: https://IPアドレス:2381/ Event originator: 顧客ID(ホスト名)IPアドレス Event Severity: メジャー Event received: dd-mmm-yyyy, hh:mm:ss Event description:A fan failed trap indicates one or more of the cooling fans inside the device has failed. A fanOK trap will be sent once the fan has attained normal operation. |
冷却システム
ファン 障害'のトラップは、システム ファンが正常に動作していないことを示します。 アラート内容 サーバ内部の冷却用のファンで障害発生している状況です。 |
原因
サーバ内部のファンが障害のため停止している状態だと思われます。 対処 障害の発生しているファンの交換が必要です。保守会社に対処を依頼してください。 |
|||
NECサーバ監視 | |||||
重要度:異常
概要:物理デバイス故障 タイプ:URAIDUTL マネージャー名:監視マネージャホスト名 コンポーネント:ユーザ機器ホスト名 アドレス:ユーザ機器IPアドレス 発生時刻:yyyy年mm月dd日 hh:mm 受信時刻:yyyy年mm月dd日 hh:mm ソース名:RAIDSRV イベントID:0xc0000130 詳細:発生時刻 : :yyyy年mm月dd日 hh:mm (+09:00)TEST - AlertManager 対処方法:物理デバイスを交換して下さい。 |
ハードディスクで障害が発生しました。 | 原因 対処 保守会社に対処を依頼して下さい。 |
|||
重要度:警告 概要:論理ドライブ縮退 タイプ:URAIDUTL マネージャー名:監視マネージャホスト名 コンポーネント:ユーザ機器ホスト名 アドレス:ユーザ機器IPアドレス 発生時刻:yyyy年mm月dd日 hh:mm 受信時刻:yyyy年mm月dd日 hh:mm ソース名:RAIDSRV イベントID:0x80000192 詳細:発生時刻 :yyyy年mm月dd日 hh:mm (+09:00)TEST - AlertManager 対処方法:ホットスペアを用意していれば自動的にリビルドを実行します。ホットスペアを用意していなければ、故障した物理デバイスを交換してください。高官後、リビルドしてください。 |
ハードディスクで障害が発生しました。 | 原因 対処 保守会社に対処を依頼して下さい。 |
|||
重要度:異常 概要:SNMPサービスアクセス不能 タイプ:Server Recovery マネージャー名:監視マネージャホスト名 コンポーネント:ユーザ機器ホスト名 アドレス:ユーザ機器IPアドレス 発生時刻:yyyy年mm月dd日 hh:mm 受信時刻:yyyy年mm月dd日 hh:mm ソース名:ESMDSVNT イベントID:0xc0000002 詳細:発生時刻 :yyyy年mm月dd日 hh:mm (+09:00) サーバがマネージャよりSNMPで認識できなくなりました。SNMPサービスが停止している、あるいはマネージャとサーバ間の回線が正常に動作していない可能性があります。[Error: タイムアウト(7), Interval: 1, Retry: 0] |
監視サーバとSNMP通信が出来ません。 | 原因
サーバがダウンあるいは非常に高負荷な状態にあるか、マネージャとサーバ間の回線が正常に動作していない可能性があります。 対処 対象ホストの状態や回線の状態を確認してください。 |
|||
重要度:正常 概要:SNMPサービスアクセス回復 タイプ:Server Recovery マネージャー名:監視マネージャホスト名 コンポーネント:ユーザ機器ホスト名 アドレス:ユーザ機器IPアドレス 発生時刻:yyyy年mm月dd日 hh:mm 受信時刻:yyyy年mm月dd日 hh:mm ソース名:ESMDSVNT イベントID:0x40000001 詳細:発生時刻 :yyyy年mm月dd日 hh:mm (+09:00) サーバがマネージャよりSNMPで認識できなくなりました。SNMPサービスが停止している、あるいはマネージャとサーバ間の回線が正常に動作していない可能性があります。[Error: タイムアウト(7), Interval: 1, Retry: 0] |
監視サーバとSNMP通信が出来るようになりました。 | 原因 対処 特に必要ありません。 |
|||
重要度:警告 概要:ネットワークで警告が発生しました。 タイプ:Network マネージャー名:監視マネージャホスト名 コンポーネント:ユーザ機器ホスト名 アドレス:ユーザ機器IPアドレス 発生時刻:yyyy年mm月dd日 hh:mm 受信時刻:yyyy年mm月dd日 hh:mm ソース名:Browser イベントID:0x80001f56 詳細:発生時刻 :yyyy年mm月dd日 hh:mm (+09:00) ブラウザー サービスは、ブラウザー マスター XXXXXr (ネットワーク NNNNN) からドメイン一覧を取得できませんでした。 ブラウザー マスター: XXXXX ネットワーク: NNNNN このイベントはネットワーク接続の一時的な損失により起こった可能性があります。このメッセージが再び表示される場合は、サーバーがネットワークにまだ接続されていることを確認してください。リターン コードはデータ テキスト ボックスにあります |
マスタブラウザが何らかの原因で切り替わってしまった場合で、マスタブラウザの変更内容が各サーバ間で更新されていない場合に、同現象が発生します。 | 原因
マスタブラウザの切り替わりが原因だと考えられます。 対処 設定されているマスタブラウザの登録内容を、新たにマスタブラウザに変更してください。 |
|||
重要度:警告 概要:バッテリ電圧警告 タイプ:URAIDUTL マネージャー名:監視マネージャホスト名 コンポーネント:ユーザ機器ホスト名 アドレス:ユーザ機器IPアドレス 発生時刻:yyyy年mm月dd日 hh:mm 受信時刻:yyyy年mm月dd日 hh:mm ソース名:raidsrv イベントID:0x800001fa 詳細:発生時刻 :yyyy年mm月dd日 hh:mm (+09:00) |
サーバ内部(アレイボード上)のキャッシュバックアップ用バッテリーで、電圧レベルが閾値を上(下)回っています。直ぐに回復しない、或いは、このアラートが頻繁に発生する場合には、調査の上 パーツの交換が必要だと思われます。 | 原因
アレイボードのキャッシュバックアップ用バッテリーで電圧障害が発生しました。 対処 情報採取を実施後、必要であれば障害原因と思われるパーツを交換してください。保守会社に対処を依頼して下さい。 ※新規構築時は充電完了に24時間以上掛かる場合があります。 |
|||
Windowsイベントログ監視(HP) | |||||
警告 yyyy/mm/dd hh:mm:ss Storage Agents 1216 イベント "ドライブアレイ物理ドライブステータス変化。Slot 0 のシリアル番号 ""6XN13D3X0000B246BBHF"" の物理ドライブ Port 2I Box 1 Bay 5 が新しいステータス 4 になりました。 (ドライブステータス値: 1=その他, 2=ok, 3=障害, 4=障害予知, 5=消去中, 6=消去完了, 7=消去準備中, 8=SSD消耗, 9=未認証) [SNMP TRAP: 3046 in CPQIDA.MIB]" |
物理ドライブのステータスが変化しました。 | 原因 ハード障害 対処 ドライブステータス値を参照し対処してください。 Okの場合は対処の必要はありません。 |
|||
Windowsイベントログ監視(NEC) | |||||
エラー yyyy/mm/dd hh:mm:ss Srv 5002 なし TEST - AlertManager : ネットワーク アダプターが正常に機能していません。 |
ネットワークアダプタ未稼働 | 原因 対処 ハード障害/ソフト障害/ソフトの設定間違いなどを切り分けます。ハード障害の場合、保守会社に対処を依頼して下さい。 |
|||
Windowsサービス監視(HP) | |||||
CRITICAL - CqMgHost Service is Stopped | 「HP Systems Insight Manager」の1部のサービス(CqMgHost)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
CRITICAL - CpqNicMgmt Service is Stopped | 「HP Systems Insight Manager」の1部のサービス(CpqNicMgmt)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
CRITICAL - CqMgServ Service is Stopped | 「HP Systems Insight Manager」の1部のサービス(CqMgServ)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
CRITICAL - CqMgStor Service is Stopped | 「HP Systems Insight Manager」の1部のサービス(CqMgStor)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
CRITICAL - SysMgmtHp Service is Stopped | 「HP Systems Insight Manager」の1部のサービス(SysMgmtHp)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
Windowsサービス監視(NEC) | |||||
CRITICAL - AlertManagerMainService Service is Stopped | 「ESMPRO/ServerAgent」の1部のサービス(AlertManagerMainService)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
CRITICAL - ESMStorageService Service is Stopped | 「ESMPRO/ServerAgent」の1部のサービス( ESMStorageService)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
CRITICAL - ESMCommonService Service is Stopped | 「ESMPRO/ServerAgent」の1部のサービス(ESMCommonService)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
Linuxプロセス監視(HP) | |||||
CRITICAL - cmastdeqd 0 Process;Critical=0 Under;Warning=0 Under;Recovery=1 Orver | 「HP Systems Insight Manager」の1部のプロセス(cmastdeqd)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
CRITICAL - cmahealthd 0 Process;Critical=0 Under;Warning=0 Under;Recovery=1 Orver | 「HP Systems Insight Manager」の1部のプロセス(cmahealthd)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
CRITICAL - cmasasd 0 Process;Critical=0 Under;Warning=0 Under;Recovery=1 Orver | 「HP Systems Insight Manager」の1部のプロセス(cmasasd)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
CRITICAL - cmanicd 0 Process;Critical=0 Under;Warning=0 Under;Recovery=1 Orver | 「HP Systems Insight Manager」の1部のプロセス(cmanicd)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
Linuxプロセス監視(NEC) | |||||
CRITICAL - ESMntserver 0 Process;Critical=0 Under;Warning=0 Under;Recovery=1 Orver | 「ESMPRO/ServerAgent」の1部のプロセス(ESMntserver)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
CRITICAL - ESMamvmain 0 Process;Critical=0 Under;Warning=0 Under;Recovery=1 Orver | 「ESMPRO/ServerAgent」の1部のプロセス(ESMamvmain)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||
CRITICAL - ESMcmn 0 Process;Critical=0 Under;Warning=0 Under;Recovery=1 Orver | 「ESMPRO/ServerAgent」の1部のプロセス(ESMcmn)が停止しています。 | 該当サービスの再起動を実施する。停止した原因を調査し対応を行うなどの対策が考えられます。 | |||