サービス仕様 ‐> 各種オプション 監視オプション 2

2016.06.10

Monitoring_Agent_downのアラーム連絡を受けた場合の対処法を教えてください

【質問】


クラウド運用担当者から、監視オプションを契約している仮想サーバにて「Monitoring_Agent_downのアラームが発生した」との連絡を受けました。
詳細を教えてください。

 

【回答】


・Monitoring_Agent_downとは
監視サービスご提供のためにお客様仮想サーバにて動作しているZabbix エージェントが、
弊社監視サーバからの死活確認に対し、15分以上応答して来なかった場合に警報として通知されるものです。
Zabbix エージェントはプロセスとして動作しているため、仮想サーバが一時的に高負荷になっている場合、
または仮想サーバがハングアップしている場合に検知することがございます。

基本監視サービスをお申し込み頂いた場合、弊社監視サーバからのICMP Pingの定期ポーリングと、
Zabbix エージェントの死活確認を複合してお客様仮想サーバの死活判定を行なっております。
それぞれにメリットがございます。

・ICMPポーリング(Ping)
サーバダウン時にエージェントレス(プロセスが動作していなくても)でダウンを検知した可能。
ただしネットワーク到達性しか確認できないため、OSのフリーズやハングアップを判定できない場合がございます。

・Zabbix エージェント死活確認
サーバダウンには至っておらずネットワーク到達性はある(ICMPポーリングには応答を返している)が、
サーバがフリーズ、ハングアップ等、実質サーバがご利用頂けない状態に陥っていることを
検知することが可能です。

 
・発生時の影響
[仮想サーバとしての状況]
・仮想サーバ高負荷(CPUロードアベレージの逼迫・メモリ及びキャッシュの枯渇・システムディスクの枯渇・
セッションの枯渇・フリーズ・ハングアップ)の発生が疑われます。
・何らかの原因でお客様仮想サーバ内のZabbix エージェントが停止してしまった可能性がございます。
・Zabbix エージェントが疎通を行なうモニタリングセグメント(198~のアドレスが付与されているNIC)への
ルート情報が不正で、仮想サーバから監視サーバへ向けた通信が全く疎通できない、
もしくは疎通が不安定になっている場合が考えられます。
・監視サービスとしての状況
Monitoring_Agent_downが発生している最中は、ICMPポーリング以外の全ての監視がご提供できていません。
ただしログ監視のオプションをご利用の場合は、Monitoring_Agent_downが回復した後、リトライ処理が行われるため、
ダウン中のALMなどは遡って検知します。
CPU、メモリなどのリソース系の監視オプションをご利用の場合は、エージェント復旧時に閾値を超えていた際は
検知可能です。

・発生時の対処法
※別途、構築オプションのご契約によりサーバ構築及び運用をKDDIへ委託しており、Admin Consoleや仮想マシン内への
ログイン方法が不明であるお客様の場合は、クラウドプラットフォームサービスをお申し込みされた担当営業・SEへ
ご連絡ください。担当営業・SEの連絡先が不明である場合は、クラウド運用担当窓口までご一報ください。

[仮想サーバにログインが可能である場合]
・ZABBIXエージェントサービス(Windows系OS)、zabbix_agentd(Linux系OS)が起動している事を確認してください。
これらが停止している場合は起動してください。
・モニタリングセグメントのNICが動作している事を確認してください。
・モニタリングセグメント向けのルート情報が正しい事を確認してください。
・上記までに問題がない場合は、仮想サーバのリソースに問題がないか確認し、問題がある場合は解決してください。
・仮想サーバのリソースに問題がない場合、ZABBIXエージェントサービス、zabbix_agentdの再起動をお試しください。

[仮想サーバにログインが不可である場合]
・Admin Consoleのコンソール接続より画面表示を確認してください。画面が表示されない、マウスやキーボードの操作を
受け付けない等の場合、OSのフリーズ・ハングアップが発生していると想定されます。お客様にて状況をご確認の上、
Admin Consoleから仮想サーバの停止・起動の実施をご検討ください。

上記の対処を行なった後、KDDIクラウド運用担当窓口まで、Monitoring_Agent_downの復旧状況をお問合せください。

●留意事項
本文書内のお客様仮想サーバの停止・起動の実施を促す記述がございますが、
この操作により発生したOSやデータの破損について当社はいかなる責任を負う事もできません。
必ずお客様にてサーバ状況をご確認のうえ、実施可否をご検討くださいますようお願いいたします。
また万が一に備え、日ごろよりお客様にて仮想サーバのバックアップを取得する事を、
併せてご検討くださいますようお願いいたします。

●参考記事
構築・運用オプション

 

このページは役に立ちましたか? 役に立った 役に立たなかった 1人中1人がこのページは役に立ったと言っています。
2014.03.10

仮想サーバの監視オプションを申込みされた場合に、利用する監視エージェント(Zabbix)が起動しない

【質問】


仮想サーバの監視オプションを申込みされた場合に、利用する監視エージェント(Zabbix)が起動しない。

【回答】


お客様が固定IPを設定された場合、hostsファイルにコンピュータ名(ホスト名)とIPアドレスの設定が必要です。
設定いただけない場合、もしくはコンピュータ名(ホスト名)とhostsファイルの設定内容が異なる場合は、Zabbixによる監視を実施することが出来ません。

このページは役に立ちましたか? 役に立った 役に立たなかった 1人中1人がこのページは役に立ったと言っています。
2017/06/20 2017/06/20