レビュー Pagerdutyのレビューと評価

Pagerdutyのレビューと評価

ビデオ: Take the Lead Jenn Tejada & Stacey Cunningham (五月 2024)

ビデオ: Take the Lead Jenn Tejada & Stacey Cunningham (五月 2024)
Anonim

PagerDutyは、ほぼすべての監視サービスで機能するインシデント対応および警告サービスです。 このサービスは、電話、電子メール、テキスト、またはiOSおよびAndroidアプリを介してアラートを配信するように設定でき、配信確認と自動再ルーティングが完了します。 ダッシュボードには、すべての監視ツールのインシデントとアラートステータスが表示されます。 洗練されたスケジューリングとアラートエスカレーションの構成により、チーム全体がループ内に置かれます。 PagerDutyの高度な分析は、ホットスポットとチームパフォーマンスの傾向を識別するのに役立ちます。

私は20年以上にわたってインシデント対応ソリューションに携わってきましたが、PagerDutyは使いやすさとパワーのバランスが優れていると言っても過言ではありません。 私はそれを認めます、私はPagerDutyが大好きです。

設置

サインアップはとても簡単で、単にメールアドレスとパスワードが必要でした。 その後、SMS、電話、電子メールでテストアラートを送信するように求められました。 10秒以内に3つのアラートをすべて受け取りました。 PagerDuty SMSアラートはモバイルアプリをダウンロードするよう促しましたが、電話は「こんにちは、これはPagerDutyテストアラートです。この番号を電話に追加して、常にアラートを受信するようにします」と言いました。 アラートシステムが機能していることを安心させました。

次のステップは、監視ツールを接続することでした。 これは、HP SiteScope、New Relic APM、CopperEgg、またはリストされている50個程度のいずれかを含む、サポートされているプログラムのドロップダウンボックスから好みのツールを選択するだけで実行できます。 サービスを確認するために既にアカウントを設定していたため、CopperEggを選択しました。 また、PagerDutyに電子メールを送信してアラートをトリガーしたり、PagerDutyのREST APIに直接接続したりすることもできました。 CopperEggを追加するためにクリックすると、統合に関する追加情報が記載されたWebページが表示されました。 次に、PagerDuty APIキーを生成し、CopperEggに追加する必要がありました。 その後、10分以内に最初のアラートから応答しなかった場合にセカンダリレスポンダーにメールが送信されるように、インシデントエスカレーションを設定しました。

PagerDutyでの作業

PagerDutyにログインすると、インターフェイスがどれほど簡単であるかに感銘を受けました。 PagerDutyのインターフェイスは、ダッシュボード、インシデント、構成、分析、ヘルプなど、ページ上部のすべてのナビゲーションオプションを提供します。 ダッシュボードはデフォルトで開き、未解決のインシデントと全社の未解決のインシデントのリスト、および過去7日間のすべてのインシデントアクティビティが含まれます。 インシデント画面はダッシュボードによく似ていますが、インシデントを操作するためのオプションが多く含まれています。

PagerDutyにとって重要なのは、スケジュール、サービス、エスカレーションポリシー、ユーザー、およびチームのオプションを含む構成メニュー内にあります。 PagerDutyを使用する最初のステップは、インシデントが発生したときに警告を受けるユーザーを作成することです。 ユーザーは、インシデントをトリガー、確認、解決できる限定的なユーザーから、PagerDutyシステムで何かを管理できるアカウント所有者まで、4つのロールのいずれかに割り当てられます。 各ユーザーには通知ルールが割り当てられます。 それらは、新規または変更されたインシデント、およびオンコール期間が電子メール、電話、またはSMSで始まるときにアラートを受け取ることができます。 大規模な組織では、ユーザーをチームに割り当てて、スケジュール、通知、およびエスカレーションポリシーをより簡単に管理できるようにする可能性が非常に高くなります。 たとえば、組織には、サーバーインシデントについて通知を受けるチームと、セキュリティインシデントについて通知を受ける別のチームを配置できます。

PagerDutyでは、他のインシデント対応システムと同様に、悪魔は細部に宿っています。 全体的なコンセプトは、適切なタイミングで知る必要のある人に通知し、その後バックアップを組み込むことで、何もクラックから抜け落ちないようにすることです。 これを行うには、スケジュールと通知ポリシー、特にエスカレーションポリシーに注意を払う必要があります。 PagerDutyは詳細の構成と管理を簡単にするという素晴らしい仕事をしています。これは主に、強力でありながら理解しやすいGUIによるものです。 オンコールスケジュールの設定には、ユーザーの選択、ローテーションタイプ(毎日、毎週、またはカスタム)の選択、開始時刻と日付の選択が必要です。 通話中のスケジュールを重ねて表示できるため、スケジュールの重複箇所を確認できます。また、スケジュール管理ページにカレンダーが表示され、通話中のスケジュールと重複を明確に示します。 エスカレーションポリシーは、GUIが単純なため、設定と管理も非常に簡単です。

PagerDutyの最初のテストでは、インシデントを手動で開くことを行いました。これは、通知とエスカレーションポリシーの構成方法をテストするための素晴らしい機能です。 5秒以内に、電話、SMS、および電子メールでインシデント通知を受け取りました。 電話は、アラートの原因となったサービスとアラートに関するいくつかの基本情報を読み上げ、「応答するには4を押し、解決するには6を押し、エスカレーションするには8を押してください」などの応答オプションを提供しました。 4を押して承認し、通知ポリシーに従って、30分以内にアラート条件がまだ存在することを再通知しました(通知を停止する唯一の方法は、それらを解決またはエスカレーションすることです)。 メールとSMSで受け取った通知は類似しており、メールアラートにはPagerDutyサイトへのリンクも含まれていたため、詳細を確認できました。 PagerDutyはテスト中に見事に機能し、エスカレーションポリシーに従って、インシデントをタイムリーに通知し、問題を解決済みとしてマークしなかった場合は再通知しました。

PagerDutyのヘルプは優れています。 ポータルのすべてのページには、状況依存ヘルプへのリンクが少なくとも1つ含まれています。 また、詳細な入門セクションがあり、通知の設定方法や応答方法などの基本的なトピックから、オンコールスケジュールの作成やエスカレーションポリシーの作成などのより高度なトピックまですべてをカバーしています。 オンラインヘルプには、PagerDutyと他の監視ツール、開発者リソース、および技術サポートリクエストの送信フォームとの統合に関する詳細情報も含まれています。

PagerDutyのレポートは非​​常に簡単で理解しやすいものです。 レポートはシステム全体に表示することも、サービス、チーム、またはエスカレーションポリシーでフィルタリングすることもできます。 確認の平均時間、解決の平均時間、エスカレーションされたインシデントの数などを示すサマリーメトリックも提供されます。 この情報は運用上非常に役立ちますが、管理者はおそらく計画と分析の目的でより深い情報を必要とします。その場合、PagerDutyからこのデータを取得する必要があります。 エンタープライズプランをサブスクライブすると、レポートをエクスポートできます。 PagerDutyは、レポートをエクスポートする代わりに、APIを介してインシデントをクエリすることをお勧めします。

Pagerdutyのレビューと評価