トリガーの表示と管理

Alerts の Triggers タブをクリックすると、構成されているすべてのトリガーのサマリーが表示されます。

データが入力された Control Center の Triggers ページ

最初は、トリガーがまだ定義されていないため、Triggers ページは空白になっています。

Triggers ページを使用して以下を行います。

  • + New trigger ボタンでトリガーを作成します。
  • トリガーおよび割り当てられているアクションのサマリーを表示およびソートします。
  • トリガーを検索します。
  • 既存のトリガーを 編集 または 削除 します。

新規トリガーまたはトリガーの編集フォーム

New Trigger フォームを使用して、関連付けられたアラートアクションをアクティブにする基準を定義します。フィールドのいくつかは、コンテキストメニューの Set up an alert をクリックした時点で事前入力されます。

以下のトリガーコンポーネントタイプを作成できます。

ブローカートリガー

このブローカートリガーのフィールドリファレンスは、ブローカートリガーを追加するときのガイドとして使用してください。

Control Center のブローカーアラートトリガーのフォーム

ブローカートリガーフォーム

Trigger name

トリガーの識別に使用される一意の名前です(例: ブローカーのフェッチリクエストの遅延)。

注釈

一意の名前にする必要はありませんが、混同を避けるために一意で分かりやすい名前を使用することをベストプラクティスとしてお勧めします。

Component type
ブローカーコンポーネントのタイプを選択します。
Cluster id

個々のブローカーの条件に基づいてトリガーするクラスターを選択します。

警告

1 つのブローカーまたはクラスターのトリガーに対して複数のクラスターを選択する場合について、既知の問題が 1 点あります。トリガーに対して単一のクラスターのみを選択することをベストプラクティスとしてお勧めします。詳細については、リリースノートの既知の問題のセクションを参照してください。

Metric

Metric に指定した値は、ブローカーごとにトリガーされます。

重要

定義されている条件を満たすすべてのブローカーが個別にトリガーされます。

Bytes in
1 つのブローカーに対して 1 秒あたりに生成されたバイト数です。
Bytes out
1 つのブローカーから 1 秒あたりにフェッチされたバイト数です(内部レプリケーショントラフィックは対象外)。

注釈

Kafka 0.11.0.0 より前の BytesOutPerSec では、コンシューマーおよび内部レプリケーションからのトラフィックが対象になっていました。この仕様が変更されて、このブローカーに対するコンシューマートラフィックのみを対象とするようになりました。アラートを適宜調整してください。

Fetch request latency
このブローカーに対するフェッチリクエストの平均、95、99、99.9 パーセンタイルでのレイテンシです(単位: ミリ秒)。
Production request count
1 つのブローカーに対する生成リクエストの合計数です(1 分あたりのリクエスト数)。
Production request latency
このブローカーに対する生成リクエストの平均、95、99、99.9 パーセンタイルでのレイテンシです(単位: ミリ秒)。
Condition
トリガーは、モニタリング対象のメトリックの値と Value フィールドの値を比較して Condition が真の場合に起動されます。選択した Metric に応じて、Greater thanLess thanEqual toNot equal toOnlineOffline の各オプションを使用できます。
Value
ブローカーのメトリックと比較する値です。

クラスタートリガー

このクラスタートリガーのフィールドリファレンスは、クラスタートリガーを追加するときのガイドとして使用してください。

Control Center のクラスターアラートトリガーのフォーム

クラスタートリガー フォーム

Trigger name

トリガーを識別する一意の名前です(例: Control Center Cluster down)。

注釈

一意の名前にする必要はありませんが、混同を避けるために一意で分かりやすい名前を使用することをベストプラクティスとしてお勧めします。

Component type
Cluster コンポーネントタイプを選択します。
Cluster id

定義した条件に基づいてトリガーするクラスターを選択します。

警告

1 つのブローカーまたはクラスターのトリガーに対して複数のクラスターを選択する場合について、既知の問題が 1 点あります。トリガーに対して単一のクラスターのみを選択することをベストプラクティスとしてお勧めします。詳細については、リリースノートの既知の問題のセクションを参照してください。

Metric

Metric に指定した値は、クラスター全体に基づいてトリガーされます。定義されている条件を満たすクラスターがあると、関連付けられたアクションがトリガーされます。

Cluster down
トリガーは Condition が Yes である場合に作成する必要があります。「Control Center クラスターダウンステータス」を参照してください。
Leader election rate
パーティションリーダー選出の数です。
オフラインのトピックパーティション

クラスター内のオフラインであるトピックパーティションの合計数です。これはレプリカを持つブローカーが停止しているか、クリーンでないリーダーの選出が無効であるときにレプリカが同期しておらず、したがってリーダーに選出されるブローカーがない(メッセージが失われないためにはこれが望ましい)場合に発生します。

トリガーは値が > 0 (ゼロより大きい)場合に作成する必要があります。

Unclean election count

前回のインターバルでレポートされた、クラスター内のクリーンでないパーティションリーダー選出の数です。

非同期レプリカ間でクリーンでないリーダー選出が維持され、前のリーダーが失われる前に同期されていなかったメッセージがある場合、データ損失の恐れがあります。したがって、クリーンでない選出の数が 0 より大きい場合は、ブローカーログを調べてリーダーが再選出された理由を判別し、WARN または ERROR メッセージを探してください。ブローカー構成パラメーター unclean.leader.election.enablefalse に設定して、一連の同期レプリカから外れているレプリカが決してリーダーに選出されないようにすることを検討してください。

トリガーは値が != 0 (ゼロでない)場合に作成する必要があります。

Under replicated topic partitions

レプリケーション数が不足している(つまり同期レプリカ数がレプリケーション係数未満のパーティションである)、クラスター内のトピックのパーティションの合計数です。

トリガーは値が > 0 (ゼロより大きい)場合に作成する必要があります。

ZooKeeper status
ブローカーが ZooKeeper に接続できるかどうかを示します。指定可能な値は Offline または Online です。
ZooKeeper expiration rate
ブローカーで ZooKeeper セッションの有効期限切れが発生しているレートです(1 秒あたりの有効期限切れ回数)。
Condition
トリガーは、モニタリング対象のメトリックの値と Value フィールドの値を比較して Condition が真の場合に起動されます。選択した Metric に応じて、Greater thanLess thanEqual toNot equal toOnlineOffline の各オプションを使用できます。
Value
クラスターのメトリックと比較する値です。

コンシューマーグループトリガー

このコンシューマーグループトリガーのフィールドリファレンスは、コンシューマーグループトリガーを追加するときのガイドとして使用してください。平均および最大のレイテンシをモニタリングするには、そのコンシューマーグループ内にあるクライアントアプリで Monitoring Interceptor を構成する必要があります。詳細については、「Confluent Monitoring Interceptor」を参照してください。

注釈

Confluent Control Center でのコンシューマーグループアラートは、コンシューマーグループ内で消費された すべて のトピックの すべて のパーティションを対象とする累積ラグの合計に基づきます。

Control Center のコンシューマーグループアラートトリガーのフォーム

コンシューマーグループフォーム

Trigger name

トリガーの識別に使用される一意の名前です(例: 消費用 "コンシューマーグループ名")。

注釈

一意の名前にする必要はありませんが、混同を避けるために一意で分かりやすい名前を使用することをベストプラクティスとしてお勧めします。

Component type
Consumer lag ページで Set up an alert ボタンをクリックした場合は、Consumer group(デフォルトのタイプ)が事前選択されているはずです。選択されていない場合は、Consumer group を選択します。
Consumer group name
異常をモニタリングするコンシューマーグループの名前です。
Metric

以下に示す、モニタリング対象のメトリックです。

Average latency (ms)
コンシューマーグループのミリ秒単位での平均レイテンシです。このメトリックをモニタリングするには、コンシューマーグループ内のクライアント用に Confluent Monitoring Interceptor を構成する必要があります。
Consumer lag
プロデューサーアプリケーションから消費しているときの、コンシューマーアプリケーションの遅延の程度です。コンシューマーラグは、エンドオフセットとカレントオフセットの差異です。Consumer lead とは反対のものが追跡されます。
Consumer lead
プロデューサーアプリケーションから消費しているときの、コンシューマーアプリケーションの先行の程度です。コンシューマーリードは、カレントオフセットと開始オフセットの差異です。たとえば、パーティションのオフセット 15 にあるコンシューマーがオフセット 0 から開始される場合、リードは 15 です。このアラートメトリックは、メッセージが提供されたとたんに消費される状況に近づいていることを示しており、データが失われる 可能性 を意味します。Consumer lag とは反対のものが追跡されます。
Consumption difference
特定の時間位置での想定される消費量と実際の消費量の差異です。通常は、リアルタイムに近い時間位置では、想定と実際の消費の量に隔たりがあります。この隔たりは次第に小さくなるはずです。
Maximum latency (ms)
コンシューマーグループのミリ秒単位での最大レイテンシです。このメトリックをモニタリングするには、コンシューマーグループ内のクライアント用に Confluent Monitoring Interceptor を構成する必要があります。
Buffer(非推奨)
時間ウィンドウがトリガー起動の対象と見なされるまでに待機する、リアルタイムからの遅延です。詳細については、「コンシューマーグループトリガーのためのバッファ(非推奨)」を参照してください。
Condition
トリガーは、モニタリング対象のメトリックの値と Value フィールドの値を比較して Condition が真の場合に起動されます。使用可能なオプションは、Greater thanLess thanEqual toNot equal to です。
Value
モニタリング対象のコンシューマーグループのメトリックと比較する値です。

トピックトリガー

このトピックトリガーのフィールドリファレンスは、トピックトリガーを追加するときのガイドとして使用してください。

Control Center のトピックアラートトリガーのフォーム

トピックトリガーフォーム

Trigger name

トリガーの識別に使用される一意の名前です(例: "トピック名" 本稼働用リクエスト)。

注釈

一意の名前にする必要はありませんが、混同を避けるために一意で分かりやすい名前を使用することをベストプラクティスとしてお勧めします。

Component type
従来の System Health の Topics タブまたは別のページのコンテキストメニューで Set up an alert をクリックした場合は、Topic が事前選択されているはずです。選択されていない場合は、Topic を選択する必要があります。
Cluster id
トピックのトリガーは特定のクラスター ID 向けに制限されます。複数のクラスターによってトピックがトリガーされる必要がある場合は、クラスターごとに別のトリガーを作成してください。
Condition

値フィールド(下にあるフィールド)と照合するオプションの選択リストです。特定の値に対する EqualsBegins withEnds withContains の条件でトピックの名前を絞り込むことができます。

注釈

たとえば、Contains を選択して値フィールドに「topic」を入力した場合は、my topic、topical、および topics with data と一致します。Begins with を選択した場合、トリガーは topical および topics with data と一致し、my topic とは一致しません。

Topic name

トリガーされるトピックの名前または名前の一部です。Condition との組み合わせで機能し、1 つ以上のトピックとの照合を行います。

注釈

トピック名と一致するトピックが複数ある場合、トリガーは集約ではなく トピックごと になります。mytopic で始まる(Begin with)トピックが 2 つあり、トリガーの MetricBytes inConditionGreater thanValue100 に設定されている場合、mytopic と一致するすべてのトピックのうち Bytes In が 100 より大きいトピックについてトリガーが起動されることになります。

警告

基準と一致するトピックが 6 個以上ある場合はメッセージが表示されます。このメッセージが表示される場合は基準を狭めてください。

Metric

アラートをトリガーする際にチェックする値です。指定可能な値は以下のとおりです。

Bytes in
1 つのトピックで受信する 1 秒あたりのバイト数です。
Bytes out
1 つのトピックから発信される 1 秒あたりのバイト数です(内部レプリケーショントラフィックは対象外)。

注釈

Apache Kafka® 0.11.0.0 より前の BytesOutPerSec では、コンシューマーおよび内部レプリケーションからのトラフィックが対象になっていました。この仕様が変更されて、このトピックに対するコンシューマートラフィックのみを対象とするようになりました。アラートを適宜調整してください。

Out of sync replica count
リーダーと同期しているクラスター内のトピックのパーティションレプリカの合計数、つまり各(トピックのパーティション * トピックのレプリケーション係数)の合計です。
Production request count
1 つのクラスター内にある 1 つのトピックに対する 1 秒あたりのプロダクションリクエストの数です。
Under-replicated topic partitions
レプリケーション数が不足しているトピックのパーティションの数です。このメトリックのユースケースとして、特定のトピックのパーティションを保持しているときに Kafka ブローカーがクラッシュしたかどうかを把握することが例として挙げられます。
Condition
トリガーは、モニタリング対象のメトリックの値と Value フィールドの値を比較して Condition が真の場合に起動されます。使用可能なオプションは、Greater thanLess thanEqual toNot equal to です。
Value
トピックのメトリックと比較する値です。

ちなみに

手順を追ったトリガーの例については、「トリガーの例」を参照してください。

アラートトリガーの編集

  1. トップバナーにあるアラートベルのアイコンをクリックします。Alerts ページが開き、デフォルトで History タブが表示されます。
  2. Triggers タブをクリックします。
  3. トリガーの名前をクリックします。
  4. Edit をクリックします。
  5. トリガーのフィールドに必要な変更を加えます。
  6. Save をクリックします。

アラートトリガーの削除

  1. トップバナーにあるアラートベルのアイコンをクリックします。Alerts ページが開き、デフォルトで History タブが表示されます。
  2. Triggers タブをクリックします。
  3. トリガーの名前をクリックします。
  4. Delete をクリックします。
  5. OK をクリックして、トリガーを削除することを確認します。