Telemetry Reporter のメトリクス

以下の表は、Confluent Telemetry Reporter によって収集され、Proactive Support を強化するために Confluent に送信されるメタデータを示しています。

Kafka サーバー

メトリック名 io.confluent.kafka.server/* 提供開始 Confluent バージョン 説明
confluent_audit/audit_log_fallback_rate_per_minute 6.0.0 1 分あたりの監査ログフォールバックの数。
confluent_audit/audit_log_rate_per_minute 6.0.0 1 分あたりに作成された監査ログの数。
confluent_authorizer/authorization_request_rate_per_minute 6.0.0 1 分あたりの認可リクエストの数。
confluent_authorizer/authorization_allowed_rate_per_minute 6.0.0 1 分あたりに許可された認可の数。
confluent_authorizer/authorization_denied_rate_per_minute 6.0.0 1 分あたりに拒否された認可の数。
confluent_auth_store/rbac_role_bindings_count 6.0.0 RBAC ロールバインディングの数。
confluent_auth_store/rbac_access_rules_count 6.0.0 RBAC アクセスルールの数。
confluent_auth_store/acl_access_rules_count 6.0.0 ACL アクセスルールの数。
acl_authorizer/zookeeper_disconnects/total/delta 6.0.0 Kafka Authorizer
acl_authorizer/zookeeper_expires/total/delta 6.0.0  
broker_failure/zookeeper_disconnects/total/delta 6.0.0 ZooKeeper クライアントの切断レート。
broker_failure/zookeeper_expires/total/delta 6.0.0 ZooKeeper クライアントの有効期限切れレート。
broker_topic/bytes_in/total/delta 6.0.0 トピックの入力バイトレート。
broker_topic/bytes_out/total/delta 6.0.0 トピックの出力バイトレート。
broker_topic/failed_produce_requests/total/delta 6.0.0 トピック生成の失敗レート。
broker_topic/failed_fetch_requests/total/delta 6.0.0 トピックのフェッチ失敗レート。
broker_topic/produce_message_conversions/total/delta 6.0.0 1 秒あたりのプロデューサーメッセージ変換の数。変換は、ブローカーとクライアントのメッセージバージョンが一致しない場合に発生します。
broker_topic/fetch_message_conversions/total/delta 6.0.0 1 秒あたりのコンシューマーメッセージ変換の数。変換は、ブローカーとクライアントのメッセージバージョンが一致しない場合に発生します。
controller/active_controller_count 6.0.0 アクティブなコントローラーの数。
controller/leader_election_rate_and_time_ms 6.0.0 リーダー選出のレートおよびレイテンシ。
controller/offline_partitions_count 6.0.0 アクティブなリーダーが存在せず、書き込みも読み取りもできないパーティションの数。この値が 0 より大きければアラートが通知されます。
controller/unclean_leader_elections/total 6.0.0 クリーンでないリーダー選出の合計数。
controller_channel/connection_close_rate 6.0.0 指定されたウィンドウで 1 秒あたりに終了した接続の数。
controller_channel/connection_close_total 6.0.0 指定されたウィンドウで終了した接続の合計数。
controller_channel/connection_count 6.0.0 ブローカーに対して現在オープンしているコネクションの数。
controller_channel/connection_creation_rate 6.0.0 指定されたウィンドウで 1 秒あたりに新しく確立された接続の数。
controller_channel/connection_creation_total 6.0.0 指定されたウィンドウで作成された接続の合計数。
controller_channel/request_size_avg 6.0.0 指定されたウィンドウでブローカーに対して送信されたすべてのリクエストの平均サイズ。
controller_channel/request_size_max 6.0.0 指定されたウィンドウでブローカーに対して送信されたリクエストの最大サイズ。
controller_channel_manager/queue_size 6.0.0  
controller_channel_manager/total_queue_size 6.0.0  
controller_event_manager/event_queue_size 6.0.0  
delayed_operation_purgatory/purgatory_size 6.0.0 プロデューサーの Purgatory で待機しているリクエストの数。そのプロデューサーで acks=all が使用されている場合は、ゼロ以外の値になります。
executor/zookeeper_disconnects/total/delta 6.0.0 ZooKeeper SBC クライアントの切断レート。
executor/zookeeper_expires/total/delta 6.0.0 ZooKeeper SBC クライアントの切断レート。
fetch/queue_size 6.0.0  
group_coordinator/partition_load_time_max 6.0.0  
log_cleaner_manager/achieved_cleaning_ratio/time/delta 6.0.0 圧縮されるトピックのパーティションのダーティ比率(パーセンテージ)。
log_cleaner_manager/achieved_cleaning_ratio/total/delta 6.0.0  
log_cleaner_manager/compacted_partition_bytes 6.0.0 各ログディレクトリで圧縮されたトピック内のデータの量。
log_cleaner_manager/max_dirty_percent 6.0.0 最もダーティなログでクリーニング可能なデータの比率。
log_cleaner_manager/time_since_last_run_ms 6.0.0 ログクリーナーが最後に実行されてからの時間(ミリ秒)。ログクリーナースレッドが実行されると 0 にリセットされます。ログクリーナースレッドがアクティブでなければ、継続的に増加します。
log_cleaner_manager/uncleanable_bytes 6.0.0 各ログディレクトリでクリーンにできないパーティションのクリーンにできないバイト数。
log_cleaner_manager/uncleanable_partitions_count 6.0.0 各ログディレクトリでクリーンにできないとマークされているパーティションの数。
replica_alter_log_dirs_manager/max_lag 6.0.0  
replica_fetcher/request_size_avg 6.0.0 レプリカマネージャーへのリクエストの平均サイズ。
replica_fetcher/request_size_max 6.0.0 レプリカマネージャーへのリクエストの最大サイズ。
replica_fetcher_manager/max_lag 6.0.0 フォロワーレプリカとリーダーレプリカの間のメッセージの最大ラグ。replica.lag.max.messages 構成パラメーターで制御されます。
replica_manager/isr_shrinks 6.0.0 1 秒あたりの ISR 縮小の数。
replica_manager/leader_count 6.0.0 現在のブローカー上のリーダーの数。通常、この値はすべてのブローカーで同一である必要があります。同一でない場合は、クラスター内のすべてのブローカーで auto.leader.rebalance.enabletrue に設定します。
replica_manager/partition_count 6.0.0 クラスター内のすべてのトピックでのパーティションの総数。
replica_manager/under_min_isr_partition_count 6.0.0 同期状態のレプリカ数が minIsr より少ないパーティションの数。これらのパーティションは、acks=all を使用しているプロデューサーでは利用できません。
replica_manager/under_replicated_partitions 6.0.0 レプリケーション数が不足しているパーティションの数。
request/errors/total/delta 6.0.0  
request/local_time_ms/time/delta 6.0.0 指定されたリクエストがリーダーで処理された時間(ミリ秒)。
request/local_time_ms/total/delta 6.0.0  
request/queue_size 6.0.0  
request/remote_time_ms/time/delta 6.0.0 指定されたリクエストがフォロワーを待機していた時間(ミリ秒)。acks=all の場合、生成リクエストに対してゼロ以外の値になります。
request/remote_time_ms/total/delta 6.0.0  
request/request_queue_time_ms/time/delta 6.0.0 指定されたリクエストがリクエストキューで待機する時間(ミリ秒)。
request/request_queue_time_ms/total/delta 6.0.0  
request/requests 6.0.0 1 秒あたりに送信されたリクエスト数の平均値。
request/response_queue_time_ms/time/delta 6.0.0 指定されたリクエストがレスポンスキューで待機する時間(ミリ秒)。
request/response_queue_time_ms/total/delta 6.0.0  
request/response_send_time_ms/time/delta 6.0.0 応答を送信する時間(ミリ秒)。
request/response_send_time_ms/total/delta 6.0.0  
request/total_time_ms/time/delta 6.0.0 指定されたリクエストの処理に要する合計時間(ミリ秒)。
request/total_time_ms/total/delta 6.0.0  
request_channel/request_queue_size 6.0.0 リクエストキューのサイズ。輻輳が発生しているリクエストキューでは、着信リクエストも発信リクエストも処理できません。
request_channel/response_queue_size 6.0.0 レスポンスキューのサイズ。レスポンスキューは無制限です。レスポンスキューで輻輳が発生している場合は、ブローカーでレスポンスタイムの増大やメモリー圧迫につながることがあります。
request_handler_pool/request_handler_avg_idle_percent 6.0.0 リクエストハンドラースレッドがアイドル状態であった時間の割合の平均値。この値は、0 (すべてのリソースが使用されていた)と 1 (すべてのリソースが使用可能であった)の間の数値です。
session_expire_listener/zookeeper_disconnects/total/delta 6.0.0 1 秒あたりの切断の数。
session_expire_listener/zookeeper_expires/total/delta 6.0.0 1 秒あたりにセッションが有効期限切れになった回数。
socket_server/connections 6.0.0 ブローカーに対して現在オープンしているコネクションの数。
socket_server/successful_authentication_total/delta 6.0.0  
socket_server/failed_authentication_total/delta 6.0.0  
socket_server/network_processor_avg_idle_percent 6.0.0 ネットワークプロセッサースレッドがアイドル状態であった時間の割合の平均値。この値は、0 (すべてのリソースが使用されていた)と 1 (すべてのリソースが使用可能であった)の間の数値です。
socket_server/request_size_avg 6.0.0 ブローカーへのリクエストの平均サイズ。
socket_server/request_size_max 6.0.0 ブローカーへのリクエストの最大サイズ。

メタデータタグ

受信した各メトリックレコードには、追加のメタデータタグがアタッチされます。これにより、メトリックを保存し、適切なリソースに関連付けることができます。

タグの名前 説明
kafka.cluster.id 一意の Kafka クラスター ID
kafka.version ブローカーの Kafka バージョン
kafka.broker.id Kafka クラスター内の一意のブローカー識別子
java.version ブローカーの Java バージョン
host.hostname ブローカーのホスト名
topic トピック名です。トピックレベルのメトリクスを収集するときに設定されます。

ksqlDB サーバー

メトリック名 io.confluent.ksql/* 提供開始 Confluent バージョン 説明
ksql_engine_query/liveness_indicator 6.0.0 ksqlDB サーバーが稼働し、メトリクスを出力しているかどうかを示します。この値は常に 1 になります。
ksql_engine_query/num_active_queries 6.0.0 現在の ksqlDB エンジンで実行されているアクティブなクエリの数。
ksql_engine_query/num_idle_queries 6.0.0 非アクティブなクエリの数。
ksql_engine_query/num_persistent_queries 6.0.0 現在の ksqlDB エンジンで実行されている永続的なクエリの数。
ksql_engine_query/created_queries 6.0.0 ステートが CREATED のクエリの数。
ksql_engine_query/error_queries 6.0.0 ステートが ERROR のクエリの数。
ksql_engine_query/not_running_queries 6.0.0 ステートが NOT_RUNNING のクエリの数。
ksql_engine_query/pending_shutdown_queries 6.0.0 ステートが PENDING_SHUTDOWN のクエリの数。
ksql_engine_query/rebalancing_queries 6.0.0 ステートが REBALANCING のクエリの数。
ksql_engine_query/running_queries 6.0.0 ステートが RUNNING のクエリの数。
ksql_engine_query/bytes_consumed_total 6.0.0 すべてのクエリで消費されたバイト数の合計。
ksql_engine_query/messages_consumed 6.0.0 すべてのクエリで消費されたメッセージ数の合計。
ksql_engine_query/messages_produced 6.0.0 生成されたメッセージの合計数。