リクエストレートの制限¶

Confluent Cloud では、1 秒間に許容されるクライアントリクエストの最大数に制限があります。クライアントリクエストには、プロデューサーからのバッチ送信のリクエスト、コンシューマーからのオフセットのコミットのリクエスト、コンシューマーからのメッセージのフェッチのリクエストが含まれますが、これらに限られません。リクエストレートの制限に達すると、リクエストが拒否され、クラスターを安定した状態に維持するために、クライアントがスロットルされる場合があります。クライアントがスロットルされると、Confluent Cloud によって、プロデューサーの場合は produce-throttle-time-avg （ミリ秒）、コンシューマーの場合は fetch-throttle-time-avg （ミリ秒）の間、クライアントのリクエストが先延ばしになります。

Confluent Cloud にはさまざまなクラスタータイプが用意されており、それぞれに固有の使用量の制限があります。このデモでは、ベーシッククラスターまたはスタンダードクラスターを実行していることを前提としています。どちらもリクエストの制限は 1 秒あたり 1,500 件です。

Grafana を開き、ユーザー名 admin とパスワード password を使用してログインします。
Confluent Cloud ダッシュボードに移動します。
Requests (rate) パネルを確認します。このパネルが黄色の場合、許容されるリクエスト数の 80% を使用しており、赤の場合は 90% を使用しています。しきい値の構成の詳細については、Grafana のドキュメントを参照してください。
ダッシュボードを下にスクロールして、Request rate の積み上げ棒グラフで、リクエストの送信先の内訳を確認します。
プロデューサーのバッチ処理構成（linger.ms）とコンシューマーのバッチ処理構成（fetch.max.wait.ms）を調整し、不要なクライアントをシャットダウンして、リクエストを減らします。