Confluent Platform を使用した Apache Kafka のクイックスタート（ローカル）¶

このクイックスタートに従うと、 Confluent Platform とその主要コンポーネントを開発環境で実行することができます。このクイックスタートでは、Confluent Platform に含まれている Confluent Control Center を使用したトピック管理と ksqlDB を利用したイベントストリーム処理を行います。

このクイックスタートでは、Apache Kafka® トピックを作成し、Kafka Connect を使ってそれらのトピックに対する模擬データを生成して、それらのトピックに対する ksqlDB ストリーミングクエリを作成します。Control Center に移動して、ストリーミングクエリをモニタリングし、分析します。

参考

このクイックスタートの自動化バージョンを実行することもできます。これは、Confluent Platform のローカルインストール向けです。

前提条件:

インターネットに接続されている。
オペレーティングシステムが現在 Confluent Platform でサポートされている。
サポートされている Java バージョンをダウンロードしてインストール済みである。

このバージョンの Confluent Platform では Java 8 および Java 11 がサポートされています（Java 9 と 10 はサポート対象外）。詳細については、サポートされている Java バージョンを参照してください。

ステップ 1: Confluent Platform のダウンロードおよび起動¶

ダウンロードページに移動します。
Confluent Platform を選択し、DOWNLOAD FREE をクリックします。

ちなみに

以前のバージョンをダウンロードすることもできます。
以下を入力します。
- Email: メールアドレス
- Deployment Type: Manual Deployment
- Type: zip
DOWNLOAD FREE をクリックします。
ファイルを解凍します。bin や etc などのディレクトリが展開されます。
Confluent Platform ディレクトリの環境変数を設定します。
```
export CONFLUENT_HOME=<path-to-confluent>
```
Copy
Confluent Platform の bin ディレクトリを PATH に追加します。
```
export PATH=$PATH:$CONFLUENT_HOME/bin
```
Copy
Confluent Hub クライアントを使用して、Kafka Connect Datagen Source Connector をインストールします。このコネクターはデモ用の模擬データを生成しますが、これは本稼働環境には適していません。Confluent Hub は、パッケージ済みのオンラインライブラリであり、Confluent Platform および Kafka 用にそのままインストールできる拡張機能またはアドオンです。
```
confluent-hub install \
   --no-prompt confluentinc/kafka-connect-datagen:latest
```
Copy
Confluent CLI confluent local services start コマンドを使用して、Confluent Platform を起動します。このコマンドにより、すべての Confluent Platform コンポーネント（Kafka、ZooKeeper、Schema Registry、HTTP REST Proxy for Kafka、Kafka Connect、ksqlDB、Control Center を含む）が起動します。

重要

confluent local コマンドは、単一ノードの開発環境向けであり、本稼働環境には適していません。生成されるデータは一過性で、一時的なものです。本稼働環境対応のワークフローについては、「Confluent Platform のインストールおよびアップグレード」を参照してください。
```
confluent local services start
```
Copy
出力は以下のようになります。
```
Starting Zookeeper
Zookeeper is [UP]
Starting Kafka
Kafka is [UP]
Starting Schema Registry
Schema Registry is [UP]
Starting Kafka REST
Kafka REST is [UP]
Starting Connect
Connect is [UP]
Starting KSQL Server
KSQL Server is [UP]
Starting Control Center
Control Center is [UP]
```
Copy

ステップ 2: Kafka トピックの作成¶

このステップでは、Confluent Control Center を活用して Kafka トピックを作成します。Confluent Control Center は、本稼働環境データパイプラインおよびイベントストリーミングアプリケーションを構築およびモニタリングするための機能を備えています。

http://localhost:9021 にある Control Center ウェブインターフェイスに移動します。

異なるホストに Confluent Platform をインストールした場合は、localhost をアドレスのホスト名と置き換えます。

Control Center がオンラインになるまでに 1 ～ 2 分かかる場合があります。

注釈

Control Center が localhost ブラウザーセッションで開いておらず、実行中ではない場合、Control Center は ksqlDB に接続されません。
controlcenter.cluster タイルをクリックします。
ナビゲーションバーで Topics をクリックしてトピックリストを開いた後、Add a topic をクリックします。
Topic name フィールドで pageviews を指定し、Create with defaults をクリックします。

トピック名では、大文字と小文字が区別されます。
ナビゲーションバーで Topics をクリックしてトピックリストを開いた後、Add a topic をクリックします。
Topic name フィールドで users を指定し、Create with defaults をクリックします。

ステップ 3: Kafka コネクターのインストールおよびサンプルデータの生成¶

このステップでは、Kafka Connect を使用して、Kafka トピック pageviews および users のサンプルデータを作成する、kafka-connect-datagen という名前のデモソースコネクターを実行します。

ちなみに

Kafka Connect Datagen コネクターは「ステップ 1: Confluent Platform のダウンロードおよび起動」で手動でインストールしました。Datagen コネクターの場所を特定する際に問題が発生した場合は、「トラブルシューティング」セクションの「問題: Datagen コネクターの場所を特定できない」を参照してください。

Kafka Connect Datagen コネクターの最初のインスタンスを実行して、 pageviews トピックに対して Kafka データを AVRO フォーマットで生成します。
1. ナビゲーションバーで Connect をクリックします。
2. Connect Clusters リストで connect-default クラスターをクリックします。
3. Add connector をクリックします。
4. DatagenConnector タイルを選択します。
  
  ちなみに
  
  表示されるコネクターを絞り込むには、Filter by category をクリックし、Sources をクリックします。
5. 名前フィールドで、コネクターの名前として datagen-pageviews を入力します。
6. 次の構成値を入力します。
  - Key converter class: org.apache.kafka.connect.storage.StringConverter。
  - kafka.topic: pageviews。
  - max.interval: 100。
  - quickstart: pageviews。
7. Continue をクリックします。
8. コネクター構成を確認し、Launch をクリックします。
Kafka Connect Datagen コネクターの 2 番目のインスタンスを実行して、users トピックに対して Kafka データを AVRO フォーマットで生成します。
1. ナビゲーションバーで Connect をクリックします。
2. Connect Clusters リストで connect-default クラスターをクリックします。
3. Add connector をクリックします。
4. DatagenConnector タイルを選択します。
  
  ちなみに
  
  表示されるコネクターを絞り込むには、Filter by category をクリックし、Sources をクリックします。
5. 名前フィールドで、コネクターの名前として datagen-users を入力します。
6. 次の構成値を入力します。
  - Key converter class: org.apache.kafka.connect.storage.StringConverter
  - kafka.topic: users
  - max.interval: 1000
  - quickstart: users
7. Continue をクリックします。
8. コネクター構成を確認し、Launch をクリックします。

ステップ 4: ksqlDB を使用したストリームおよびテーブルの作成および書き込み¶

ちなみに

<path-to-confluent>/bin/ksql http://localhost:8088 コマンドにより、ターミナルから ksqlDB CLI を使用して、これらのコマンドを実行することもできます。

ストリームおよびテーブルの作成¶

このステップでは、ksqlDB を使用して、pageviews トピックのストリームおよび users トピックのテーブルを作成します。

ナビゲーションバーで ksqlDB をクリックします。
ksqlDB アプリケーションを選択します。
以下のコードをエディターのウィンドウにコピーします。Run query をクリックして PAGEVIEWS ストリームを作成します。ストリーム名では、大文字と小文字が区別されません。
```
CREATE STREAM PAGEVIEWS
   (VIEWTIME BIGINT, USERID VARCHAR, PAGEID varchar)
   WITH (KAFKA_TOPIC='pageviews', VALUE_FORMAT='AVRO');
```
Copy
以下のコードをエディターのウィンドウにコピーします。Run query をクリックして USERS テーブルを作成します。テーブル名では、大文字と小文字が区別されません。
```
CREATE TABLE USERS
   (USERID VARCHAR PRIMARY KEY, REGISTERTIME BIGINT, GENDER VARCHAR, REGIONID VARCHAR)
   WITH (KAFKA_TOPIC='users', VALUE_FORMAT='AVRO');
```
Copy

クエリの記述¶

このステップでは、上記で作成したストリームおよびテーブルに対する ksqlDB クエリを作成します。

Editor タブで Add query properties をクリックして、カスタムクエリプロパティを追加します。
auto.offset.reset パラメーターを Earliest に設定します。

この設定により ksqlDB クエリは、使用可能なすべてのトピックデータを先頭から読み取ります。この構成は、以降の各クエリに対して使用されます。詳細については、「ksqlDB 構成パラメーターリファレンス」を参照してください。
以下のクエリを作成します。
1. Stop をクリックして、現時点で実行中のクエリを停止します。
2. 最大 3 行までに制限された結果とともにストリームからデータを返す、非永続的なクエリを作成します。
  
  エディターで以下のクエリを入力します。
```
SELECT PAGEID FROM PAGEVIEWS EMIT CHANGES LIMIT 3;
```
  Copy
3. Run query をクリックします。出力は以下のようになります。
  
  Card view アイコンまたは Table view アイコンをクリックして、出力レイアウトを変更します。
4. 女性（female）ユーザーの PAGEVIEWS ストリームをフィルター処理する永続的なクエリを（ストリームとして）作成します。クエリの結果は Kafka の PAGEVIEWS_FEMALE トピックに書き込まれます。
  
  エディターで以下のクエリを入力します。
```
CREATE STREAM PAGEVIEWS_FEMALE
   AS SELECT USERS.USERID AS USERID, PAGEID, REGIONID
   FROM PAGEVIEWS LEFT JOIN USERS ON PAGEVIEWS.USERID = USERS.USERID
   WHERE GENDER = 'FEMALE'
   EMIT CHANGES;
```
  Copy
5. Run query をクリックします。出力は以下のようになります。
6. REGIONID が 8 または 9 で終わる永続的なクエリを作成します。このクエリの結果は、クエリで明示的に指定されたように、pageviews_enriched_r8_r9 という名前の Kafka トピックに書き込まれます。
  
  エディターで以下のクエリを入力します。
```
CREATE STREAM PAGEVIEWS_FEMALE_LIKE_89
   WITH (kafka_topic='pageviews_enriched_r8_r9', value_format='AVRO')
   AS SELECT * FROM PAGEVIEWS_FEMALE
   WHERE REGIONID LIKE '%_8' OR REGIONID LIKE '%_9'
   EMIT CHANGES;
```
  Copy
7. Run query をクリックします。出力は以下のようになります。
8. カウントが 1 より大きい場合に 30 秒のタンブリングウィンドウで、REGION と GENDER の組み合わせごとに PAGEVIEWS をカウントする永続的なクエリを作成します。手順がグループ化およびカウントであるため、結果はストリームではなく、テーブルになります。このクエリの結果は、PAGEVIEWS_REGIONS という名前の Kafka トピックに書き込まれます。
  
  エディターで以下のクエリを入力します。
```
CREATE TABLE PAGEVIEWS_REGIONS
   AS SELECT GENDER, REGIONID , COUNT(*) AS NUMUSERS
   FROM PAGEVIEWS LEFT JOIN USERS ON PAGEVIEWS.USERID = USERS.USERID
   WINDOW TUMBLING (size 30 second)
   GROUP BY GENDER, REGIONID
   HAVING COUNT(*) > 1
   EMIT CHANGES;
```
  Copy
9. Run query をクリックします。出力は以下のようになります。
10. Running queries タブをクリックします。以下の永続的なクエリが表示されます。
  - PAGEVIEWS_FEMALE
  - PAGEVIEWS_FEMALE_LIKE_89
  - PAGEVIEWS_REGIONS
11. Editor タブをクリックします。All available streams and tables ペインには、アクセスできるすべてのストリームおよびテーブルが表示されます。
12. All available streams and tables セクションで KSQL_PROCESSING_LOG をクリックすると、ストリームのスキーマ（ネスト化されたデータ構造など）が表示されます。

クエリの実行¶

このステップでは、前のセクションでストリームおよびテーブルとして保存した ksqlDB クエリを実行します。

Streams タブで PAGEVIEWS_FEMALE ストリームを選択します。
Query stream をクリックします。

エディターが開き、クエリのストリーミング出力が表示されます。
Stop をクリックして、出力の生成を停止します。
Tables タブで PAGEVIEWS_REGIONS テーブルを選択します。
Query table をクリックします。

エディターが開き、クエリのストリーミング出力が表示されます。
Stop をクリックして、出力の生成を停止します。

ステップ 5: コンシューマーラグのモニタリング¶

ナビゲーションバーで Consumers をクリックして、ksqlDB により作成されたコンシューマーを表示します。
コンシューマーグループ ID をクリックして、_confluent-ksql-default_query_CSAS_PAGEVIEWS_FEMALE_5 コンシューマーグループの詳細を表示します。

このページで、ストリーミングクエリのコンシューマーラグおよび消費量の値を確認できます。

詳細については、Control Center の「Consumers」ドキュメントを参照してください。

ステップ 6: Confluent Platform の停止¶

ローカルインストールでの作業が完了したら、Confluent Platform を停止できます。

Confluent CLI confluent local services connect stop コマンドを使用して、Confluent Platform を停止します。
```
confluent local services stop
```
Copy
confluent local destroy コマンドを使用して、Confluent Platform インスタンスのデータを破棄します。
```
confluent local destroy
```
Copy

次のステップ¶

このクイックスタートで示したコンポーネントについて、さらに詳しく確認します。

ksqlDB ドキュメント: ストリーミング ETL、リアルタイムモニタリング、異常検出などのユースケースにおける、ksqlDB を使用したデータの処理について確認できます。一連のスクリプト化されたデモにより、ksqlDB の使用方法も参照してください。
Kafka チュートリアル : ステップごとの手順に従って、Kafka、Kafka Streams、および ksqlDB の基本的なチュートリアルを試すことができます。
Kafka Streams ドキュメント: ストリーム処理アプリケーションを Java または Scala で構築する方法を確認できます。
Kafka Connect ドキュメント: Kafka を他のシステムに統合し、すぐに使用できるコネクターをダウンロードして、 Kafka 内外のデータをリアルタイムで簡単に取り込む方法を確認できます。
Kafka クライアントドキュメント: Go、Python、.NET、C/C++ などのプログラミング言語を使用して、Kafka に対してデータの読み取りおよび書き込みを行う方法を確認できます。
ビデオ、デモ、および参考文献: Confluent Platform のチュートリアルやサンプルを試したり、デモやスクリーンキャストを参照したり、ホワイトペーパーやブログで学べます。

トラブルシューティング¶

クイックスタートのワークフローの進行中に問題が発生した場合は、ステップを再試行する前に、以下の解決策を確認してください。

問題: Datagen コネクターの場所を特定できない¶

解決策: 「ステップ 1: Confluent Platform のダウンロードおよび起動」の説明に従って、Confluent Platform の bin ディレクトリの場所を PATH に追加したことを確認します。

export PATH=<path-to-confluent>/bin:$PATH
Copy

解決策 : DataGen コネクターがインストールされており、実行中であることを確認します。

「ステップ 1: Confluent Platform のダウンロードおよび起動」の説明に従って、kafka-connect-datagen がインストールされており、実行中であることを確認します。

confluent-hub install --no-prompt confluentinc/kafka-connect-datagen:latest
Copy

出力は以下のようになります。

Running in a "--no-prompt" mode
...
Completed
Copy

解決策: Confluent CLI confluent local services connect log コマンドを使用して、Datagen の connect ログを確認します。

confluent local services connect log | grep -i Datagen
Copy

出力は以下のようになります。

[2019-04-18 14:21:08,840] INFO Loading plugin from: /Users/user.name/Confluent/confluent-version/share/confluent-hub-components/confluentinc-kafka-connect-datagen (org.apache.kafka.connect.runtime.isolation.DelegatingClassLoader:215)
[2019-04-18 14:21:08,894] INFO Registered loader: PluginClassLoader{pluginLocation=file:/Users/user.name/Confluent/confluent-version/share/confluent-hub-components/confluentinc-kafka-connect-datagen/} (org.apache.kafka.connect.runtime.isolation.DelegatingClassLoader:238)
[2019-04-18 14:21:08,894] INFO Added plugin 'io.confluent.kafka.connect.datagen.DatagenConnector' (org.apache.kafka.connect.runtime.isolation.DelegatingClassLoader:167)
[2019-04-18 14:21:09,882] INFO Added aliases 'DatagenConnector' and 'Datagen' to plugin 'io.confluent.kafka.connect.datagen.DatagenConnector' (org.apache.kafka.connect.runtime.isolation.DelegatingClassLoader:386)
Copy

解決策 : kafka-connect-datagen の .jar ファイルが追加されており、lib サブフォルダー内に存在するかを確認します。

ls $CONFLUENT_HOME/share/confluent-hub-components/confluentinc-kafka-connect-datagen/lib/
Copy

出力は以下のようになります。

...
kafka-connect-datagen-0.1.0.jar
...
Copy

解決策 : プラグインがコネクターのパスに存在するかを検証します。

Confluent Hub から kafka-connect-datagen ファイルをインストールした場合、インストールディレクトリは複数のプロパティファイルのプラグインのパスに追加されます。

 Adding installation directory to plugin path in the following files:
/Users/user.name/Confluent/confluent-version/etc/kafka/connect-distributed.properties
/Users/user.name/Confluent/confluent-version/etc/kafka/connect-standalone.properties
/Users/user.name/Confluent/confluent-version/etc/schema-registry/connect-avro-distributed.properties
/Users/user.name/Confluent/confluent-version/etc/schema-registry/connect-avro-standalone.properties
...
Copy

これらのいずれかを使用して、コネクターのパスを確認できます。この例では、connect-avro-distributed.properties ファイルを使用します。

grep plugin.path $CONFLUENT_HOME/etc/schema-registry/connect-avro-distributed.properties
Copy

出力は以下のようになります。

plugin.path=share/java,/Users/user.name/Confluent/confluent-version/share/confluent-hub-components
Copy

その内容が存在することを確認します。

ls $CONFLUENT_HOME/share/confluent-hub-components/confluentinc-kafka-connect-datagen
Copy

出力は以下のようになります。

assets   doc  lib  manifest.json
Copy

問題: ストリームとストリームの結合に関するエラー¶

エラーにより、ストリームとストリームの結合には WITHIN 句の指定が必要であることが通知されます。このエラーは pageviews と users の両方をストリームとして誤って作成した場合に発生する可能性があります。

../_images/c3-ksql-stream-stream-join-error.png

解決策: 「ステップ 4: ksqlDB を使用したストリームおよびテーブルの作成および書き込み」で pageviews の "ストリーム" を作成し、users の "テーブル" を作成したことを確認します。

問題: ksqlDB クエリのステップを正常に完了できない¶

Java エラーまたはその他の重大なエラーが発生しました。

解決策 : Confluent Platform により現在サポートされているオペレーティングシステムで作業していることを確認します。