ウィンドウ継続時間、期間、セッションに関する追加情報
Windowプロセッサーにより、ストリーミングデータを複数のタイプの時間ウィンドウに分割できます: 固定時間ウィンドウ、スライディングウィンドウ、セッションウィンドウ。
Windowプロセッサーは、指定した期間ごとに新しいウィンドウを開始します。
このウィンドウは、特定の期間([duration] (期間))、メモリレコード内に保存され、データのマイクロバッチを出力に送信します。
固定時間ウィンドウ
固定時間ウィンドウ(別名タンブリングウィンドウ、または"ウィンドウトレイン")は、最もシンプルな形式のウィンドウです。
-
どのウィンドウも期間が一定で同じであり、重複しない
-
特定の時点でメモリに保存されるウィンドウは1つのみ
-
1つのウィンドウにキャプチャーされるデータは1つのみ
これらのウィンドウは、常時すべてのデータをキャプチャーする場合に便利です。
スライディングウィンドウ
スライディングウィンドウ(別名スライディングタイムウィンドウ)は最もシンプルな形式のウィンドウです。
-
複数のウィンドウを重ねることができる
-
複数のウィンドウがメモリ内に同時に保存される
-
データセット内のエレメントを複数のウィンドウにキャプチャーできる
これらのウィンドウはサンプリングにも、データの移動平均を取るのにも便利です。
セッションウィンドウ
セッションウィンドウとは、他のデータのギャップ期間に保存されているデータを含むウィンドウのことです。
-
高濃度のデータが別々のウィンドウにグルーピングされる
-
データストリームのアイドルセクションが除外される
-
データをさまざまなサイズの交わりを持たないウィンドウ内に取り込むことができる
これらのウィンドウは、時間に関して不規則に分散しているデータに便利です。たとえば、ユーザーのマウス操作を表すデータストリームは、アイドル時間が長く、集中的なクリックが散在している場合がよくあります。