メイン コンテンツをスキップする 補完的コンテンツへスキップ

実験の構成

実験の構成は、ターゲットの選択と、モデルがターゲットを予測するために使用する特徴量の選択で構成されます。いくつかのオプション設定を構成することもできます。

ターゲットの選択をサポートするために、履歴データセットが分析され、データセットの各列に関する要約統計が表示されます。いくつかの自動前処理のステップがデータセットに適用され、適切なデータのみが含まれるようになっています。データの前処理の詳細については、「自動データ準備と変換」を参照してください。

v1 を実行後、モデル のトレーニングがさらに必要な場合には、新しい実験バージョンを作成できます。詳細については、「モデルの改良」を参照してください。

要件と権限

ML 実験を操作するためのユーザー要件については、「実験の作業」を参照してください。

インターフェイス

次のセクションでは、実験インターフェイスを操作して実験を構成する方法について説明します。インターフェイスの詳細は、実験インターフェイスのナビゲートをご覧ください。

タブ ナビゲーション

実験を作成すると、 [データ] タブが開きます。ここで、実験のターゲットと特徴量を設定できます。

少なくとも 1 つの実験バージョンを実行すると、他のタブを使用できるようになります。これらの他のタブを使用すると、バージョンでトレーニングしたモデルを分析できます。異なる特徴量を選択して後続のバージョンを構成する必要がある場合は、 [データ] タブに戻ることができます。

スキーマ ビューデータ ビュー

[データ] タブでは、次のビューを切り替えることができます。

  • 行 スキーマ ビュー: 既定のビュー。このビューでは、データセット内の各列は、情報と統計を含むスキーマの行で表されます。

  • テーブル データ ビュー: 各列の詳細情報やサンプル データにアクセスするために使用できる代替ビュー。

ML 実験のスキーマ ビュー

ML 実験のスキーマ ビュー

ML 実験のデータ ビュー

ML 実験のデータ ビュー

実験構成パネル

コントロール 構成を見るをクリックすると、実験トレーニングをさらにカスタマイズできるパネルが開きます。どのタブを表示していても、パネルを開くことができます。このパネルには、多数の追加の構成オプションが用意されています。

実験構成パネルを使用すると、次を実行できます。

  • ターゲットと実験タイプを選択する

  • 特徴量を追加または削除する

  • 実験の新しいバージョンを構成する

  • トレーニング データセットの変更または更新を選択する

  • アルゴリズムを追加または削除する

  • モデルの最適化設定を変更する

  • 時系列モデルの場合は、予測設定を設定する

実験構成パネル

ML 実験におけるカスタマイズ パネルの拡張

ターゲットと実験タイプの選択

最初のトレーニングを開始するまでは、ターゲット列と実験タイプを変更できます。その後、編集がロックされます。

ターゲット列には、機械学習モデルで予測する値が含まれています。

実験タイプは、ターゲットとそれに含まれるデータのタイプに応じて決定されます。実験タイプは、トレーニングするモデルのタイプを定義します。次のオプションを使用できます。

  • 二項分類: 2 つの可能な値 (例: 「はい」または「いいえ」) を持つターゲットを予測するようにモデルをトレーニングします。データはどの特徴量タイプでもかまいません。

  • 多項分類: 3 ~ 10 個の可能な値 (カテゴリのリストなど) を持つターゲットを予測するようにモデルをトレーニングします。データは任意の特徴量タイプにできますが、10 個を超える個別の非数値クラス (値) を持つ列はターゲットとして選択できません。

  • 回帰: 10 個を超える値を持つターゲット (具体的には数値特徴量タイプを持つターゲット) を予測するようにモデルをトレーニングします。

  • 時系列: 過去のデータを活用して、特定の将来の期間の目標値を予測するモデルをトレーニングします。ターゲットには 10 個を超える個別の値があり、数値特徴量タイプが含まれている必要があります。詳細については、「時系列実験の作業」を参照してください。

  1. 行 スキーマ ビューまたはテーブル データ ビューで、列の上にマウスを置きます。

  2. 表示される ターゲット アイコンをクリックします。

    ターゲット列が ターゲット で示され、他の使用可能な列は自動的に特徴量として選択されます。

    スキーマ ビューでターゲットを選択する

    ターゲットの記号を含むデータセット列。
  3. スキーマ 構成を見るをクリックして、実験構成パネルを展開します。

  4. [ターゲットと実験タイプ] を展開します。

  5. [実験タイプ] が表示されます。データセットとターゲットに対して時系列予測が可能な場合は、実験タイプを [回帰] から [時系列] に変更するオプションがあります。

ターゲットと実験タイプを選択すると、実験の最初のバージョンの実行を開始できます。詳細については、「実験のトレーニング」を参照してください。この時点で追加の構成を実行できます (以下で説明)。または、トレーニング結果を確認した後に構成を調整することもできます。

実験トレーニングが進むにつれて、データの解釈と処理の方法の説明が表示されます。詳細については、「データセットのインサイトの解釈」を参照してください。

特徴量列の選択

ターゲット セットを使用すると、モデルのトレーニングに含める他の使用可能な列を選択できます。モデルに含めない特徴量を除外します。列はデータセットに残りますが、トレーニング アルゴリズムでは使用されないことに注意してください。

実験構成パネルの上部に、データセットのセルの数が表示されます。数がデータセットの制限を超えている場合は、特徴量を除外して制限内にできます。

次のような方法で特徴量列を選択できます。

スキーマ ビューデータ ビュー

メイン ビューでは、次を実行できます。

  • [利用可能な特徴量すべてを含める] を選択解除してから、含める特徴量のみを選択する。

  • 含めない特徴量のチェックボックスを手動でオフにする。

  • 検索を行い、フィルタリングされた検索結果のすべての特徴量を除外または含める。

実験構成パネルで

実験構成パネルを展開すると、次を実行できます。

  • 含めない特徴量のチェックボックスを手動でオフにする。

  • 実験の最初のバージョンを実行した後、[含める上位特徴量の数] を定義する。

実験構成パネルの特徴量セクション

トレーニング設定パネルの Qlik Predict 機能セクション

特徴量を選択すると、特徴量タイプが自動的に割り当てられます。可能な特徴量タイプは次のとおりです。

  • カテゴリ

  • 数値

  • Date

  • フリー テキスト

特徴量タイプは、特徴量列に含まれるデータに基づいて割り当てられます。特徴量が特定の基準を満たしている場合、自動設計特徴量の基礎となるようにステージングされる可能性があります。必要に応じて、その特徴量を自動特徴量エンジニアリングに使用するかどうかを変更できます。自動特徴量エンジニアリングの詳細については、「自動特徴量エンジニアリング」を参照してください。

データセット内の特定の列は、実験の特徴量として選択できない場合や、特定の処理が適用されている場合があります。データの解釈と処理の方法の説明は、実験トレーニングを実施するにしたがい、表示されます。詳細については、「データセットのインサイトの解釈」を参照してください。

アルゴリズムの選択

使用可能なすべてのアルゴリズムはデフォルトで含まれており、使用しないアルゴリズムは除外できます。通常は、最初のトレーニング結果を確認したときに、モデル改良の一環としてこの作業を実行します。詳細については、「モデルの改良」を参照してください。

実験構成パネルのアルゴリズム セクション

トレーニング設定パネルの Qlik Predict 機能アルゴリズム

特徴量タイプの変更

データセットがロードされると、列はデータ タイプおよび他の特性に基づいて、カテゴリ、数値、日付、フリー テキストとして扱われます。場合によっては、この設定を変更する必要があります。

例えば、曜日が 1 ~ 7 の数字で表される場合、それぞれの数字はカテゴリ値を表します。デフォルトでは、ランク付けされた連続数値として処理されるため、カテゴリとして処理されるように構成を手動で変更する必要があります。

列に日付と時刻の情報が含まれていると識別された場合は、新しく生成された自動設計特徴量のベースとして列が使用されます。この場合、元の列 (親特徴量) には日付特徴量タイプが付与されているものとして扱われます。

親特徴量は、日付特徴量からカテゴリ特徴量または数値特徴量に変更できます。たとえば、日付として識別されている特徴量を、文字列または数値として扱う必要がある場合に便利です。これを実行すると、実験トレーニングで自動設計特徴量を使用することはできなくなります。

  1. 行 スキーマ ビューで、特徴量を見つけます。

  2. この特徴量の [特徴量タイプ] 列で、下向き矢印 をクリックします。

  3. リストで値を選択します。

テーブル データ ビューから特徴量タイプを変更することもできます。特徴量を見つけて、現在の特徴量タイプの横にある 下向き矢印 をクリックします。リストで値を選択します。

[データ処理] の実験構成パネルで、特徴量タイプが変更されたすべての列を確認できます。

時系列予測

[時系列実験] をトレーニングする場合、構成に応じて特定の特徴量タイプの変換が自動的に適用されます。たとえば、多変量予測に使用するグループを選択すると、これらのグループの特徴量タイプは自動的にカテゴリに切り替わります。

予測への影響

特徴量の特徴量タイプを手動で変更し、結果のモデルを展開すると、そのモデルで実行された予測で使用される適用データセット内の特徴量に、特徴量タイプのオーバーライドが適用されます。

データセットの変更

トレーニング データセットは、最初の実験バージョンを実行する前、さらに任意のバージョンを実行した後に変更することができます。

最初のバージョンを実行する前にデータセットを変更すると、データセットの変更前にあったすべての構成が失われます。

  1. [トレーニング データ] の実験構成パネルで、 [データセットを変更] をクリックします。

  2. 新しいデータセットを選択します。

モデル改良時のデータセット変更と更新 (実験バージョンの実行後) に関する詳細については、「データセットの変更と更新」を参照してください。

モデル最適化の構成

実験タイプ二項分類多項分類、または回帰の場合、次の設定を調整してモデルを最適化できます。

  • インテリジェント モデル最適化のオン/オフ

  • ハイパーパラメータ最適化のオン/オフ

  • タイムアウェア トレーニングのオン/オフ

これらのオプションは、実行する実験のバージョンごとにオンまたはオフにできます。

インテリジェント最適化の構成

既定では、実験にはインテリジェント モデル最適化が使用されます。インテリジェント モデル最適化により、Qlik Predict は特徴量選択を繰り返し、データに高度な変換を適用することで、モデルの改良プロセスを処理します。

インテリジェント最適化の詳細については、「インテリジェント モデル最適化」を参照してください。

この設定をオフにすると、トレーニングするモデルを手動で改良できます。たとえば、インテリジェント モデル最適化を使用してモデル トレーニングを開始し、その後、v2 の手動改良に切り替えて構成をさらに調整することができます。

  1. コントロール 構成を見るをクリックします。

  2. 少なくとも 1 つのバージョンの実験をすでに実行している場合は、 [新しいバージョン] をクリックします。

  3. パネルで、 [モデル最適化] を展開します。

  4. [インテリジェント] から [手動] に切り替えます。

  5. スライダーを使用して、トレーニングの最大実行期間を設定します。

モデル最適化の構成

Qlik Predict トレーニング設定パネルのモデル最適化で、インテリジェント モデル最適化を有効にする

ハイパーパラメーターの最適化の構成

ハイパーパラメーターの最適化を使用して、モデルを最適化できます。これは高度なオプションであり、トレーニング時間が大幅に増加する可能性があることに注意してください。インテリジェント最適化をオフにすると、ハイパーパラメーターの最適化を使用できます。

詳細については、「ハイパーパラメーターの最適化」を参照してください。

  1. コントロール 構成を見るをクリックします。

  2. 少なくとも 1 つのバージョンの実験をすでに実行している場合は、 [新しいバージョン] をクリックします。

  3. パネルで、 [モデル最適化] を展開します。

  4. [インテリジェント] から [手動] に切り替えます。

  5. [ハイパーパラメーターの最適化] チェックボックスを選択します。

  6. 必要に応じて、最適化の時間制限を設定します。デフォルトの制限時間は 1 時間です。

ハイパーパラメーターの最適化の構成

ハイパーパラメータ最適化をアクティブにした Qlik Predict トレーニング設定パネル

タイムアウェア トレーニングの構成

時系列軸を考慮してモデルをトレーニングする場合は、実験バージョンのタイムアウェア トレーニングを有効にします。このオプションを使用するには、データセット内に関連する時系列情報を含む列が必要です。

タイムアウェア トレーニングがオンになっている場合、Qlik Predict  は特殊なクロス検証と null 補完プロセスを使用してモデルをトレーニングします。

詳細については、「タイムアウェア モデルの作成」および「時間ベースのクロス検証」を参照してください。

  1. コントロール 構成を見るをクリックします。

  2. 少なくとも 1 つのバージョンの実験をすでに実行している場合は、 [新しいバージョン] をクリックします。

  3. パネルで、 [モデル最適化] を展開します。

  4. [時間ベースのテスト - トレーニング分割] で、データの並べ替えに使用する [日付インデックス] を選択します。

トレーニングデータ内のインデックスとして使用する列を選択して、タイムアウェア トレーニングを構成する

タイムアウェア トレーニングを有効にするために日付列が選択された Qlik Predictトレーニング設定パネル

トレーニング データに関する洞察の表示

実験の [データ] タブでは、トレーニング データの処理に関する洞察を表示できます。この情報は、テーブルの行 スキーマ ビューの [インサイト] 列に表示されます。表示される情報は、現在のトレーニング データを使用してバージョンを実行したかどうかに応じて異なります。[インサイト] 列の変更は、特徴量が使用できない理由や、特徴量が自動的に削除された理由を特定するのに役立ちます。

各インサイトの意味の詳細については、「データセットのインサイトの解釈」を参照してください。

関連する学習:

詳細を見る

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。