チュートリアル - 予測データの生成と視覚化
このチュートリアルでは、Qlik AutoML を使用して、予測を実行するための機械学習モデルをトレーニングおよび展開する方法を説明します。また、Qlik Sense アプリで予測データを視覚化する方法についても説明します。
二項分類問題の典型的な例である顧客チャーンのシナリオについて考えます。 目標は、顧客がサービスのサブスクリプションをキャンセルするか、継続するかを確実に予測できるようにすることです。このタイプの問題には、true または false (チャーンする、またはチャーンしない) の 2 つの結果しかありません。
この機械学習の問題に取り組むには、まず結果がわかっている一連のデータを処理し、次にそのデータから作成された統計モデリングを、新たに結果を予測するデータに適用します。
このチュートリアルでは、実験を作成することから始めます。そこからモデルをトレーニングし、そのうちの 1 つを ML 展開に展開します。この ML 展開は予測を作成するために使用され、Qlik Sense アプリで視覚化できます。
学習内容
このチュートリアルを完了すると、実験の作成と構成に含まれるさまざまなステップを理解できます。また、モデル スコアを解釈する方法についても学びます。最後に、機械学習モデルを展開でき、予測データを使用して Qlik Cloud Analytics で説得力のある Qlik Sense ビジュアライゼーションを生成する方法を理解できるようになります。
このチュートリアルでは、データセットとトレーニング結果の一般的な問題を特定して、モデルを手動で反復する方法を説明します。既定では、Qlik AutoML はインテリジェント モデル最適化を使用してモデルをトレーニングします。インテリジェント最適化により、問題のある特徴量はモデルのトレーニングから自動的に削除されます。これにより、最小限の反復作業で、単一のバージョンを作成した後でモデルを展開できる可能性が高まります。インテリジェント最適化を使用してモデルをトレーニングする方法を示す例については、「例 – 自動機械学習によるモデルのトレーニング」を参照してください。
このチュートリアルを完了する必要がある対象者
このチュートリアルは、Qlik Cloud Analytics での自動機械学習およびデータ ビジュアライゼーションの概要を学ぶユーザー向けです。機械学習と Qlik Sense に関する基本的な知識があると役立ちますが、必須ではありません。
このチュートリアルを完了するには、次が必要です。
-
Professional 資格または Full User 資格
-
Qlik Cloud テナントでの Automl Experiment Contributor および Automl Deployment Contributor セキュリティ ロール
-
展開されたモデルを承認するための権限。具体的には、次のいずれかが必要です。
-
テナント内の自分の AutoML モデルを承認または拒否 (ユーザー権限)
-
テナント内の AutoML モデルを承認または拒否(管理者権限)
-
-
作業するスペースで必要なスペース ロール。参照先:共有スペースでの権限の管理 および 管理スペースでの権限の管理
ML リソースを表示または作成できない場合は、必要なロール、資格、または権限を持っていない可能性があります。詳細については、テナント管理者に問い合わせてください。
詳細については、「Qlik AutoML を操作できるユーザー」を参照してください。
始める前に必要な準備
まず、下記のリンク先のチュートリアル資料をダウンロードする必要があります。CSV ワークフローと QVD ワークフローのいずれかを選択します。設定済みアプリのダウンロードはオプションです。
必要な資料をダウンロードしたら、デスクトップに解凍します。
-
AutoMLTutorialDatasetsCSV: Contains tutorial data in CSV format. This option is easier for getting started quickly.
-
AutoMLTutorialDatasetsQVF: QVD を作成するために実行できる .qvf スクリプト形式のチュートリアル データが含まれています。このオプションは CSV よりも少し時間がかかりますが、Qlik データ形式とスクリプトの操作方法を学ぶのに役立ちます。
-
AutoMLTutorialPreConfiguredApp: このアイテムはオプションです。これは、チュートリアル中に構築する Qlik Sense アプリのサンプル コピーです。これにより、トレーニングと展開の段階をスキップして、予測アプリ開発の実践的な経験をより早く取得できます。
詳細については、「別のワークフロー: 事前構成されたアプリのアップロード」を参照してください。
トレーニング データセットには、更新期限が過ぎて、サブスクリプションのサービスをチャーンするか継続するかを決定した顧客に関する情報が含まれています。
適用データセットには、まだ更新日を迎えていない新しい顧客に関する詳細が含まれています。これらの顧客がサービスをキャンセルするかどうかはまだ決まっていません。このチュートリアルの目標は、このような顧客の行動を予測することであり、顧客チャーンの可能性を減らすことを期待しています。
オプション 1: AutoML チュートリアル データセット (CSV)
次の手順を実行します。
Analytics アクティビティ センターを開きます。
[作成] ページに移動し、 [データセット] を選択して、 [データ ファイルをアップロード] を選択します。
AutoML Tutorial - Churn data - training.csv ファイルをアップロード ダイアログにドラッグします。
次に、AutoML Tutorial - Churn data - apply.csv ファイルをアップロード ダイアログにドラッグします。
スペースを選択します。個人スペース、または他のユーザーがこのデータにアクセスできるようにする場合は共有スペースにもできます。
[アップロード] をクリックします。
データセットがアップロードされたら、実験の作成を実行できます。
オプション 2: AutoML チュートリアル データセット (QVD)
次の手順を実行します。
Analytics アクティビティ センターを開きます。
[作成] ページに移動し、 [アップロード] を選択して、 [スクリプト] を選択します。
次のファイルをアップロード ダイアログにドラッグします。
AutoML Tutorial - Churn data - training.qvf
AutoML Tutorial - Churn data - apply.qvf
スペースを選択します。個人スペース、または他のユーザーがこのデータにアクセスできるようにする場合は共有スペースにもできます。
[アップロード] をクリックします。
アップロードされたスクリプトごとに、次を実行します。
スクリプトを開き、 [エディター] タブに切り替えます。
[エディター] で、 [データをエクスポート] をクリックします。
QVD データセットは、スクリプトをアップロードしたのと同じスペースに作成されます。
データセットが作成されたら、実験の作成を実行できます。
このチュートリアルでのレッスン
このチュートリアル内のトピックは、順番に完了するよう構成されています。ただし、トピックをとばして、後で戻ることもできます。
追加の資料とリソース
- Qlik では、さらなる詳細情報を提供する、広範なリソースをご用意しています。
- Qlik オンライン ヘルプを使用できます。
- 無料のオンライン コースを含むトレーニングは、Qlik Continuous Classroom で利用できます。
- ディスカッション フォーラム、ブログなどは、Qlik Community にあります。
お客様のご意見は重要です
フィードバックをお待ちしています。以下のセクションを使用して、弊社へのフィードバックをお知らせください。