自動機械学習の紹介
Qlik AutoML を使用すると、分析チームの機械学習を自動化できます。コード不要のシンプルなインターフェイスで、機械学習実験を簡単に作成し、モデルを生成して予測できます。
機械学習とは
機械学習は、人工知能とデータ サイエンスの一分野であり、過去のデータからパターンを認識して将来の結果を予測することに重点を置いています。アルゴリズムは、明示的にプログラムされることなく、データに基づいてトレーニングされ予測モデルを構築します。機械学習モデルは、次のような質問に答えるのに役立ちます。
-
ジムの会員が退会するか。
-
特定の顧客の生涯価値の期待値はどのくらいか。
基本的な概念については、「機械学習について」を参照してください。機械学習の質問を定義し、データセットを準備するための構造化されたフレームワークについても説明します。
自動機械学習でできること
Qlik Sense で自動化された機械学習実験を作成します。Analytics アクティビティ センターでは、他のユーザーと共同で実験を行え、モデルをトレーニングするためにカタログから簡単にデータをロードできます。
予測分析を Qlik Sense アプリと統合して、調査結果を共有します。ビジュアライゼーションと対話型の仮定のシナリオを使用してさらに調査し、さまざまなパラメーターの変更が目標とする結果にどのように影響するかを理解します。
カタログに保存されているデータセットの予測や、Qlik Sense API を使用したリアルタイムでの運用を予測できます。
実験の仕組み
実験では、特定のターゲットを持つ特定のデータセットで機械学習アルゴリズムをトレーニングします。トレーニングにより、予測に使用できる機械学習モデルが生成されます。
自動機械学習では、ほとんどのプロセスが自動化されています。実験を作成してデータセットをロードすると、データセットが自動的に分析され、データが前処理されて機械学習の準備が整います。ターゲットの選択に役立つように、各列の統計やその他の情報が表示されます。トレーニングを開始すると、複数のアルゴリズムがデータのパターン検索を開始します。実験の作成とトレーニングの詳細については、「実験の作業」を参照してください。
トレーニングが終了したら、生成された機械学習モデルをスコアとランクで評価できます。パラメーターを変更してトレーニングを繰り返すことで、複数のバージョンを生成できます。データセットに最適なモデルを選択して展開し、予測を開始します。詳細については、「ML 展開の作業」を参照してください。
次の図に示すように、実験には複数のバージョンがあり、それぞれが 1 つ以上のアルゴリズムを使用しています。最も高いパフォーマンスを発揮するアルゴリズムを備えたモデルを展開して、予測できます。つまり、1 つの実験から複数の ML が展開される可能性があります。
AutoML へのユーザー アクセス
ユーザーが Qlik AutoML にアクセスする方法の詳細については、「Qlik AutoML を操作できるユーザー」を参照してください。
AutoML の制限とライセンス管理の容量
AutoML は、有料の追加機能です。該当するサブスクリプションには、制限付きの機能が一部含まれています。特定の機能と容量は、サブスクリプションの内容に応じて異なります。
制限事項
-
Qlik AutoML の API レートは 1 分あたり 300 リクエストに制限されています。
-
データセットの最大列数: 500
これは、実験のトレーニングと予測の生成に使用されるデータセットに適用されます。実験のバージョンで、特徴量として使用する列の数が制限されます。データセットにはより多くの列を含めることができ、データセットに列が含まれている場合は制限が計算されます。
ライセンス管理の容量
顧客のライセンスに応じて、Qlik AutoML の使用方法を管理するさまざまなメトリクスの容量が決まります。使用状況メトリクスは、AutoML ユーザー インターフェース、Qlik Sense アプリ内のキー ドライバー分析、パブリック API を介した AutoML サービスの使用の組み合わせとして測定されます。
ビジネスのニーズに応じて、複数のティアの AutoML を用意しています。次の 2 種類のティアがあります。
-
付属ティア: これは、機能に制限がある、基本的な AutoML 機能です。これは、Qlik Sense Enterprise SaaS、Qlik Cloud Analytics Standard、Qlik Cloud Analytics Premium、Qlik Cloud Enterprise、Qlik Talend Cloud (Standard、Premium、Enterprise) のサブスクリプションに含まれています。付属ティアは、試用目的や、Qlik AutoML をビジネスのニーズに役立てる方法を評価するのに適しています。このティアは、実稼働のユース ケースには適していません。より包括的な機能が必要な場合は、Qlik AutoML の有料ティアを検討してください。
-
有料ティア: 実稼働のユース ケースに必要な、包括的な AutoML 機能を提供するパッケージが多数あります。パッケージは、Qlik Cloud サブスクリプションの追加の有料アドオンとして利用できます。
次の機能は、Qlik AutoML の有料ティアでのみ利用できます。
-
ハイパーパラメーターの最適化
-
スケジュールされた予測
-
リアルタイム予測
-
Qlik AutoML コネクタ
各タイプの AutoML ティアに含まれる内容の詳細については、以下の表を参照してください。
メトリクス | 説明 | 付属ティアで利用可能 | 有料ティアで利用可能 |
---|---|---|---|
展開されたモデル | Qlik Cloud サブスクリプションに含まれるティアにより、ライセンス内で作成されたすべてのテナントで作成できる展開されたモデルの数の上限が定義されています。この消費制限はモデルごとに定義されます。つまり、単一のモデルから作成された複数の ML 展開は、単一の展開されたモデルとしてカウントされます。 | はい | はい |
同時トレーニング | テナントが並行してトレーニングできるモデルの数です。Qlik AutoML の付属ティアでは、各モデルが順番で実行されます。有料ティアには、テナントが複数のモデルを同時にトレーニングできる容量が含まれています。 | いいえ | はい |
データセット サイズの増加 | 有料ティアでは、モデルをトレーニングするためのデータセット サイズを増やすことができます。 | いいえ | はい |
手動のバッチ予測 | データセット内のすべての行を手動で予測します。 | はい | はい |
スケジュールされたバッチ予測 | 予測を手動で開始するのではなく、スケジュールに従って実行するように構成します。スケジュールされた予測は、Qlik AutoML の有料ティアでのみ利用できます。詳細については、「スケジューリング予測」を参照してください。 | いいえ | はい |
リアルタイム予測 | この API を用いて、ML 展開を使用してリアルタイムで予測を実行します。詳細については、「リアルタイム予測の作成」を参照してください。 | いいえ | はい |
Qlik Cloud Analytics の Qlik AutoML コネクタ | この分析コネクタを使用すると、統合された Qlik AutoML プラットフォームから Qlik Cloud にデータをロードできます。詳細については、「Qlik AutoML 分析ソース」を参照してください。 | いいえ | はい |
ハイパーパラメーターの最適化 | ハイパーパラメーターの最適化により、AutoML モデルを微調整して、学習プロセスの制御を強化できます。詳細については、「ハイパーパラメーターの最適化」を参照してください。 | いいえ | はい |
展開されたモデルの監視 | 組み込みの監視ツールを使用して、ML 展開に展開されたモデルを評価します。時間の経過に伴う特徴量のドリフトや、予測モデルの使用状況に関する詳細を監視できます。詳細については、「展開されたモデルのパフォーマンスと使用状況の監視」を参照してください。 | いいえ | はい |
ライセンス メトリクスの詳細については、「Qlik Cloud® サブスクリプションの製品説明」を参照してください。管理者は、ライセンス情報を表示し、Administration アクティビティ センターに展開されているモデルの数を監視できます。 詳細については、「リソース消費の監視」を参照してください。