データ ロード エディター の使用
データ ロード エディターからデータ ロード スクリプトを作成して実行し、データ ソースへの接続を作成します。データがロードされると、アプリで分析できます。
アプリのナビゲーション メニューで [データ ロード エディター] をクリックして、データ ロード エディターを開きます。
ツールバー
データ ロード エディタで最も頻繁に使用されるコマンドを含むツールバーです。
データ ロード スクリプトの詳細については、次を参照してください。
データ ソース
アプリにデータを追加して、ロード スクリプトに追加します。
データの追加
[データの追加] で、データ カタログにアクセスできます。データ カタログを使用すると、アクセスできるすべての既存のデータセットからデータをロードできます。データ カタログを使用して、複数のデータセットから同時にデータをロードできます。
データ接続
[データ接続] の下に、よく使用するデータ ソース (データベースまたはリモート ファイル) へのショートカットを保存できます。ここからロードするデータを選択できます。 データ接続は、アクセス権のあるスペース別にソートされます。
詳しくは「分析データのロード」と「ロード スクリプトでのデータの選択」を参照してください。
テキスト エディタ
テキスト エディタではスクリプト コードを記述、編集することができます。スクリプトの各行には番号が振られ、スクリプトは構文のコンポーネント別に色分けされます。テキスト エディターのツールバーには、[検索と置換]、[ヘルプ モード]、[元に戻す]、[やり直す] のコマンドが含まれています。初期のスクリプトには、事前定義された地域変数設定がいくつか含まれており (たとえば、SET ThousandSep=)、必要に応じて編集できます。詳細については、「アプリとスクリプトの地域設定の変更」を参照してください。
スクリプトの詳細については、「ロード スクリプトの編集」および「スクリプト構文の概要」を参照してください。
セクション
スクリプトをセクションに分けて、読みやすく、管理しやすくします。セクションは上から下に実行されます。
[データの追加] を使用してデータを追加した場合、データをロードするのに必要なスクリプト コードを含む [自動生成セクション] というデータ ロード スクリプト セクションが表示されます。
詳細については、「ロード スクリプトの整理」を参照してください。
プレビュー
[データのプレビュー] または [データのロード] のいずれかを使用してスクリプトを実行すると、 [プレビュー] でロードされたテーブルのプレビューを表示できます。
プレビューでは、テーブル データの次の 3 つの異なるビューが提供されます。
テーブル ビュー
リスト ビュー
タイル ビュー
テーブル ビュー
データ ビューには、データが表形式で表示されます。
リスト ビュー
リスト ビューには項目とその値に関する情報の概要が表示されます。
をクリックして目的の列を選択することにより、表示する列を制御できます。選択内容は、セッション間で引き継がれません。次の列を利用できます。
名前: 項目名。
データ タイプ: 項目内のデータの種類
ユニーク値: 項目内のユニーク値の数
Null 値: 項目内の null 値の数
サンプル値: 項目からのサンプル値の選択
合計値: 項目が数値の場合、項目値の合計
最小値: 項目が数値の場合、最小値
最大値: 項目が数値の場合、最大値
平均値: 項目が数値の場合、平均値
中央値: 項目が数値の場合、中央値
システム タグ: データ プロファイリング サービス によってデータに追加されたタグ
標準偏差: 項目が数値の場合、値の標準偏差
正: 項目が数値の場合、正の値の数
負: 項目が数値の場合、負の値の数
ゼロ値: 項目が数値の場合、ゼロ値の数
空の文字列: 項目がテキストの場合、空の文字列の数
最小長: 項目がテキストの場合、最短の文字列の文字数
平均の長さ: 項目がテキストの場合、文字列あたりの平均文字数
最大長: 項目がテキストの場合、最長の文字列の文字数
最初の並べ替え値: 項目内のアルファベット順または数値順の最初の値
最後の並べ替え値: 項目内のアルファベット順または数値順の最後の値
数値: 項目内の数値の数
テキスト値: 項目内のテキスト値の数
最も頻度の高い値: 項目から最も繰り返される 3 つの値
頻度分布: 項目が数値の場合、値の頻度分布
タイル ビュー
タイル ビューには、データのグラフィカルなプロファイルとともに利用可能な項目が表示されます。項目の値に応じて、各タイルには次のいずれかのビジュアライゼーションが表示されます。
各値のインスタンスの数を含む、項目の上位 3 つの異なる値のリスト。
平均値が強調表示された、値の範囲を示す面グラフ
アウトプット
[アウトプット] には、自動保存ステータスとスクリプトの実行中に生成されたすべてのメッセージが表示されます。