Snowflake APIをクエリーしてGoogle Cloud Storageにデータを送信
始める前に
手順
- [Connections] (接続) > [Add connection] (接続を追加)をクリックします。
-
開いたパネルで、作成する接続のタイプを選択します。
ここでは、[HTTP Client] (HTTPクライアント)を選択します。
- [Engine] (エンジン)リストでエンジンを選択します。
-
HTTP Clientプロパティの説明に従って、呼び出すAPIの接続プロパティとURLアドレスを入力します。
- [Base URL] (ベースURL): Snowflake APIのサマリーに記載されているベースURLをコピーして貼り付けます。
- [Authentication type] (認証タイプ): Basicを選択します。
- APIへの接続に必要な認証情報(ユーザー名とパスワード)を入力します。
- 接続をオンにして[Next] (次へ)をクリックします。
- HTTPクライアント接続の説明(オプション)と表示名(必須)を入力し、[Validate] (検証)をクリックします。
- [Add dataset] (データセットを追加)をクリックし、対応するデータセットを作成します。
- [Add a new dataset] (新しいデータセットを追加)パネルで、データセットに名前を付けます。
-
[Main] (メイン)パラメーターを設定します。
- [Type] (タイプ): サービスを1回だけ呼び出す場合は[Batch] (バッチ)を選択します。
- [HTTP method] (HTTPメソッド): GETを選択します。
- [Path] (パス): API作成時に既に設定済みであるエンティティ名を入力します。
- [Parameters] (パラメーター)、[Query parameters] (クエリーパラメーター)、[Request headers] (リクエストヘッダー)、[Request body] (リクエストボディ)の4オプションを無効にします。
- [Response body format] (レスポンスボディ形式): JSONを選択します。
- [Returned content] (返されたコンテンツ): Bodyを選択します。
-
[Advanced] (詳細設定)パラメーターを設定します。
- [Accept redirections] (リダイレクトを受け入れ)オプションを有効にし、リダイレクトの最大回数を3にします。
- [Pagination] (ページネーション)オプションを有効にします。
- [Preset] (事前設定): ODATAを選択して[Load selected preset] (選択された事前設定をロード)をクリックします。
- [Value of the offset] (オフセットの値): 10と入力します。
- [Value of the limit] (制限の値): 5と入力します。
- [Returned content] (返されたコンテンツ): Bodyを選択します。
- [Validate] (検証)をクリックしてデータセットを保存します。
- [Connections] (接続) > [Add connection] (接続を追加)をクリックします。
-
開いたパネルで、作成する接続のタイプを選択します。
ここでは、Google Cloud Storageを選択します。
- [Engine] (エンジン)リストでエンジンを選択します。
- Google Cloud Storageプロパティの説明に従って接続のプロパティ(Google認証情報)を入力し、接続をオンにして[Next] (次へ)をクリックします。
- Google Cloud Storage接続の説明(オプション)と表示名(必須)を入力し、[Validate] (検証)をクリックします。
- [Add dataset] (データセットを追加)をクリックし、対応するデータセットを作成します。
-
データセットに名前を付け、必須のプロパティを入力し、既存のバケットにGoogle Cloud Storage Blobを作成します。
- [Bucket name] (バケット名): 既存のバケット名を選択します。
- [Blob name] (Blob名): まだ存在しない名前を入力します。
- [Content type format] (コンテンツタイプ形式): [CSV format] (CSV形式)を選択します。
- [Line separator type] (行区切りタイプ): [Linux type] (Linuxタイプ)を選択します。
- [Encoding type] (エンコーディングタイプ): UTF-8を選択します。
- [Set header] (ヘッダーを設定)オプションを有効にし、[Number of lines] (行数)に1を、[Field separator type] (フィールド区切りのタイプ)に , をそれぞれ入力します。
- [Validate] (検証)をクリックしてデータセットを保存します。
- [Pipelines] (パイプライン)ページで[Add pipeline] (パイプラインを追加)をクリックします。新しいパイプラインが開きます。
-
パイプラインに意味のある名前を付けます。
例
Query Snowflake API and load data to Google Cloud Storage - [ADD SOURCE] (ソースを追加)をクリックし、開いたパネルでソースデータセットであるHTTPクライアントデータセットを選択します。
- [ADD DESTINATION] (デスティネーションを追加)項目をクリックし、開いたパネルで、デスティネーションデータセットであるGoogle Cloud Storageデータセットを選択します。
- Talend Cloud Pipeline Designerの上部ツールバーで[Run] (実行)ボタンをクリックするとパネルが開き、実行プロファイルを選択できるようになります。
- リストで実行プロファイルを選択し(詳細は実行プロファイルをご覧ください)、[Run] (実行)をクリックしてパイプラインを実行します。
タスクの結果
パイプラインが実行中となります。Snowflakeテーブルの11行目からの行がすべてGoogle Cloud Storageのファイルにコピーされ、ODATA APIを経由して5行ずつ取得されます。