メイン コンテンツをスキップする
補完的コンテンツへスキップ
Qlik.com
Community
Learning
Qlik リソース
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
閉じる
ドキュメント
クラウド
Client-Managed
追加のドキュメント
クラウド
Qlik Cloud
ホーム
紹介
Qlik Cloud の新機能
Qlik Talend Cloud について
分析
データ統合
管理
自動化
開発
他のクラウド ソリューション
Talend Cloud
Talend API Portal
Stitch
Upsolver
Client-Managed
クライアント管理 — 分析
管理者向け
Qlik Sense
開発者向け
Qlik Sense
Qlik NPrinting
Connectors
Qlik GeoAnalytics
Qlik Alerting
ユーザーと管理者向けの
QlikView
開発者向け
QlikView
Governance Dashboard
クライアント管理 — データ統合
Qlik Replicate
Qlik Compose
Qlik Enterprise Manager
Qlik Gold Client
Qlik Catalog
NodeGraph (legacy)
Talend Studio
Talend ESB
Talend Administration Center
Talend Data Catalog
Talend Data Preparation
Talend Data Stewardship
追加のドキュメント
追加のドキュメント
Qlik ドキュメンテーション アーカイブ
Talend ドキュメンテーション アーカイブ
Qlik Talend 製品のヘルプを検索
オンボーディング
分析を開始
分析ユーザーのオンボーディング
Qlik Sense で分析を開始
Qlik Cloud Analytics Standard の管理
Qlik Cloud Analytics Premium および Enterprise の管理
Qlik Sense
Business
の管理
Qlik Sense
Enterprise SaaS
の管理
Qlik Cloud Government を管理
Windows 上の
Qlik Sense
Enterprise
の管理
ビデオ
移行センター
評価ガイド
Qlik リソース
Qlik ヘルプに移動
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
検索
SearchUnify の検索をロード中
製品に関するサポートが必要な場合は、Qlik Support にお問い合わせください。
Qlik Customer Portal
メニュー
閉じる
SearchUnify の検索をロード中
製品に関するサポートが必要な場合は、Qlik Support にお問い合わせください。
Qlik Customer Portal
こちらにフィードバックをお寄せください
Talend Components
Machine Learning
Machine Learningのシナリオ
スパムをフィルタリングする分類モデルを作成
ランダムフォレストを使って分類モデルを作成する
tModelEncoderを使ってSMSテキストメッセージを特徴ベクトルに変換する
各メッセージ内の無関係な単語の重みを軽くする
このページ上
手順
Availability-note
非推奨
このコンテンツは非推奨になりました。
手順
tf_idf
とラベル表示された
tModelEncoder
コンポーネントをダブルクリックして、
[Component] (コンポーネント)
ビューを開きます。この処理で、
tModelEncoder
は出現頻度が非常に高いものの、出現しているメッセージが多すぎる単語の重みを軽くします。この種の単語は、
the
のようにテキスト分析に有意な情報をもたらさない場合が多いためです。
Tokenizer
とラベル表示された
tModelEncoder
に前述の操作を繰り返して、
Vector
型の
sms_tf_idf_vect
カラムを出力スキーマに追加し、上の画像に示すように変換を定義します。
この変換では、
tModelEncoder
は
[Inverse Document Frequency] (文献出現頻度の逆数)
を使って、5つ以上のメッセージに出現する単語の重みを軽くします。
このページは役に立ちましたか?
このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。
こちらにフィードバックをお寄せください
前のトピック
各メッセージの単語の重みを計算する
次のトピック
特徴ベクトルを組み合わせる