Processador Sample
Mantém apenas as primeiras linhas ou um subconjunto aleatório de linhas.
O processador Sample permite selecionar um número ou porcentagem específica de registros do seu fluxo de entrada e tornar a amostra de dados mais representativa de todo o conjunto de dados.
Uso
-
O processador Sample requer um fluxo de entrada e pode gerar apenas um fluxo de saída.
-
O uso desse processador irá desordenar os dados se um processador Sort tiver sido usado no fluxo de entrada.
Propriedades
Propriedades a configurar para selecionar um subconjunto de registros da entrada.
| Propriedade | Configuração |
|---|---|
| Método de amostragem |
Selecione se deseja extrair um número fixo de linhas ou uma porcentagem do total de linhas do fluxo de entrada:
|
| Número de linhas a serem extraídas | Digite o número de linhas a serem mantidas. |
| Razão de amostragem (%) | Digite a porcentagem de linhas a serem mantidas. |
| Campo de estrato | Na lista suspensa, selecione o campo a ser usado como estrato. |
Para renomear o processador ou editar sua descrição, aponte o mouse sobre o nome ou a descrição a ser alterada no painel Propriedades e clique no ícone Editar.
Exemplo
Neste exemplo, você está trabalhando com um conjunto de dados contendo informações sobre transações de vendas de três regiões: Leste, Oeste e Central.
Atualmente, a amostra contém 20 linhas, mas você gostaria de reduzir seu tamanho, garantindo que cada região esteja representada de forma equilibrada nos dados amostrados. Você usará o processador Sample para alterar o tamanho da amostra.
Nas propriedades do processador, selecione Amostragem estratificada aleatória como método de amostragem, defina a Taxa de amostragem (%) como 50 e selecione Região como campo de estrato.
Definir a amostragem estratificada em 50% significa que a amostra conterá aproximadamente metade das linhas de cada região após o arredondamento.
Na saída do processador, a amostra agora contém apenas aproximadamente metade das linhas do original, mantendo a mesma distribuição de regiões.