Ga naar hoofdinhoud Ga naar aanvullende inhoud

Sample-processor

Behoud alleen de eerste rijen of een willekeurige subset van rijen.

De Sample-processor stelt u in staat om een specifiek aantal of percentage records uit uw invoerstroom te selecteren en het datamonster representatiever te maken voor de gehele dataset.

Gebruik

  • De Sample-processor heeft één invoerstroom nodig en kan slechts één uitvoerstroom genereren.

  • Het gebruik van deze processor zal de gegevens ongesorteerd maken als een Sort-processor werd gebruikt in de invoerstroom.

Eigenschappen

Eigenschappen om te configureren om een subset van records uit de invoer te selecteren.

Configuratie
Eigenschap Configuratie
Steekproefmethode

Selecteer of u een vast aantal rijen of een percentage van het totale aantal rijen uit de invoerstroom wilt extraheren:

  • Willekeurige rijen: Behoudt een percentage van de rijen uit uw hele dataset.

  • Eerste rijen: Behoudt een vast aantal rijen vanaf het begin van uw dataset.

  • Vast aantal willekeurige rijen: Behoudt willekeurig een vast aantal rijen uit uw hele dataset.

  • Willekeurige gestratificeerde steekproeftrekking: Behoudt het gekozen percentage rijen voor elke waarde van het stratumveld.

    InformatieDoor afronding kan het gebruik van deze methode leiden tot aanzienlijke afwijkingen van het verwachte totale aantal rijen, vooral bij het selecteren van kleine strata. Bovendien worden strata met slechts één rij mogelijk helemaal niet weergegeven in de uitvoer als het percentage rijen dat moet worden gesampled laag is.
Aantal rijen om te extraheren Voer het aantal rijen in dat moet worden behouden.
Steekproefverhouding (%) Voer het percentage rijen in dat moet worden behouden.
Stratumveld Selecteer in de vervolgkeuzelijst het veld dat moet worden gebruikt als stratum.

Om de naam van de processor te wijzigen of de beschrijving te bewerken, gaat u met de muisaanwijzer op de naam of beschrijving staan om naar het eigenschappenvenser te gaan en klikt u op het pictogram Bewerken Bewerken.

Voorbeeld

In dit voorbeeld werkt u met een dataset die informatie bevat over verkooptransacties uit drie regio's: Oost, West en Centraal.

gegevensverzameling met klantgegevens

Momenteel bevat de steekproef 20 rijen, maar u wilt de omvang ervan verkleinen, terwijl u ervoor zorgt dat elke regio gelijkmatig wordt vertegenwoordigd in de bemonsterde gegevens. U gebruikt de processor Steekproef om de omvang van de steekproef te wijzigen.

Selecteer in de processoreigenschappen Willekeurige gestratificeerde steekproeftrekking als bemonsteringsmethode, stel de Steekproefverhouding (%) in op 50 en selecteer Regio als stratumveld.

Het instellen van de gestratificeerde steekproeftrekking op 50% betekent dat de steekproef na afronding ongeveer de helft van de rijen uit elke regio zal bevatten.

een gegevensstroomconfiguratie om de dataset per regio te samplen

In de uitvoer van de processor bevat de steekproef nu nog maar ongeveer de helft van de rijen van het origineel, met behoud van dezelfde distributie van regio's.

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een tikfout, een ontbrekende stap of een technische fout – laat het ons weten!