Urvalsprocessor
Behåller endast de första raderna eller en slumpmässig delmängd av rader.
Urvals-processorn låter dig välja ett specifikt antal eller en procentandel av poster från ditt inmatningsflöde och göra dataurvalet mer representativt för hela datamängden.
Användning
-
Urvals-processorn kräver ett inmatningsflöde och kan bara generera ett utmatningsflöde.
-
Att använda denna processor kommer att avsortera data om en Sorterings-processor användes i inmatningsflödet.
Egenskaper
Egenskaper att konfigurera för att välja en delmängd av poster från inmatningen.
| Egenskap | Konfiguration |
|---|---|
| Urvalsmetod |
Välj om du vill extrahera ett fast antal rader eller en procentandel av det totala antalet rader från indataflödet:
|
| Antal rader som ska extraheras | Ange antalet rader som ska behållas. |
| Urvalsförhållande (%) | Ange procentandelen rader som ska behållas. |
| Stratifikationsfält | Från rullgardinslistan väljer du fältet som ska användas som stratum. |
Om du vill byta namn på processorn eller redigera dess beskrivning för du musen över namnet eller beskrivningen i panelen Egenskaper och klickar på ikonen Redigera.
Exempel
I det här exemplet arbetar du med en datamängd som innehåller information om försäljningstransaktioner från tre regioner: Öst, Väst och Central.
För närvarande innehåller urvalet 20 rader, men du vill minska dess storlek samtidigt som du säkerställer att varje region är jämnt representerad i de samplade data. Du kommer att använda processorn Sample för att ändra storleken på urvalet.
I processorns egenskaper väljer du Slumpmässig stratifierad sampling som samplingsmetod, ställer in Samplingsförhållande (%) till 50 och väljer Region som stratumfält.
Att ställa in den stratifierade samplingen till 50 % innebär att urvalet kommer att innehålla ungefär hälften av raderna från varje region efter avrundning.
I processorns utdata innehåller urvalet nu endast ungefär hälften av raderna från originalet, samtidigt som samma fördelning av regioner bibehålls.