Przykłady funkcji klasyfikacji wykresu
W podanych przykładach wykorzystano funkcję rank (VRank), ale można ją podobnie zastosować do funkcji HRank. Należy jednak pamiętać, że funkcje HRank dotyczy tylko tabel przestawnych.
Przykład 1:
Przeanalizujmy dwie jednowymiarowe tabele proste poniżej:
Month | sum(Val) | rank(sum(Val)) |
---|---|---|
- | 110 | - |
1 | 17 | 3 |
2 | 9 | 7 |
3 | 22 | 1 |
4 | 16 | 4 |
5 | 10 | 6 |
6 | 5 | 8 |
7 | 11 | 5 |
8 | 20 | 2 |
Month | sum(Val) | rank(sum(Val)) |
---|---|---|
- | 110 | - |
3 | 22 | 1 |
8 | 20 | 2 |
1 | 17 | 3 |
4 | 16 | 4 |
7 | 11 | 5 |
5 | 10 | 6 |
2 | 9 | 7 |
6 | 5 | 8 |
Obie tabele są takie same, ale pierwsza jest posortowana według pierwszej kolumny, a druga według ostatniej kolumny. Jest to przykład podstawowego działania funkcji rank. Najwyższa wartość jest sklasyfikowana najwyżej (najniższy numer klasyfikacji).
Funkcja rank zawsze zwraca NULL w wierszach sumy.
Przykład 2:
Przeanalizujmy poniższą dwuwymiarową tabelę przestawną:
Group | Month | sum(Val) | rank(sum(Val)) | rank(total sum(Val)) |
---|---|---|---|---|
A | 1 | 17 | 2 | 3 |
A | 4 | 16 | 3 | 4 |
A | 7 | 11 | 4 | 5 |
A | 8 | 20 | 1 | 2 |
A | Suma | 64 | - | - |
B | 2 | 9 | 3 | 7 |
B | 3 | 22 | 1 | 1 |
B | 5 | 10 | 2 | 6 |
B | 6 | 5 | 4 | 8 |
B | Suma | 46 | - | - |
Suma | - | 110 | - | - |
Ta tabela opiera się na tych samych danych co dwie tabele w pierwszym przykładzie. Teraz można zobaczyć, dlaczego bieżący segment kolumny jest wewnętrznym zgrupowaniem w przypadku wielowymiarowym. Pole Month w obrębie grupy A jest klasyfikowane oddzielnie od pola Month w grupie B. Wprowadzając kwalifikator total, można ponownie uzyskać ogólną klasyfikację.
Przykład 3:
Na tym przykładzie przedstawiony zostanie wpływ stosowania różnych trybów w numerycznej reprezentacji klasyfikacji. Przeanalizujmy poniższą tabelę:
Month | sum(X) | rank(sum(X)) | mode=0 | mode=1 | mode=2 | mode=3 | mode=4 |
---|---|---|---|---|---|---|---|
- | 86 | - | - | - | - | - | - |
4 | 20 | 1 | 1 | 1 | 1 | 1 | 1 |
2 | 12 | 2-3 | 2 | 2 | 2.5 | 3 | 2 |
7 | 12 | 2-3 | 2 | 2 | 2.5 | 3 | 3 |
3 | 10 | 4-5 | 4.5 | 4 | 4.5 | 5 | 5 |
5 | 10 | 4-5 | 4.5 | 4 | 4.5 | 5 | 4 |
8 | 9 | 6 | 6 | 6 | 6 | 6 | 6 |
6 | 7 | 7 | 7 | 7 | 7 | 7 | 7 |
1 | 6 | 8 | 8 | 8 | 8 | 8 | 8 |
W trzeciej kolumnie pokazywana jest klasyfikacja w reprezentacji tekstowej, natomiast w kolumnach 4–8 pokazywana jest reprezentacja liczbowa tej samej klasyfikacji w różnych trybach. Wyrażenie w każdej kolumnie to:
num( rank( sum( X ), mode ))
gdzie mode to wartość z zakresu od 0 do 4:
- Mode 0 (domyślnie) Wiersze 2 i 3 mają tę samą klasyfikację, ale wyraźnie znajdują się w niższej połowie klasyfikacji łącznej. Ich reprezentacja liczbowa jest zatem zaokrąglona w dół do 2. Wiersze 4 i 5 również mają tę samą klasyfikację, ale plasują się nieco powyżej środka tabeli klasyfikacji. A zatem otrzymują one reprezentację liczbową średniej pierwszej i ostatniej klasyfikacji w kolumnie ((1+8)/2=4,5). Ten tryb jest szczególnie przydatny podczas korzystania z Podpowiedzi wizualnych w celu zaznaczenia najwyższej i najniższej klasyfikacji danych w grupie.
- Mode 1 W obu przypadkach używana jest niższa wartość klasyfikacji w obrębie grupy, tzn. 2 dla wierszy 2 i 3 oraz 4 dla wierszy 4 i 5.
- Mode 2 W obu przypadkach używana jest średnia dolnej i górnej wartości klasyfikacji w obrębie grupy, tzn. 2,5 ((2+3)/2) dla wierszy 2 i 3 oraz 4,5 ((4+5)/2) dla wierszy 4 i 5.
- Mode 3 W obu przypadkach używana jest wyższa wartość klasyfikacji w obrębie grupy, tzn. 3 dla wierszy 2 i 3 oraz 5 dla wierszy 4 i 5.
- Mode 4 Do każdego wiersza przydzielona jest własna odrębna wartość liczbowa. Kolejność w obrębie grup o tej samej klasyfikacji jest określana przez kolejność sortowania wymiarów wykresu.
Przykład 4:
Na tym przykładzie przedstawiony zostanie efekt różnych formatów w tekstowej reprezentacji funkcji klasyfikacji. Przeanalizujmy poniższą tabelę:
Month | sum(X) | rank(sum(X),0,0) | rank(sum(X),0,1) | rank(sum(X),0,2) |
---|---|---|---|---|
- | 86 | - | - | - |
4 | 20 | 1 | 1 | 1 |
2 | 12 | 2-3 | 2 | 2 |
7 | 12 | 2-3 | 2 | - |
3 | 10 | 4-5 | 4 | - |
5 | 10 | 4-5 | 4 | 4 |
8 | 9 | 6 | 6 | 6 |
6 | 7 | 7 | 7 | 7 |
1 | 6 | 8 | 8 | 8 |
Kolumny 3–5 pokazują tekstową reprezentację tej samej funkcji klasyfikacji z różnymi wartościami format, gdzie format to wartość z zakresu od 0 do 2:
- Format 0 (domyślny) Wiersze o tej samej klasyfikacji są pokazywane jako „dolna wartość–górna wartość”, tzn. „2–3” i „4–5”.
- Format 1 Wiersze o tej samej klasyfikacji zawsze otrzymują numer najniższej klasyfikacji jako reprezentację tekstową, w tym przypadku np. 2 dla wierszy 2 i 3.
- Format 2 Jeden wiersz w każdej grupie o tej samej klasyfikacji otrzymuje numer dolnej klasyfikacji jako reprezentację tekstową, natomiast inne wiersze w obrębie grupy otrzymują ciąg pusty. Kolejność w obrębie grup o tej samej klasyfikacji jest określana przez kolejność sortowania wymiarów wykresu.