Zrozumienie uczenia maszynowego
Uczenie maszynowe to praktyka polegająca na wykorzystywaniu algorytmów matematycznych do rozpoznawania wzorców w danych, a następnie wykorzystywaniu tych wzorców do tworzenia prognoz.
Prosty przykład: Prognozowanie sprzedaży
Aby lepiej zrozumieć uczenie maszynowe, spójrzmy na prosty przykład prognozowania sprzedaży produktu w następnym kwartale. Możemy wiedzieć, że na sprzedaż tego produktu wpływa to, ile pieniędzy wydaje się na jego reklamę. Analizując dane z poprzednich kwartałów, wiemy:
-
Ile pieniędzy wydano (w tysiącach dolarów) na reklamę produktu w telewizji.
-
Jaka była sprzedaż (w milionach dolarów).
Kiedy przedstawimy dane na wykresie, staje się oczywiste, że im więcej pieniędzy wydajemy na reklamę naszego produktu w telewizji, tym więcej sprzedajemy.
Wykres sprzedaży w stosunku do wydatków na reklamę telewizyjną

Aby prognozować przychody ze sprzedaży w następnym kwartale biznesowym, możemy dopasować funkcję do danych historycznych:
Funkcja liniowa jest dopasowana do danych

Na podstawie kwoty, którą zaplanowaliśmy w budżecie na reklamę telewizyjną w następnym kwartale biznesowym, możemy obliczyć wartość funkcji dla tej kwoty. Załóżmy, że w następnym kwartale planujemy wydać 225 000 USD na reklamę telewizyjną. Obliczenie wartości funkcji dla 225 daje nam 17,7, co pozwala nam prognozować sprzedaż na poziomie 17,7 miliona USD w następnym kwartale.
Funkcja jest obliczana w celu prognozowania sprzedaży dla określonej kwoty wydanej na reklamę

Aby jeszcze bardziej poprawić dokładność naszej prognozy, możemy spróbować znaleźć funkcję, która lepiej pasuje do danych historycznych — jak pokazano na rysunku — i na jej podstawie tworzyć prognozy.
Funkcja, która jest lepiej dopasowana do danych

W tym przykładzie przyjrzeliśmy się tylko kwocie wydanej na reklamę telewizyjną. Moglibyśmy również wziąć pod uwagę inne czynniki, które wpływają na przyszłą sprzedaż. Zamiast traktować sprzedaż jako funkcję wyłącznie wydatków na reklamę telewizyjną, moglibyśmy na przykład potraktować sprzedaż jako funkcję trzech zmiennych: wydatków na reklamę telewizyjną, wydatków na reklamę radiową i wydatków na reklamę w prasie. Możemy użyć tylu zmiennych, ilu chcemy, ale ogólna idea pozostaje taka sama.
Pojęcia związane z uczeniem maszynowym
Z perspektywy danych problem uczenia maszynowego sprowadza się do skompilowania tabeli z danymi historycznymi. W tabeli mamy jedną kolumnę reprezentującą to, co chcemy prognozować, co w naszym poprzednim przykładzie oznaczało sprzedaż. W języku uczenia maszynowego ta kolumna nazywana jest celem. Pozostałe kolumny nazywane są cechami i służą do prognozowania wartości kolumny celu. Cechy to zmienne, które mogą potencjalnie przyczynić się do wyniku docelowego. Podstawowa idea uczenia maszynowego to:
Mając dany zestaw danych, znajdujemy funkcję, która pasuje do tych danych, abyśmy mogli prognozować, jaka będzie wartość dla kolumny celu, biorąc pod uwagę wartości dla kolumn cech.
Opracowano kilka zaawansowanych algorytmów uczenia maszynowego w celu rozwiązywania różnych rodzajów problemów związanych z uczeniem maszynowym. Kiedy wprowadzamy dane do algorytmu uczenia maszynowego i pozwalamy mu uczyć się wzorców, mówimy, że trenujemy algorytm uczenia maszynowego.
W Qlik Predict problemy uczenia maszynowego są podzielone na problemy klasyfikacji, regresji lub szeregów czasowych, w zależności od tego:
-
Czy cel do prognozowania jest wartością kategorialną, czy liczbową. Zobacz przykłady w Problemy z klasyfikacją i Problemy związane z regresją.
-
Czy musisz prognozować dane dla określonych przyszłych okresów. Zobacz przykład w Problemy szeregów czasowych.
Zautomatyzowane uczenie maszynowe
Dzięki zautomatyzowanemu uczeniu maszynowemu najlepiej dopasowane funkcje są znajdowane automatycznie podczas trenowania na danych historycznych. Możesz łatwo przesłać zestaw danych, wybrać cel, a następnie rozpocząć trenowanie za naciśnięciem jednego przycisku.
Jednak dobre wyniki prognozowania uzyskasz tylko wtedy, gdy masz dobre dane wejściowe. Eksperyment uczenia maszynowego wymaga dobrze zdefiniowanego pytania dotyczącego uczenia maszynowego i zestawu danych zaprojektowanego tak, aby na nie odpowiedzieć. Aby rozpocząć swój pierwszy eksperyment, wykonaj następujące kroki:
- Zdefiniuj pytanie dotyczące uczenia maszynowego
Przekształć swój przypadek użycia biznesowego w konkretne pytanie, korzystając z ustrukturyzowanych ram.
- Przygotuj zestaw danych treningowych
Zbierz dobrej jakości dane, które są istotne dla Twojego przypadku użycia.
- Utwórz eksperyment zautomatyzowanego uczenia maszynowego
Po zakończeniu przygotowań możesz rozpocząć eksperymentowanie.