Na czym polega uczenie maszynowe
Uczenie maszynowe polega na stosowaniu algorytmów matematycznych do rozpoznawania wzorów w danych, a następnie wykorzystywania tych wzorów do predykcji.
Prosty przykład: Przewidywanie sprzedaży
Aby lepiej zrozumieć uczenie maszynowe, spójrzmy na prosty przykład, w którym przewiduje się sprzedaż produktu w następnym kwartale. Możemy wiedzieć, że sprzedaż tego produktu zależy od ilości pieniędzy wydanych na jego reklamę. Patrząc na dane z poprzednich kwartałów, wiemy:
-
Ile pieniędzy wydaje się (w tysiącach dolarów) na reklamę produktu w telewizji.
-
Jaka była sprzedaż (w milionach dolarów).
Kiedy naniesiemy dane na wykres, staje się oczywiste, że im więcej pieniędzy wydajemy na reklamę produktu w telewizji, tym więcej go sprzedajemy.
Aby przewidzieć przychody ze sprzedaży w następnym kwartale biznesowym, możemy dopasować funkcję do danych historycznych:
Na podstawie kwoty, którą zaplanowaliśmy wydać na reklamę telewizyjną w następnym kwartale biznesowym, możemy oszacować tę funkcję według wartości odpowiadającej tej kwocie. Załóżmy, że w przyszłym kwartale na reklamę telewizyjną planujemy wydać 225 000 USD. Ocena funkcji na poziomie 225 daje nam 17,7 i możemy prognozować 17,7 miliona dolarów sprzedaży w następnym kwartale.
Aby jeszcze bardziej poprawić dokładność predykcji, możemy spróbować znaleźć funkcję, która lepiej pasuje do danych historycznych — jak pokazano na ilustracji — i dokonać predykcji na podstawie tej funkcji.
W tym przykładzie przyjrzeliśmy się tylko kwocie pieniędzy wydanych na reklamę telewizyjną. Możemy również rozważyć inne czynniki, które wpływają na przyszłą sprzedaż. Zamiast przedstawiać sprzedaż jako funkcję samych wydatków na reklamę telewizyjną, moglibyśmy traktować sprzedaż jako funkcję trzech zmiennych: wydatków na reklamę telewizyjną, wydatków na reklamę radiową i wydatków na reklamę prasową. Możemy użyć dowolnej liczby zmiennych, ale ogólna idea jest taka sama.
Pojęcia związane z uczeniem maszynowym
Z perspektywy danych problem uczenia maszynowego sprowadza się do sporządzenia tabeli z danymi historycznymi. Mamy jedną kolumnę w tabeli reprezentującą to, co chcemy przewidzieć — w naszym poprzednim przykładzie była to sprzedaż. W języku uczenia maszynowego ta kolumna nazywa się celem. Pozostałe kolumny nazywane są cechami i służą do przewidywania wartości kolumny celu. Cechy to zmienne, które mogą przyczynić się do osiągnięcia docelowego wyniku. Zasadnicza idea uczenia maszynowego jest następująca:
Mając zestaw danych, znajdujemy funkcję, która pasuje do tych danych, dzięki czemu możemy przewidzieć wartość kolumny celu na podstawie wartości kolumn cech.
Do rozwiązywania różnych problemów związanych z uczeniem maszynowym opracowano kilka zaawansowanych algorytmów. Kiedy przekazujemy dane algorytmowi uczenia maszynowego i pozwalamy mu rozpoznawać wzorce, mówimy, że uczymy algorytm uczenia maszynowego.
Problemy uczenia maszynowego dzielą się na problemy z regresją lub problemy z klasyfikacją w zależności od tego, czy przewidywany cel jest wartością liczbową, czy kategorialną. Zobacz przykłady w tematach Problemy z klasyfikacją i Problemy związane z regresją.
Zautomatyzowane uczenie maszynowe
Dzięki zautomatyzowanemu uczeniu maszynowemu najlepiej pasujące funkcje są automatycznie znajdowane podczas uczenia na podstawie danych historycznych. Jednym kliknięciem możesz łatwo przesłać zestaw danych, wybrać cel, a następnie rozpocząć uczenie.
Dobre wyniki predykcyjne uzyskasz jednak tylko wtedy, gdy masz dobre dane wejściowe. Eksperyment uczenia maszynowego wymaga dobrze zdefiniowanego pytania i zestawu danych przygotowanego w celu udzielenia odpowiedzi na to pytanie. Aby rozpocząć pierwszy eksperyment, wykonaj następujące kroki:
- Zdefiniowanie pytania uczenia maszynowego
Zmień swój przypadek biznesowy w konkretne pytanie, korzystając ze struktury.
- Przygotowanie zestawu danych do uczenia
Zbierz dane dobrej jakości, które są istotne dla Twojego przypadku.
- Utwórz zautomatyzowany eksperyment uczenia maszynowego
Po zakończeniu przygotowań możesz zacząć eksperymentować.