Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Na czym polega uczenie maszynowe

Uczenie maszynowe polega na stosowaniu algorytmów matematycznych do rozpoznawania wzorów w danych, a następnie wykorzystywania tych wzorów do predykcji.

Prosty przykład: Przewidywanie sprzedaży

Aby lepiej zrozumieć uczenie maszynowe, spójrzmy na prosty przykład, w którym przewiduje się sprzedaż produktu w następnym kwartale. Możemy wiedzieć, że sprzedaż tego produktu zależy od ilości pieniędzy wydanych na jego reklamę. Patrząc na dane z poprzednich kwartałów, wiemy:

  • Ile pieniędzy wydaje się (w tysiącach dolarów) na reklamę produktu w telewizji.

  • Jaka była sprzedaż (w milionach dolarów).

Kiedy naniesiemy dane na wykres, staje się oczywiste, że im więcej pieniędzy wydajemy na reklamę produktu w telewizji, tym więcej go sprzedajemy.

Wykres sprzedaży w porównaniu z wydatkami na reklamę telewizyjną

Wykres sprzedaży w porównaniu z wydatkami na reklamę telewizyjną.

Aby przewidzieć przychody ze sprzedaży w następnym kwartale biznesowym, możemy dopasować funkcję do danych historycznych:

Funkcja liniowa jest dopasowana do danych

Wykres sprzedaży w odniesieniu do wydatków na reklamę telewizyjną z funkcją liniową.

Na podstawie kwoty, którą zaplanowaliśmy wydać na reklamę telewizyjną w następnym kwartale biznesowym, możemy oszacować tę funkcję według wartości odpowiadającej tej kwocie. Załóżmy, że w przyszłym kwartale na reklamę telewizyjną planujemy wydać 225 000 USD. Ocena funkcji na poziomie 225 daje nam 17,7 i możemy prognozować 17,7 miliona dolarów sprzedaży w następnym kwartale.

Funkcja jest oceniana w celu prognozowania sprzedaży na podstawie określonej kwoty wydanej na reklamę

Wykres sprzedaży w odniesieniu do wydatków na reklamę telewizyjną z oceną punktu przy użyciu funkcji liniowej.

Aby jeszcze bardziej poprawić dokładność predykcji, możemy spróbować znaleźć funkcję, która lepiej pasuje do danych historycznych — jak pokazano na ilustracji — i dokonać predykcji na podstawie tej funkcji.

Funkcja lepiej dopasowana do danych

Wykres sprzedaży w odniesieniu do wydatków na reklamę telewizyjną z funkcją nieliniową.

W tym przykładzie przyjrzeliśmy się tylko kwocie pieniędzy wydanych na reklamę telewizyjną. Możemy również rozważyć inne czynniki, które wpływają na przyszłą sprzedaż. Zamiast przedstawiać sprzedaż jako funkcję samych wydatków na reklamę telewizyjną, moglibyśmy traktować sprzedaż jako funkcję trzech zmiennych: wydatków na reklamę telewizyjną, wydatków na reklamę radiową i wydatków na reklamę prasową. Możemy użyć dowolnej liczby zmiennych, ale ogólna idea jest taka sama.

Pojęcia związane z uczeniem maszynowym

Z perspektywy danych problem uczenia maszynowego sprowadza się do sporządzenia tabeli z danymi historycznymi. Mamy jedną kolumnę w tabeli reprezentującą to, co chcemy przewidzieć — w naszym poprzednim przykładzie była to sprzedaż. W języku uczenia maszynowego ta kolumna nazywa się celem. Pozostałe kolumny nazywane są cechami i służą do przewidywania wartości kolumny celu. Cechy to zmienne, które mogą przyczynić się do osiągnięcia docelowego wyniku. Zasadnicza idea uczenia maszynowego jest następująca:

Mając zestaw danych, znajdujemy funkcję, która pasuje do tych danych, dzięki czemu możemy przewidzieć wartość kolumny celu na podstawie wartości kolumn cech.

Do rozwiązywania różnych problemów związanych z uczeniem maszynowym opracowano kilka zaawansowanych algorytmów. Kiedy przekazujemy dane algorytmowi uczenia maszynowego i pozwalamy mu rozpoznawać wzorce, mówimy, że uczymy algorytm uczenia maszynowego.

Problemy uczenia maszynowego dzielą się na problemy z regresją lub problemy z klasyfikacją w zależności od tego, czy przewidywany cel jest wartością liczbową, czy kategorialną. Zobacz przykłady w tematach Problemy z klasyfikacją i Problemy związane z regresją.

Zautomatyzowane uczenie maszynowe

Dzięki zautomatyzowanemu uczeniu maszynowemu najlepiej pasujące funkcje są automatycznie znajdowane podczas uczenia na podstawie danych historycznych. Jednym kliknięciem możesz łatwo przesłać zestaw danych, wybrać cel, a następnie rozpocząć uczenie.

Dobre wyniki predykcyjne uzyskasz jednak tylko wtedy, gdy masz dobre dane wejściowe. Eksperyment uczenia maszynowego wymaga dobrze zdefiniowanego pytania i zestawu danych przygotowanego w celu udzielenia odpowiedzi na to pytanie. Aby rozpocząć pierwszy eksperyment, wykonaj następujące kroki:

  1. Zdefiniowanie pytania uczenia maszynowego

    Zmień swój przypadek biznesowy w konkretne pytanie, korzystając ze struktury.

    Definiowanie pytań uczenia maszynowego

  2. Przygotowanie zestawu danych do uczenia

    Zbierz dane dobrej jakości, które są istotne dla Twojego przypadku.

    Przygotowywanie zestawu danych do uczenia

  3. Utwórz zautomatyzowany eksperyment uczenia maszynowego

    Po zakończeniu przygotowań możesz zacząć eksperymentować.

    Praca z eksperymentami

POWIĄZANE MATERIAŁY EDUKACYJNE:

Dowiedz się więcej

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać, co możemy poprawić!