Meer informatie over machine learning
Machine learning is de praktijk van het gebruik van wiskundige algoritmes om patronen in gegevens te herkennen en deze patronen vervolgens te gebruiken om voorspellingen te maken.
Een eenvoudig voorbeeld: voorspelling van verkoop
Om machine learning beter te begrijpen, kunnen we kijken naar een eenvoudig voorbeeld waarin de verkoop van een product voor het volgende kwartaal wordt voorspeld. We weten wellicht dat de verkoop van dit product wordt beïnvloed door hoeveel geld wordt besteed aan de reclame voor het product. Door naar de gegevens uit de voorgaande kwartalen te kijken, weten we het volgende:
-
Hoeveel geld is besteed (in duizenden dollars) aan televisiereclame voor het product.
-
Hoeveel er is verkocht (in miljoenen dollars).
Wanneer we de gegevens in kaart brengen, is het duidelijk dat hoe meer geld wordt besteed aan televisiereclame voor ons product, des te meer we ervan verkopen.
Om de verkoopinkomsten te voorspellen voor het volgende kwartaal, kunnen we een functie afstemmen op de historische gegevens:
Op basis van het bedrag hebben we gebudgetteerd om in het komende kwartaal geld te besteden aan televisiereclame. We kunnen de functie evalueren op de waarde die overeenkomt met dit bedrag. Stel dat we van plan zijn om in het komende kwartaal USD 225.000 te besteden aan adverteren op televisie. Evaluatie van de functie op 225 geeft ons 17,7, en we kunnen USD 17,7 miljoen aan verkoop voorspellen voor het volgende kwartaal.
Om de nauwkeurigheid van onze voorspelling nog verder te verbeteren, kunnen we proberen een functie te vinden die beter bij de historische gegevens past, zoals te zien in de figuur, en om voorspellingen te doen op basis van deze functie.
In dit voorbeeld hebben we alleen gekeken naar hoeveel geld is besteed aan televisiereclame. We zouden ook naar andere factoren kunnen kijken die invloed hebben op toekomstige verkoop. In plaats van alleen verkoop als een functie van besteding aan televisiereclame, zouden we bijvoorbeeld verkoop als een functie van drie variabelen kunnen hebben: besteding aan televisiereclame, aan radioreclame en advertenties in de krant. We kunnen zo veel variabelen gebruiken als we willen, maar het principe is hetzelfde.
Machine learning-concepten
Vanuit een gegevensperspectief, wordt het probleem met machine learning verkleind tot de samenstelling van een tabel met historische gegevens. We hebben één kolom in de tabel die vertegenwoordigt wat we willen voorspellen. In ons vorige voorbeeld was dit verkoop. In de taal van machine learning heet deze kolom het doel. De overige kolommen heten kenmerken en worden gebruikt om de waarde van de doelkolom te voorspellen. De kenmerken zijn variabelen die mogelijk kunnen bijdragen aan de uitkomst van het doel. Het fundamentele idee achter machine learning is:
Zodra we een gegevensverzameling hebben, zoeken we een functie die bij die gegevens past zodat we de waarde voor de doelkolom kunnen voorspellen op basis van de waarden van de kenmerkkolommen.
Verschillende, geavanceerde machine learning-algoritmen zijn ontwikkeld om verschillende soorten machine learning-problemen op te lossen. Wanneer we gegevens in een machine learning-algoritme invoeren en het patronen laten leren, hebben we het over de training van een machine learning-algoritme.
Machine learning-problemen worden onderverdeeld in regressieproblemen en classificatieproblemen, afhankelijk van of het doel dat we willen voorspellen een numerieke of categorische waarde is. Bekijk voorbeelden van Classificatieproblemen en Regressieproblemen.
Geautomatiseerde machine learning
Met geautomatiseerde machine learning worden de best passende functies automatisch opgezocht tijdens de training met uw historische gegevens. U kunt een gegevensverzameling heel eenvoudig uploaden. Daarna selecteert u een doel vervolgens start u de training met één druk op de knop.
Maar u kunt alleen een goede voorspellende output krijgen als u een goede input hebt. Voor een machine learning-experiment is een goed gedefinieerde machine learning-vraag nodig en een gegevensverzameling die is opgezet om die vraag te beantwoorden. Om aan de slag te gaan met uw eerste experiment, gaat u als volgt te werk:
- Definieer een machine learning-vraag
Zet uw use case om in een specifieke vraag met behulp van een gestructureerd kader.
- Uw trainingsgegevensverzameling voorbereiden
Verzamel gegevens van goede kwaliteit die relevant zijn voor uw use case.
- Een geautomatiseerd machine learning-experiment maken
Wanneer de voorbereidingen klaar zijn, kunt u beginnen met experimenteren.