Tutorial: met Qlik AutoML een voorspellingsapp aanmaken
In deze zelfstudie leert u hoe u Qlik AutoML gebruikt om gegevens te analyseren en apps te maken om voorspellingsgegevens die met het platform zijn gemaakt, inzichtelijk te maken.
We gaan het hebben over het klantenverloop-scenario, een klassiek voorbeeld van een probleem rond binaire classificering. Het doel is om een betrouwbare voorspelling te krijgen of een klant al dan niet zijn of haar abonnement op een service zal beëindigen. Er zijn slechts twee uitkomsten voor dit type probleem: waar of niet waar (vertrokken of niet vertrokken).
Voor dit machine learning-probleem beginnen we door een reeks gegevens te verwerken waarvoor we de uitkomst al weten. Vervolgens passen we statistische modellen op basis van die gegevens toe op nieuwe gegevens waarvoor we de uitkomsten willen voorspellen. Dit is de benadering die we in deze zelfstudie zullen gebruiken.
Om betrouwbare en nauwkeurige modellen te maken, moet u er zeker van zijn dat uw gegevensverzameling voor training niet lekt en dat er geen 'lekkende kenmerken' in zitten. Datalekken treden op als een of meerdere kenmerken van de trainingdata kunnen worden gebruikt voor het afleiden van de doelvariabele die u probeert te voorspellen, of als een of meerdere kenmerken van de trainingdata informatie bevat die op het moment van de voorspelling niet bekend kan zijn.
U begint deze zelfstudie door een experiment te maken. Van daaruit verfijnt u het experiment en past u het toe op een machine learning-model. Dit model wordt gebruikt om voorspellingen te doen die kunnen worden getoond in de vorm van visualisaties in een Qlik Sense-app.
Wat u gaat leren
Na deze zelfstudie weet u welke stappen gepaard gaan met het maken en configureren van een experiment. U leert tevens hoe u modelscores moet interpreteren. Tot slot leert u een machine learning-model te implementeren en hoe uw voorspellingsgegevens kunnen worden gebruikt om aantrekkelijke diagramen te genereren in Qlik Cloud.
Voor wie is deze zelfstudie?
Deze zelfstudie is bedoeld voor gebruikers die graag willen kennismaken met geautomatiseerde machine learning in Qlik Cloud.
Wat u eerst moet doen
Download dit pakket en pak het uit op uw bureaublad:
Het pakket bevat de twee gegevensbestanden die u nodig hebt om deze zelfstudie af te ronden. Upload de gegevensbestanden naar de catalogus.
De dataset voor de training bevat informatie over klanten voor wie de deadline voor verlenging al is verlopen en die de beslissing hebben gemaakt om al dan niet hun abonnement op de service op te zeggen.
De toe te passen dataset bevat informatie over een nieuwe groep klanten voor wie de deadline voor verlenging nog niet is verlopen. Het is nog niet duidelijk of deze klanten hun abonnement zullen opzeggen of niet. Het doel in deze zelfstudie is om te voorspellen wat deze groep klanten zal gaan doen, in de hoop dat we de kans dat ze zullen vertrekken kunnen verkleinen.
Doe het volgende:
-
Open de Qlik Sense-hub.
-
Klik op Nieuwe toevoegen > Dataset, en selecteer vervolgens Databestand uploaden.
-
Sleep het bestand Customer churn data - training.csv naar het uploaddialoogvenster.
-
Sleep vervolgens het bestand Customer churn data - apply.csv naar het uploaddialoogvenster.
-
Selecteer een ruimte. Dit kan uw persoonlijke ruimte zijn of een gedeelde ruimte als u wilt dat andere gebruikers toegang hebben tot deze gegevens.
-
Klik op Uploaden.
Nu dat uw datasets geüpload zijn, kunt u beginnen met het aanmaken van een experiment.
Lessen in deze zelfstudie
De onderwerpen in deze zelfstudie zijn bedoeld om achtereenvolgens door te nemen. U kunt echter op elk gewenst moment stoppen om de zelfstudie later weer te hervatten.
Verdere leesmaterialen en bronnen
- Qlik biedt een groot aantal bronnen, voor het geval u nog meer wilt leren.
- De Qlik online help is beschikbaar.
- Training, inclusief gratis online cursussen, is beschikbaar in de Qlik Continuous Classroom.
- Discussieforums, blogs, en meer kunt u vinden in de Qlik Community.
Uw mening is belangrijk
Wij waarderen elke vorm van feedback die u hebt. Gebruik de onderstaande sectie om uw beoordeling te geven.