Het experiment maken en configureren
De eerste stap is om het experiment te maken en configureren. U gebruikt de gegevensverzameling voor training die u eerder hebt geüpload om het model te trainen tot het klaar is om te worden ingezet om voorspellingen te maken.
Een nieuw experiment maken
Doe het volgende:
-
Ga naar de pagina Maken van het Analyse-activiteitencentrum en selecteer ML-experiment.
-
Voer een naam in voor uw experiment, zoals Zelfstudie klantverloop.
-
Voer desgewenst een beschrijving en tags in.
-
Kies een ruimte voor uw experiment. Dit kan uw persoonlijke ruimte of een gedeelde ruimte zijn.
-
Klik op Maken.
-
Selecteer het bestand van de trainings-gegevensverzameling. Dit is een van de volgende, afhankelijk van het feit of u werkt met CSV of QVD:
-
AutoML Tutorial - Churn data - train.csv
-
AutoML Tutorial - Churn data - train.qvd
-
De gegevens controleren
U bent nu klaar om te beginnen met de configuratie van uw experiment, maar voordat u begint, gaan we eerst de gegevensverzameling bekijken.
We starten op het tabblad Gegevens. De standaardweergave is de schemaweergave Hier zien we een tabel waarbij iedere rij een kolom in uw gegevensverzameling vertegenwoordigt. Er zijn statistieken en inzichten gegenereerd tijdens de automatische voorbereiding van de gegevens. Om de inzichten te zien, dient u mogelijk aan de rechterkant van het schema te scrollen.
We kunnen zien dat AccountID is uitgesloten vanwege een hoge kardinaliteit. Dat betekent dat de kolom te veel unieke waarden bevat. De functie Country is uitgesloten vanwege de tegenovergestelde reden: de waarde is voor alle rijen gelijk. Deze twee functies zouden geen waarde toevoegen aan de machine learning-modellen.
We zien ook dat de categorische functie Territory impact encoded is. Plaats voor meer informatie de muisaanwijzer boven de pictogrammen waarschuwing en informatie .
Klik op Gegevensweergave. In deze weergave zien we meer informatie per kolom, inclusief voorbeeldgegevens.
Een doel selecteren
We willen dat ons machine learning-model het klantenverloop voorspelt, dus we selecteren Churned, de laatste kolom van de gegevensverzameling, als ons doel.
Doe het volgende:
-
Ga terug naar de schemaweergave.
-
Plaats de muisaanwijzer boven Churned en klik op het doelpictogram dat wordt weergegeven.
In het venster voor experimentconfiguratie zien we nu dat Churned is geselecteerd. We kunnen ook zien welke functies automatisch zijn geselecteerd en uitgesloten. Omdat Churned het doel is, wordt het niet als een functie gebruikt. We zien ook dat dit experiment wordt behandeld als een binair classificatieprobleem.
Functies selecteren
Voor deze eerste uitvoering van ons experiment, voegen we alle beschikbare functies en algoritmen toe die standaard zijn geselecteerd. Maar als u nu al weet dat bepaalde functies geen invloed hebben op het doel (op basis van uw zakelijke kennis), kunt u ze nu ook deselecteren en uitsluiten van de training.
De optimalisatie-instellingen wijzigen
Intelligente modeloptimalisatie is standaard ingeschakeld. Met intelligente modeloptimalisatie identificeert en verwijdert AutoML problematische functies uit de modeltraining, om u te helpen hoogwaardige modellen te trainen, met weinig tot geen verdere iteratie. Het doel van deze zelfstudie is om u te tonen hoe u handmatig bepaalde problemen met uw functiegegevens en trainingsresultaten kunt identificeren.
Zie Voorbeeld – Trainingsmodellen met geautomatiseerde machine learning voor een voorbeeld hoe u een modellen kunt trainen met intelligente modeloptimalisatie.
Laten we intelligente modeloptimalisatie uitschakelen om handmatige verfijning te demonstreren.
Doe het volgende:
-
Vouw in het venster voor experimentconfiguratie de sectie Modeloptimalisatie uit.
-
Schakel over van Intelligent naar Handmatig.
Het experiment trainen
De configuratie is gereed en we zijn klaar om de training te starten.
Doe het volgende:
-
Klik rechtsonderaan in het experimentvenster op Experiment uitvoeren.
Als het experiment is uitgevoerd, gaan we verder met de volgende stap: controle van de resulterende metrische gegevens van het model.