Experimenten configureren
De configuratie van experimenten bestaat uit het selecteren van het doel en de functies die het model zal gebruiken om het doel te voorspellen. U kunt tevens een aantal optionele instellingen configureren.
Om u te helpen bij de selectie van een doel, wordt de historische gegevensverzameling geanalyseerd en wordt een samenvatting van de statistieken weergegeven voor iedere kolom in de gegevensverzameling. Er worden verschillende automatische voorbewerkingsstappen op de gegevensverzameling toegepast om er zeker van te zijn dat er alleen geschikte gegevens worden toegevoegd. Voor meer informatie over de voorbewerking van gegevens, kunt u Geautomatiseerde voorbereiding en transformatie raadplegen.
Na het uitvoeren van v1 kunt u indien nodig nieuwe experimentversies maken om de modeltraining verder te verfijnen. Ga voor meer informatie naar Modellen verfijnen.
Vereisten en machtigingen
Raadpleeg Werken met experimenten voor meer informatie over de gebruikersvereisten voor het werken met ML-implementaties.
De interface
De volgende sectie toont hoe u door de experimentinterface kunt navigeren om uw experiment te configureren. Zie Navigeren in de experimentinterface voor meer informatie over de interface
Tabbladnavigatie
Als u een experiment maakt, wordt het tabblad Gegevens geopend. Hier kunt u het doel en de functies voor het experiment configureren.
Na het uitvoeren van ten minste één experimentversie, worden andere tabbladen zichtbaar. Met deze andere tabbladen kunt u de modellen analyseren die u binnen de versie hebt getraind. U kunt terugkeren naar het tabblad Gegevens als u opeenvolgende versies met verschillende functieselecties moet configureren.
Schemaweergave en Gegevensweergave
Op het tabblad Gegevens kunt u schakelen tussen de volgende weergaven:
-
Schemaweergave: de standaardweergave. In deze weergave wordt iedere kolom in uw gegevensverzameling vertegenwoordigd door een rij in het schema met informatie en statistieken.
-
Gegevensweergave: een alternatieve weergave die u kunt gebruiken om meer informatie en voorbeeldgegevens voor elke kolom te raadplegen.
Deelvenster Experimentconfiguratie
Klik op Configuratie weergeven om een venster te openen waar u de experimenttraining verder kunt aanpassen. U kunt het venster openen op elk tabblad dat u bekijkt. Het venster biedt een aantal aanvullende configuratieopties.
Met het venster Experimentconfiguratie kunt u het volgende doen:
-
Selecteer een doel voordat u de eerste versie gaat trainen
-
Kenmerken toevoegen of verwijderen
-
Een nieuwe versie van het experiment configureren
-
Selecteer om de trainingsgegevensverzameling te wijzigen of vernieuwen
-
Algoritmen toevoegen of verwijderen
-
Instellingen voor modeloptimalisatie wijzigen
Een doel selecteren
De doelkolom bevat de waarden waarvan u wilt dat het machine learning-model ze voorspelt. U kunt de doelkolom wijzigen tot u de eerste training start. Hierna wordt deze vergrendeld tegen bewerken.
Doe het volgende:
In Schemaweergave of Gegevensweergave, gaat u met de muiscursor op de kolom staan.
Klik op het pictogram dat verschijnt.
De doelkolom wordt nu aangeduid door en de overige beschikbare kolommen worden automatisch als functies geselecteerd.
Het doel kan eventueel worden geselecteerd in het configuratievenster van de training.
Wanneer het doel is geselecteerd, kunt u de uitvoer van de eerste versie van het experiment starten. Lees meer in Trainingsexperimenten. U kunt nu meer opties configureren (zoals hieronder beschreven) of de configuratie aanpassen nadat u de trainingsresultaten hebt bekeken.
Tijdens de experimenttraining wordt er uitleg getoond over hoe uw gegevens worden geïnterpreteerd en verwerkt. Ga voor meer informatie naar Inzichten over gegevensverzamelingen interpreteren.
Het gemaakte modeltype bepalen
De kolom die u selecteert als het doel bepaalt het modeltype dat door uw experiment wordt gemaakt. Dit speelt dan weer een rol bij het bepalen van de algoritmen die worden gebruikt om het model te trainen. Bepaalde kolommen in uw gegevensverzameling kunnen mogelijk niet worden geselecteerd als doel voor uw experiment. Er kan ook een specifieke bewerking op worden toegepast.
De modeltypen zijn als volgt:
Binair classificatiemodel
Multiclassificatiemodel
Regressiemodel
De onderstaande tabel vat samen hoe de factoren in uw doel het modeltype bepalen.
Modeltype | Aantal unieke waarden in kolom | Vereist functietype | Aanvullende informatie |
---|---|---|---|
Binaire classificatie | 2 | Enkele | - |
Multiclass-classificatie | 3-10 | Enkele | Een kolom met meer dan 10 unieke, niet-numerieke klassen kan niet als doel worden geselecteerd. |
Regressie | Meer dan 10 | Numeriek | - |
Als u wilt weten welk type modellen uw experiment traint, klikt u op Configuratie weergeven en vouwt u Algoritmen uit. Het modeltype is zichtbaar in de titel van de sectie.
Functiekolommen selecteren
Met de doelset kunt u kiezen welke van de overige beschikbare kolommen u aan de training van het model wilt toevoegen. Sluit functies uit die geen onderdeel van het model moeten zijn. Deze kolom blijft in de gegevensverzameling staan, maar wordt niet gebruikt voor de training van het algoritme.
Bovenaan in het deelvenster Experimentconfiguratie ziet u het aantal cellen in uw gegevensverzameling. Als het aantal de limiet van uw gegevensverzameling overschrijdt, kunt u functies uitsluiten om onder de limiet te blijven.
U kunt de functiekolommen op verschillende manieren selecteren:
In Schemaweergave en Gegevensweergave
In de algemene weergaven kunt u het volgende doen:
Hef de selectie van Alle functies opnemen op en selecteer vervolgens alleen de functies die u wilt gebruiken.
U kunt de selectievakjes voor de functies die u niet wilt toevoegen handmatig uitschakelen.
Voer een zoekopdracht uit en sluit alle functies in uw gefilterde zoekresultaat uit of voeg ze toe.
In het aanpassingsvenster voor trainingen
Als u het venster voor experimentconfiguratie uitvouwt, kunt u het volgende doen:
U kunt de selectievakjes voor de functies die u niet wilt toevoegen handmatig uitschakelen.
Nadat u de eerste versie van het experiment hebt uitgevoerd, kunt u het Aantal topfuncties die opgenomen moeten worden definiëren.
Als u functies selecteert, wordt hieraan automatisch een functietype toegewezen. De mogelijke functietypen zijn:
Categorisch
Numeriek
Datum
Vrije tekst
Het functietype is gebaseerd op de gegevens in de functiekolom. Als een functie aan bepaalde criteria voldoet, kan dit de basis vormen voor automatisch ontwikkelende functies. Indien gewenst kunt u wijzigen of de functie voor automatische functieontwikkeling wordt gebruikt. Voor meer informatie over automatische functieontwikkeling gaat u naar Automatische kenmerkontwikkeling.
Bepaalde kolommen in uw gegevensverzameling kunnen mogelijk niet worden geselecteerd als functies voor uw experiment. Er kan ook een specifieke bewerking op worden toegepast. Wanneer u door de experimenttraining navigeert, wordt er uitleg getoond over hoe uw gegevens worden geïnterpreteerd en verwerkt. Ga voor meer informatie naar Inzichten over gegevensverzamelingen interpreteren.
Algoritmen selecteren
Standaard worden alle beschikbare algoritmen toegevoegd. Algoritmen die u niet wilt gebruiken, kunt u uitsluiten. U zou dit normaliter doen als onderdeel van modelverfijning wanneer u de eerste trainingsresultaten hebt gezien. Lees meer in Modellen verfijnen.
Functietypen wijzigen
Wanneer een gegevensverzameling wordt geladen, worden de kolommen op basis van het gegevenstype behandeld als categorisch, numeriek of datum. Het kan voorkomen dat u deze instelling wilt wijzigen.
Als bijvoorbeeld de dagen van de week worden vertegenwoordigd door de getallen 1 t/m 7, dan vertegenwoordigt ieder getal een categorische waarde. Dit wordt standaard behandeld als een doorlopend gerangschikte numerieke waarde. Daarom dient u de configuratie handmatig te wijzigen om de waarde te behandelen als categorisch.
Als wordt vastgesteld dat een kolom datum- en tijdinformatie bevat, wordt de kolom gebruikt als de basis voor het genereren van nieuwe automatisch ontworpen functies. Als dit gebeurt, wordt de oorspronkelijke kolom (de bovenliggende functie) behandeld als een kolom van het functietype datum. U kunt de bovenliggende functie wijzigen van een functietype datum naar een categorisch functietype. Maar als u dit doet, kunt u de automatisch ontwikkelde functies niet meer in de experimenttraining gebruiken.
Doe het volgende:
In Schemaweergave zoekt u de functie.
Klik in de kolom functietype van deze functie op .
Selecteer een waarde in de lijst.
Vanuit Gegevensweergave kunt u desgewenst functietypen wijzigen. Zoek de functie, klik vervolgens op naast het huidige functietype. Selecteer een waarde in de lijst.
U kunt alle kolommen met een gewijzigd functietype zien in het deelvenster Experimentconfiguratie onder Gegevensverwerking.
Gegevensverzameling wijzigen
U kunt de trainingsgegevensset wijzigen voordat u de eerste experimentversie uitvoert. U kunt dit ook doen na het uitvoeren van een versie.
Als u de gegegevensverzameling wijzigt nadat u de eerste versie hebt uitgevoerd, verliest u configuraties die u hebt gemaakt voordat u de gegevensverzameling wijzigde.
Doe het volgende:
Klik in het venster Experimentconfiguratie onder Trainingsgegevens op Gegevensverzameling wijzigen.
Selecteer een nieuwe gegevensverzameling.
Zie De gegevensverzameling wijzigen en vernieuwen voor meer informatie over het wijzigigen en vernieuwen van de gegevensverzameling tijdens het verfijnen van het model (na de uitvoering van een experimentversie).
Modeloptimalisatie configureren
U kunt de volgende instellingen wijzigen om uw modellen te optimaliseren:
Intelligente modeloptimalisatie in- of uitschakelen
Hyperparameteroptimalisatie in- of uitschakelen
Tijdbewuste training in- of uitschakelen
Deze opties kunnen in- of uitgeschakeld worden voor elke versie van het experiment dat u uitvoert.
Intelligente optimalisatie configureren
Het experiment wordt standaard uitgevoerd met intelligente modeloptimalisatie. Met intelligente modeloptimalisatie voert AutoML het modelverfijningsproces voor u uit door kenmerkselectie te herhalen en geavanceerde transformaties toe te passen op uw gegevens.
Zie Intelligente modeloptimalisatie voor meer informatie over intelligente optimalisatie.
U kunt deze instelling uitschakelen om handmatig de modellen die u traint te verfijnen. U wilt bijvoorbeeld uw modeltraining starten met intelligente modeloptimalisatie en vervolgens overschakelen naar handmatig verfijnen voor v2 om de configuratie verder aan te passen.
Doe het volgende:
Klik op Configuratie weergeven
Klik op Nieuwe versie als u al ten minste één versie van het experiment hebt uitgevoerd.
In het venster vouwt u Modeloptimalisatie uit.
Schakel over van Intelligent naar Handmatig.
Stel met de schuifregelaar de maximum uitvoeringsduur van de training in.
Optimalisatie van hyperparameter configureren
U kunt de modellen optimaliseren met behulp van optimalisatie van de hyperparameter. Dit is een geavanceerde optie die de duur van de training aanzienlijk kan verhogen. Hyperparameter-optimalisatie is beschikbaar als u intelligente optimalisatie hebt uitgeschakeld.
Ga voor meer informatie naar Optimalisatie van hyperparameter.
Doe het volgende:
Klik op Configuratie weergeven
Klik op Nieuwe versie als u al ten minste één versie van het experiment hebt uitgevoerd.
In het venster vouwt u Modeloptimalisatie uit.
Schakel over van Intelligent naar Handmatig.
Selecteer het selectievakje Hyperparameteroptimalisatie.
U kunt desgewenst een tijdslimiet voor uw optimalisatie instellen. De standaardtijdslimiet is één uur.
Tijdbewuste training configureren
Als u wilt dat uw modellen worden getraind door rekening te houden met een dimensie van tijdreeksen, activeer dan tijdbewuste training voor de experimentversie. Om deze optie te gebruiken, moet u een kolom in uw gegevensverzameling hebben die de relevante tijdreeksinformatie bevat.
Als Tijdbewuste training is ingeschakeld, gebruikt AutoML gespecialiseerde kruisvalidatie- en null-imputatieprocessen om de modellen te trainen.
Ga voor meer informatie naar Tijdbewuste modellen maken en Tijdgebaseerde kruisvalidatie.
Doe het volgende:
Klik op Configuratie weergeven
Klik op Nieuwe versie als u al ten minste één versie van het experiment hebt uitgevoerd.
In het venster vouwt u Modeloptimalisatie uit.
Selecteer onder Tijdgebaseerde splitsing test-training de Datumindexatie die u wilt gebruiken voor het sorteren van de gegevens.
Inzichten over de trainingsgegevens weergeven
Op het tabblad Gegevens van het experiment, kunt u inzichten tonen over de afhandeling van de trainingsgegevens. De informatie is beschikbaar in de kolom Inzichten in de schemaweergave. De informatie die wordt getoond is afhankelijk van het feit of u wel of niet een versie met de huidige trainingsgegevens hebt uitgevoerd. De wijzigingen in de kolom Inzichten kunnen u helpen om te identificeren waarom functies mogelijk niet beschikbaar zijn om te gebruiken of waarom ze automatisch zijn verwijderd.
Raadpleeg Inzichten over gegevensverzamelingen interpreteren voor meer informatie over de betekenis van elk inzicht.