Experimenten configureren

De configuratie van experimenten bestaat uit het selecteren van het doel en de functies die het model zal gebruiken om het doel te voorspellen. U kunt tevens een aantal optionele instellingen configureren.

Om u te helpen bij de selectie van een doel, wordt de historische gegevensverzameling geanalyseerd en wordt een samenvatting van de statistieken weergegeven voor iedere kolom in de gegevensverzameling. Er worden verschillende automatische voorbewerkingsstappen op de gegevensverzameling toegepast om er zeker van te zijn dat er alleen geschikte gegevens worden toegevoegd. Voor meer informatie over de voorbewerking van gegevens, kunt u Geautomatiseerde voorbereiding en transformatie raadplegen.

Na het uitvoeren van v1 kunt u indien nodig nieuwe experimentversies maken om de modeltraining verder te verfijnen. Ga voor meer informatie naar Modellen verfijnen.

Vereisten en machtigingen

Raadpleeg Werken met experimenten voor meer informatie over de gebruikersvereisten voor het werken met ML-implementaties.

De interface

De volgende sectie toont hoe u door de experimentinterface kunt navigeren om uw experiment te configureren. Zie Navigeren in de experimentinterface voor meer informatie over de interface

Tabbladnavigatie

Als u een experiment maakt, wordt het tabblad Gegevens geopend. Hier kunt u het doel en de functies voor het experiment configureren.

Na het uitvoeren van ten minste één experimentversie, worden andere tabbladen zichtbaar. Met deze andere tabbladen kunt u de modellen analyseren die u binnen de versie hebt getraind. U kunt terugkeren naar het tabblad Gegevens als u opeenvolgende versies met verschillende functieselecties moet configureren.

Schemaweergave en Gegevensweergave

Op het tabblad Gegevens kunt u schakelen tussen de volgende weergaven:

Schemaweergave: de standaardweergave. In deze weergave wordt iedere kolom in uw gegevensverzameling vertegenwoordigd door een rij in het schema met informatie en statistieken.
Gegevensweergave: een alternatieve weergave die u kunt gebruiken om meer informatie en voorbeeldgegevens voor elke kolom te raadplegen.

Deelvenster Experimentconfiguratie

Klik op Besturingselementen Configuratie weergeven om een venster te openen waar u de experimenttraining verder kunt aanpassen. U kunt het venster openen op elk tabblad dat u bekijkt. Het venster biedt een aantal aanvullende configuratieopties.

Met het venster Experimentconfiguratie kunt u het volgende doen:

Selecteer een doel voordat u de eerste versie gaat trainen
Kenmerken toevoegen of verwijderen
Een nieuwe versie van het experiment configureren
Selecteer om de trainingsgegevensverzameling te wijzigen of vernieuwen
Algoritmen toevoegen of verwijderen
Instellingen voor modeloptimalisatie wijzigen

Uitgevouwen aanpassingsvenster in een ML-experiment — Deelvenster Experimentconfiguratie

Een doel selecteren

De doelkolom bevat de waarden waarvan u wilt dat het machine learning-model ze voorspelt. U kunt de doelkolom wijzigen tot u de eerste training start. Hierna wordt deze vergrendeld tegen bewerken.

Doe het volgende:

In Schemaweergave of Gegevensweergave, gaat u met de muiscursor op de kolom staan.
Klik op het pictogram dat verschijnt.

De doelkolom wordt nu aangeduid door en de overige beschikbare kolommen worden automatisch als functies geselecteerd.

Gegevensverzamelingkolom met doelsymbool. — Het doel selecteren in Schemaweergave

Het doel kan eventueel worden geselecteerd in het configuratievenster van de training.

Wanneer het doel is geselecteerd, kunt u de uitvoer van de eerste versie van het experiment starten. Lees meer in Trainingsexperimenten. U kunt nu meer opties configureren (zoals hieronder beschreven) of de configuratie aanpassen nadat u de trainingsresultaten hebt bekeken.

Tijdens de experimenttraining wordt er uitleg getoond over hoe uw gegevens worden geïnterpreteerd en verwerkt. Ga voor meer informatie naar Inzichten over gegevensverzamelingen interpreteren.

Het gemaakte modeltype bepalen

De kolom die u selecteert als het doel bepaalt het modeltype dat door uw experiment wordt gemaakt. Dit speelt dan weer een rol bij het bepalen van de algoritmen die worden gebruikt om het model te trainen. Bepaalde kolommen in uw gegevensverzameling kunnen mogelijk niet worden geselecteerd als doel voor uw experiment. Er kan ook een specifieke bewerking op worden toegepast.

De modeltypen zijn als volgt:

Binair classificatiemodel
Multiclassificatiemodel
Regressiemodel

De onderstaande tabel vat samen hoe de factoren in uw doel het modeltype bepalen.

Functies van doelkolom die het modeltype bepalen
Modeltype	Aantal unieke waarden in kolom	Vereist functietype	Aanvullende informatie
Binaire classificatie	2	Enkele	-
Multiclass-classificatie	3-10	Enkele	Een kolom met meer dan 10 unieke, niet-numerieke klassen kan niet als doel worden geselecteerd.
Regressie	Meer dan 10	Numeriek	-

Als u wilt weten welk type modellen uw experiment traint, klikt u op Schema Configuratie weergeven en vouwt u Algoritmen uit. Het modeltype is zichtbaar in de titel van de sectie.

Functiekolommen selecteren

Met de doelset kunt u kiezen welke van de overige beschikbare kolommen u aan de training van het model wilt toevoegen. Sluit functies uit die geen onderdeel van het model moeten zijn. Deze kolom blijft in de gegevensverzameling staan, maar wordt niet gebruikt voor de training van het algoritme.

Bovenaan in het deelvenster Experimentconfiguratie ziet u het aantal cellen in uw gegevensverzameling. Als het aantal de limiet van uw gegevensverzameling overschrijdt, kunt u functies uitsluiten om onder de limiet te blijven.

U kunt de functiekolommen op verschillende manieren selecteren:

In Schemaweergave en Gegevensweergave

In de algemene weergaven kunt u het volgende doen:

Hef de selectie van Alle functies opnemen op en selecteer vervolgens alleen de functies die u wilt gebruiken.
U kunt de selectievakjes voor de functies die u niet wilt toevoegen handmatig uitschakelen.
Voer een zoekopdracht uit en sluit alle functies in uw gefilterde zoekresultaat uit of voeg ze toe.

In het aanpassingsvenster voor trainingen

Als u het venster voor experimentconfiguratie uitvouwt, kunt u het volgende doen:

U kunt de selectievakjes voor de functies die u niet wilt toevoegen handmatig uitschakelen.
Nadat u de eerste versie van het experiment hebt uitgevoerd, kunt u het Aantal topfuncties die opgenomen moeten worden definiëren.

Sectie Functies in het aanpassingsvenster van de AutoML-training — Sectie Functies in het deelvenster voor experimentconfiguratie

Als u functies selecteert, wordt hieraan automatisch een functietype toegewezen. De mogelijke functietypen zijn:

Categorisch
Numeriek
Datum
Vrije tekst

Het functietype is gebaseerd op de gegevens in de functiekolom. Als een functie aan bepaalde criteria voldoet, kan dit de basis vormen voor automatisch ontwikkelende functies. Indien gewenst kunt u wijzigen of de functie voor automatische functieontwikkeling wordt gebruikt. Voor meer informatie over automatische functieontwikkeling gaat u naar Automatische kenmerkontwikkeling.

Bepaalde kolommen in uw gegevensverzameling kunnen mogelijk niet worden geselecteerd als functies voor uw experiment. Er kan ook een specifieke bewerking op worden toegepast. Wanneer u door de experimenttraining navigeert, wordt er uitleg getoond over hoe uw gegevens worden geïnterpreteerd en verwerkt. Ga voor meer informatie naar Inzichten over gegevensverzamelingen interpreteren.

Algoritmen selecteren

Standaard worden alle beschikbare algoritmen toegevoegd. Algoritmen die u niet wilt gebruiken, kunt u uitsluiten. U zou dit normaliter doen als onderdeel van modelverfijning wanneer u de eerste trainingsresultaten hebt gezien. Lees meer in Modellen verfijnen.

Sectie Algoritmen in het aanpassingsvenster van de AutoML-training — Sectie Algoritmen in het venster voor experimentconfiguratie

Functietypen wijzigen

Wanneer een gegevensverzameling wordt geladen, worden de kolommen op basis van het gegevenstype behandeld als categorisch, numeriek of datum. Het kan voorkomen dat u deze instelling wilt wijzigen.

Als bijvoorbeeld de dagen van de week worden vertegenwoordigd door de getallen 1 t/m 7, dan vertegenwoordigt ieder getal een categorische waarde. Dit wordt standaard behandeld als een doorlopend gerangschikte numerieke waarde. Daarom dient u de configuratie handmatig te wijzigen om de waarde te behandelen als categorisch.

Als wordt vastgesteld dat een kolom datum- en tijdinformatie bevat, wordt de kolom gebruikt als de basis voor het genereren van nieuwe automatisch ontworpen functies. Als dit gebeurt, wordt de oorspronkelijke kolom (de bovenliggende functie) behandeld als een kolom van het functietype datum.

U kunt de bovenliggende functie wijzigen van een datumfunctie naar een categorische of numerieke functie. Dit is bijvoorbeeld handig wanneer een functie wordt geïdentificeerd als een datum, maar u wilt dat deze als een tekenreeks of getal wordt behandeld. Als u dit doet, kunt u de automatisch ontwikkelde functies niet meer in de experimenttraining gebruiken.

Doe het volgende:

In Schemaweergave zoekt u de functie.
Klik in de kolom functietype van deze functie op .
Selecteer een waarde in de lijst.

Vanuit Tabel Gegevensweergave kunt u desgewenst functietypen wijzigen. Zoek de functie, klik vervolgens op Pijl-omlaag naast het huidige functietype. Selecteer een waarde in de lijst.

U kunt alle kolommen met een gewijzigd functietype zien in het deelvenster Experimentconfiguratie onder Gegevensverwerking.

Invloed op voorspellingen

Wanneer u handmatig het functietype van een functie wijzigt en vervolgens een resulterend model implementeert, worden de functietype-overschrijvingen toegepast op de functie in de toepasbare gegevensverzameling die wordt gebruikt in voorspellingen die met dat model zijn gemaakt.

Gegevensverzameling wijzigen

U kunt de trainingsgegevensset wijzigen voordat u de eerste experimentversie uitvoert. U kunt dit ook doen na het uitvoeren van een versie.

Als u de gegegevensverzameling wijzigt nadat u de eerste versie hebt uitgevoerd, verliest u configuraties die u hebt gemaakt voordat u de gegevensverzameling wijzigde.

Doe het volgende:

Klik in het venster Experimentconfiguratie onder Trainingsgegevens op Gegevensverzameling wijzigen.
Selecteer een nieuwe gegevensverzameling.

Zie De gegevensverzameling wijzigen en vernieuwen voor meer informatie over het wijzigigen en vernieuwen van de gegevensverzameling tijdens het verfijnen van het model (na de uitvoering van een experimentversie).

Modeloptimalisatie configureren

U kunt de volgende instellingen wijzigen om uw modellen te optimaliseren:

Intelligente modeloptimalisatie in- of uitschakelen
Hyperparameteroptimalisatie in- of uitschakelen
Tijdbewuste training in- of uitschakelen

Deze opties kunnen in- of uitgeschakeld worden voor elke versie van het experiment dat u uitvoert.

Intelligente optimalisatie configureren

Het experiment wordt standaard uitgevoerd met intelligente modeloptimalisatie. Met intelligente modeloptimalisatie voert AutoML het modelverfijningsproces voor u uit door kenmerkselectie te herhalen en geavanceerde transformaties toe te passen op uw gegevens.

Zie Intelligente modeloptimalisatie voor meer informatie over intelligente optimalisatie.

U kunt deze instelling uitschakelen om handmatig de modellen die u traint te verfijnen. U wilt bijvoorbeeld uw modeltraining starten met intelligente modeloptimalisatie en vervolgens overschakelen naar handmatig verfijnen voor v2 om de configuratie verder aan te passen.

Doe het volgende:

Klik op Configuratie weergeven
Klik op Nieuwe versie als u al ten minste één versie van het experiment hebt uitgevoerd.
In het venster vouwt u Modeloptimalisatie uit.
Schakel over van Intelligent naar Handmatig.
Stel met de schuifregelaar de maximum uitvoeringsduur van de training in.

Intelligente modeloptimalisatie activeren onder Modeloptimalisatie in het venster voor het aanpassen van de AutoML-training — Modeloptimalisatie configureren

Optimalisatie van hyperparameter configureren

U kunt de modellen optimaliseren met behulp van optimalisatie van de hyperparameter. Dit is een geavanceerde optie die de duur van de training aanzienlijk kan verhogen. Hyperparameter-optimalisatie is beschikbaar als u intelligente optimalisatie hebt uitgeschakeld.

Ga voor meer informatie naar Optimalisatie van hyperparameter.

Doe het volgende:

Klik op Configuratie weergeven
Klik op Nieuwe versie als u al ten minste één versie van het experiment hebt uitgevoerd.
In het venster vouwt u Modeloptimalisatie uit.
Schakel over van Intelligent naar Handmatig.
Selecteer het selectievakje Hyperparameteroptimalisatie.
U kunt desgewenst een tijdslimiet voor uw optimalisatie instellen. De standaardtijdslimiet is één uur.

Aanpassingsvenster van de AutoML-training waarbij hyperparameter-optimalisatie is geactiveerd — Optimalisatie van hyperparameter configureren

Tijdbewuste training configureren

Als u wilt dat uw modellen worden getraind door rekening te houden met een dimensie van tijdreeksen, activeer dan tijdbewuste training voor de experimentversie. Om deze optie te gebruiken, moet u een kolom in uw gegevensverzameling hebben die de relevante tijdreeksinformatie bevat.

Als Tijdbewuste training is ingeschakeld, gebruikt AutoML gespecialiseerde kruisvalidatie- en null-imputatieprocessen om de modellen te trainen.

Ga voor meer informatie naar Tijdbewuste modellen maken en Tijdgebaseerde kruisvalidatie.

Doe het volgende:

Klik op Configuratie weergeven
Klik op Nieuwe versie als u al ten minste één versie van het experiment hebt uitgevoerd.
In het venster vouwt u Modeloptimalisatie uit.
Selecteer onder Tijdgebaseerde splitsing test-training de Datumindexatie die u wilt gebruiken voor het sorteren van de gegevens.

Venster voor aan het aanpassen van de AutoML-training met een geselecteerde datumkolom om tijdbewuste training te activeren — Configureer tijdbewuste training door een kolom in de trainingsgegevens te selecteren om als indexatie te gebruiken.

Inzichten over de trainingsgegevens weergeven

Op het tabblad Gegevens van het experiment, kunt u inzichten tonen over de afhandeling van de trainingsgegevens. De informatie is beschikbaar in de kolom Inzichten in de Tabelrijen schemaweergave. De informatie die wordt getoond is afhankelijk van het feit of u wel of niet een versie met de huidige trainingsgegevens hebt uitgevoerd. De wijzigingen in de kolom Inzichten kunnen u helpen om te identificeren waarom functies mogelijk niet beschikbaar zijn om te gebruiken of waarom ze automatisch zijn verwijderd.

Raadpleeg Inzichten over gegevensverzamelingen interpreteren voor meer informatie over de betekenis van elk inzicht.

GERELATEERD LESMATERIAAL:

Inleiding tot Qlik AutoML

Meer informatie

Inleiding tot Qlik AutoML

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een typfout, een ontbrekende stap of een technische fout – laat het ons weten zodat we dit kunnen verbeteren!

Geef hier uw feedback