Experimenten configureren | Qlik Cloud Help
Ga naar hoofdinhoud Ga naar aanvullende inhoud

Experimenten configureren

De configuratie van experimenten bestaat uit het selecteren van het doel en de functies die het model zal gebruiken om het doel te voorspellen. U kunt ook een aantal optionele instellingen configureren.

Om u te ondersteunen bij de selectie van een doel, wordt de historische dataset geanalyseerd en worden er samenvattende statistieken weergegeven over elke kolom in de dataset. Er worden verschillende automatische voorbereidingsstappen toegepast op de dataset om ervoor te zorgen dat alleen geschikte gegevens worden opgenomen. Zie voor meer informatie over de gegevensvoorverwerking Geautomatiseerde voorbereiding en transformatie.

Na het uitvoeren van v1 kunt u indien nodig nieuwe experimentversies maken om de modeltraining verder te verfijnen. Zie voor meer informatie Modellen verfijnen.

Vereisten en machtigingen

Zie voor meer informatie over de gebruikersvereisten voor het werken met ML-experimenten Werken met experimenten.

De interface

In de volgende secties wordt beschreven hoe u door de experimentinterface navigeert om uw experiment te configureren. Zie voor meer informatie over de interface Navigeren door de experimentinterface.

Navigatie met tabbladen

Wanneer u een experiment maakt, wordt het tabblad Configuratie geopend. Hier kunt u het doel en de functies voor het experiment configureren.

Na het uitvoeren van ten minste één experimentversie verandert het tabblad Configuratie in Trainingsgegevens. Er komen ook andere tabbladen beschikbaar. Met deze andere tabbladen kunt u de modellen analyseren die u zojuist in de versie hebt getraind. Als u volgende versies met andere functieselecties moet configureren, kunt u terugkeren naar het tabblad Trainingsgegevens.

Schemaweergave en Gegevensweergave

Op het tabblad Configuratie/Trainingsgegevens kunt u schakelen tussen de volgende weergaven:

  • Rijen Schemaweergave: de standaardweergave. In deze weergave wordt elke kolom in uw dataset vertegenwoordigd door een rij in het schema met informatie en statistieken.

  • Tabel Gegevensweergave: een alternatieve weergave die u kunt gebruiken om toegang te krijgen tot meer informatie en voorbeeldgegevens voor elke kolom.

Schemaweergave in een ML-experiment

Schemaweergave in een ML-experiment

Gegevensweergave in een ML-experiment

Gegevensweergave in een ML-experiment

Configuratiepaneel van experiment

In het configuratiepaneel van het experiment kunt u de experimenttraining verder aanpassen. Dit paneel is standaard geopend in nieuwe experimenten.

Klik na het uitvoeren van een versie op Besturingselementen Configuratie weergeven om het paneel te openen om de volgende versie te configureren.

Met het configuratiepaneel van het experiment kunt u:

  • Selecteer een doel en experimenttype

  • Stel een versienaam in

  • Functies toevoegen of verwijderen

  • Configureer een nieuwe versie van het experiment

  • Bekijk het type model dat u traint

  • Selecteer om de trainingsgegevensset te wijzigen of te vernieuwen

  • Algoritmen toevoegen of verwijderen

  • Instellingen voor modeloptimalisatie wijzigen

  • Stel voor tijdreeksmodellen de prognose-instellingen in

  • Configureer biasdetectie

Configuratiepaneel voor experimenten

Configuratiepaneel voor experimenten met geselecteerd doel, experimenttype en standaard functieselectie

Het doel en het experimenttype selecteren

U kunt de doelkolom en het experimenttype wijzigen totdat u de eerste training start. Daarna zijn ze vergrendeld voor bewerking.

De doelkolom bevat de waarden die u door het machine learning-model wilt laten voorspellen.

Het experimenttype wordt bepaald door het doel en het type gegevens dat het bevat. Het experimenttype definieert welk type model u wilt trainen. De volgende opties zijn mogelijk beschikbaar:

  • Binaire classificatie: traint modellen om een doel te voorspellen dat twee mogelijke waarden heeft (bijvoorbeeld ja of nee). Gegevens kunnen van elk functietype zijn.

  • Multiklasseclassificatie: traint modellen om een doel te voorspellen met 3-10 mogelijke waarden (bijvoorbeeld een lijst met categorieën). Gegevens kunnen van elk functietype zijn, maar een kolom met meer dan 10 afzonderlijke, niet-numerieke klassen (waarden) kan niet als doel worden geselecteerd.

  • Regressie: traint modellen om een doel te voorspellen met meer dan 10 mogelijke waarden — specifiek een doel met een numeriek functietype.

  • Tijdreeks: traint modellen om doelwaarden te voorspellen voor specifieke toekomstige tijdsperioden, waarbij gebruik wordt gemaakt van historische gegevens. Het doel moet meer dan 10 afzonderlijke waarden hebben en numerieke gegevens bevatten. Zie voor meer informatie Werken met tijdreeksexperimenten.

  1. Beweeg in de Rijen Schemaweergave of Tabel Gegevensweergave de muisaanwijzer over de kolom.

  2. Klik op het pictogram Doel dat verschijnt.

    De doelkolom wordt nu aangeduid met Doel en de andere beschikbare kolommen worden automatisch geselecteerd als functies.

    Het doel selecteren in de Schemaweergave

    Datasetkolom met doelsymbool.
  3. In het configuratiepaneel van het experiment kunt u onder Experimentinstellingen indien nodig het doel wijzigen vóór de training.

  4. InformatieExperimentinstellingen kan een kiezer voor Experimenttype bevatten. Als tijdreeksvoorspelling bijvoorbeeld mogelijk is voor uw dataset en doel, is er een optie om het experimenttype te wijzigen van Regressie in Tijdreeks.

Wanneer het doel en het experimenttype zijn geselecteerd, kunt u beginnen met het uitvoeren van de eerste versie van het experiment. Lees meer in Experimenten trainen. U kunt op dit punt aanvullende configuraties uitvoeren — hieronder beschreven — of de configuratie aanpassen nadat u de trainingsresultaten hebt bekeken.

Uitleg over hoe uw gegevens worden geïnterpreteerd en verwerkt, wordt weergegeven terwijl de experimenttraining doorgaat. Zie voor meer informatie Inzichten in de dataset interpreteren.

Functiekolommen selecteren

Als het doel is ingesteld, kunt u kiezen welke van de andere beschikbare kolommen u wilt opnemen in de training van het model. Sluit functies uit die u geen deel wilt laten uitmaken van het model. Houd er rekening mee dat de kolom in de dataset blijft staan, maar niet wordt gebruikt door het trainingsalgoritme.

Bovenaan het configuratiepaneel van het experiment ziet u het aantal cellen in uw dataset. Als het aantal uw datasetlimiet overschrijdt, kunt u functies uitsluiten om onder de limiet te blijven.

U kunt de functiekolommen op verschillende manieren selecteren:

In Schemaweergave en Gegevensweergave

In de hoofdweergaven kunt u:

  • Schakel Alle beschikbare functies opnemen uit en selecteer vervolgens alleen de functies die u wilt opnemen.

  • Handmatig de selectievakjes wissen voor de functies die u niet wilt opnemen.

  • Een zoekopdracht uitvoeren en alle functies in uw gefilterde zoekresultaat uitsluiten of opnemen.

In het configuratiepaneel van het experiment

In het configuratiepaneel van het experiment kunt u:

  • Handmatig de selectievakjes wissen voor de functies die u niet wilt opnemen.

  • Nadat u de eerste versie van het experiment hebt uitgevoerd, kunt u het Aantal op te nemen topfuncties definiëren.

Sectie Functies in het configuratiepaneel van het experiment

Sectie Functies in het Qlik Predict-configuratiepaneel van het experiment

Wanneer u functies selecteert, krijgen ze automatisch een functietype toegewezen. De mogelijke functietypen zijn:

  • Categorisch

  • Numeriek

  • Datum

  • Vrije tekst

Het functietype wordt toegewezen op basis van de gegevens in de functiekolom. Als een functie aan bepaalde criteria voldoet, kan deze worden geselecteerd om de basis te worden voor automatisch gegenereerde functies. Desgewenst kunt u wijzigen of de functie wordt gebruikt voor automatische functie-engineering. Zie voor volledige details over automatische functie-engineering Automatische functieontwikkeling.

Bepaalde kolommen in uw dataset kunnen mogelijk niet worden geselecteerd als functies voor uw experiment, of er kan een specifieke verwerking op worden toegepast. Uitleg over hoe uw gegevens worden geïnterpreteerd en verwerkt, wordt weergegeven terwijl u door de experimenttraining navigeert. Zie voor meer informatie Inzichten in de dataset interpreteren.

Biasdetectie configureren

U kunt biasdetectie activeren voor functies die gevoelige gegevens bevatten. Biasdetectie wordt uitgevoerd wanneer u het experiment uitvoert. U kunt ook op Aanbevelingen ophalen klikken om generatieve AI te gebruiken om uw trainingsgegevens te scannen op mogelijk gevoelige functies voordat u biasdetectie uitvoert.

Biasdetectie bepaalt of de functie de waarschijnlijkheid vergroot dat het model onrechtvaardige resultaten in zijn voorspellingen bevordert, of dat de brongegevens inherent bevooroordeeld zijn.

  1. Vouw in een ML-experiment Bias uit in het configuratiepaneel voor training.

  2. Voordat u functies selecteert voor biasdetectie, klikt u optioneel op Aanbevelingen ophalen om generatieve AI te gebruiken om functies voor te stellen die bevooroordeelde gegevens kunnen bevatten. Zie: Generatieve AI gebruiken om functies aan te bevelen voor biasdetectie.

  3. Selecteer of deselecteer functies waarvoor u biasdetectie wilt uitvoeren.

Als alternatief schakelt u biasdetectie in voor de gewenste functies in Rijen Schemweergave.

Zie voor meer informatie over biasdetectie Bias detecteren in machine learning-modellen.

Algoritmen selecteren

Alle beschikbare algoritmen zijn standaard opgenomen en u kunt algoritmen uitsluiten die u niet wilt gebruiken. Normaal gesproken doet u dit als onderdeel van de modelverfijning wanneer u de eerste trainingsresultaten hebt gezien. Lees meer in Modellen verfijnen.

Sectie Algoritmen in het configuratiepaneel van het experiment

Sectie Algoritmen in het Qlik Predict-configuratiepaneel van het experiment.

Functietypen wijzigen

Wanneer een dataset wordt geladen, worden de kolommen behandeld als categorisch, numeriek, datum of vrije tekst op basis van het gegevenstype en andere kenmerken. In some cases, you might want to change this setting.

Als de dagen van de week bijvoorbeeld worden vertegenwoordigd door de getallen 1-7, vertegenwoordigt elk getal een categorische waarde. Standaard wordt dit behandeld als een continue gerangschikte numerieke waarde, dus u moet de configuratie handmatig wijzigen om deze als categorisch te behandelen.

Wanneer wordt vastgesteld dat een kolom datum- en tijdinformatie bevat, wordt deze gebruikt als basis voor nieuw gegenereerde automatisch ontworpen functies. Wanneer dit gebeurt, wordt de oorspronkelijke kolom (de bovenliggende functie) behandeld alsof deze het functietype datum heeft.

U kunt de bovenliggende functie wijzigen van een datumfunctie in een categorische of numerieke functie. Dit is bijvoorbeeld handig wanneer een functie wordt geïdentificeerd als een datum, maar u wilt dat deze als een tekenreeks of getal wordt behandeld. Als u dit doet, kunt u de automatisch ontworpen functies ervan niet meer gebruiken in de experimenttraining.

  1. Zoek de functie in de Rijen Schemaweergave.

  2. Klik in de kolom Functietype voor deze functie op Pijl omlaag.

  3. Selecteer een waarde in de lijst.

U kunt functietypen ook wijzigen vanuit de Tabel Gegevensweergave. Zoek de functie en klik vervolgens op Pijl omlaag naast het huidige functietype. Selecteer een waarde in de lijst.

Tijdreeksvoorspelling

Als u een tijdreeksexperiment traint, worden bepaalde functietypetransformaties automatisch toegepast, afhankelijk van uw configuratie. Als u bijvoorbeeld groepen selecteert om te gebruiken voor multivariate voorspellingen, worden de functietypen van deze groepen automatisch omgeschakeld naar categorisch.

Impact op voorspellingen

Wanneer u handmatig het functietype van een functie wijzigt en vervolgens een resulterend model implementeert, worden de functietype-overschrijvingen toegepast op de functie in de toepasbare gegevensverzameling die wordt gebruikt in voorspellingen die met dat model zijn gemaakt.

Dataset wijzigen

U kunt de trainingsdataset wijzigen voordat u de eerste experimentversie uitvoert, evenals na het uitvoeren van een versie.

Als u dataset wijzigt voordat u de eerste versie uitvoert, verliest u alle configuraties die u vóór het wijzigen van de dataset hebt uitgevoerd.

  1. Klik in het configuratiepaneel van het experiment onder TrainingsgegevensDataset controleren op Dataset wijzigen.

  2. Selecteer een nieuwe dataset.

Zie voor meer informatie over het wijzigen en vernieuwen van de dataset tijdens modelverfijning (na het uitvoeren van een experimentversie) De dataset wijzigen en vernieuwen.

Modeloptimalisatie configureren

Als uw experimenttype binaire classificatie, multiklasseclassificatie of regressie is, kunt u de volgende instellingen aanpassen om uw modellen te optimaliseren:

  • Intelligente modeloptimalisatie in- of uitschakelen

  • Hyperparameteroptimalisatie in- of uitschakelen

  • Tijdsbewuste training in- of uitschakelen

Deze opties kunnen worden in- of uitgeschakeld voor elke versie van het experiment dat u uitvoert.

Sectie Modeloptimalisatie in het configuratiepaneel van het experiment

Sectie Modeloptimalisatie in het Qlik Predict-trainingsconfiguratiepaneel

Intelligente optimalisatie configureren

Standaard maakt het experiment gebruik van intelligente modeloptimalisatie. Met intelligente modeloptimalisatie regelt Qlik Predict het modelverfijningsproces voor u door functieselectie te herhalen en geavanceerde transformaties op uw gegevens toe te passen.

Zie voor meer informatie over intelligente optimalisatie Intelligente modeloptimalisatie.

U kunt deze instelling uitschakelen om de modellen die u traint handmatig te verfijnen. U kunt bijvoorbeeld uw modeltraining starten met intelligente modeloptimalisatie en vervolgens overschakelen naar handmatige verfijning voor v2 om de configuratie verder aan te passen.

  1. Klik op Besturingselementen Configuratie weergeven.

  2. Als u al ten minste één versie van het experiment hebt uitgevoerd, klikt u op Nieuwe versie.

  3. Vouw in het paneel Modeloptimalisatie uit.

  4. Schakel over van Intelligent naar Handmatig.

  5. Stel met de schuifregelaar de maximale uitvoeringsduur voor de training in.

Configuring hyperparameter optimization

U kunt de modellen optimaliseren met behulp van hyperparameteroptimalisatie. Houd er rekening mee dat dit een geavanceerde optie is die de trainingstijd aanzienlijk kan verlengen. Hyperparameteroptimalisatie is beschikbaar als u intelligente optimalisatie uitschakelt.

Zie voor meer informatie Hyperparameteroptimalisatie.

  1. Klik op Besturingselementen Configuratie weergeven.

  2. Als u al ten minste één versie van het experiment hebt uitgevoerd, klikt u op Nieuwe versie.

  3. Vouw in het paneel Modeloptimalisatie uit.

  4. Schakel over van Intelligent naar Handmatig.

  5. Schakel het selectievakje Hyperparameteroptimalisatie in.

  6. Stel optioneel een tijdslimiet in voor uw optimalisatie. De standaard tijdslimiet is één uur.

Tijdsbewuste training configureren

Als u wilt dat uw modellen worden getraind met inachtneming van een tijdreeksdimensie, activeert u tijdsbewuste training voor de experimentversie. Om deze optie te gebruiken, moet u een kolom in uw dataset hebben die de relevante tijdreeksinformatie bevat.

Wanneer tijdsbewuste training is ingeschakeld, gebruikt Qlik Predict gespecialiseerde processen voor kruisvalidatie en nul-imputatie om de modellen te trainen.

Zie voor meer informatie Tijdbewuste modellen maken en Tijdgebaseerde kruisvalidatie.

  1. Klik op Besturingselementen Configuratie weergeven.

  2. Als u al ten minste één versie van het experiment hebt uitgevoerd, klikt u op Nieuwe versie.

  3. Vouw in het paneel Modeloptimalisatie uit.

  4. Selecteer onder Op tijd gebaseerde test-train-splitsing de Datumindex die u wilt gebruiken voor het sorteren van de gegevens.

Inzichten over de trainingsgegevens bekijken

Op het tabblad Configuratie/Trainingsgegevens van het experiment kunt u inzichten bekijken in de verwerking van de trainingsgegevens. Deze informatie is beschikbaar in de kolom Inzichten in de Tabelrijen Schemaweergave. De weergegeven informatie hangt af van het feit of u al dan niet een versie met de huidige trainingsgegevens hebt uitgevoerd. De wijzigingen in de kolom Inzichten kunnen u helpen te bepalen waarom functies mogelijk niet beschikbaar zijn voor gebruik, of waarom ze automatisch zijn verwijderd.

Zie voor meer informatie over wat elk inzicht betekent Inzichten in de dataset interpreteren.

GERELATEERD LESMATERIAAL:

Meer informatie

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een tikfout, een ontbrekende stap of een technische fout – laat het ons weten!