Modellen verfijnen
Zodra u enkele initiële modellen hebt gemaakt, is het belangrijk om deze te verfijnen om hun effectiviteit en potentiële nauwkeurigheid te vergroten. De modelscores geven verschillende metingen van deze prestaties aan. Hoewel het doel van het verfijnen van de modellen is om deze scores te verhogen, wijst een hogere score niet altijd op een beter model.
U kunt uw modellen verfijnen door functies uit te sluiten of op te nemen, de trainingsgegevens te wijzigen en andere configuratieparameters aan te passen. Hierbij kunt u verschillende versies vergelijken om te zien welk effect uw wijzigingen hebben.
Door de scores te interpreteren, leert u hoe u het model kunt verfijnen. De waarden voor de verschillende statistieken kunnen u inzicht geven in welke acties u moet ondernemen om het resultaat te verbeteren.
Vereisten en machtigingen
Zie Werken met experimenten voor meer informatie over de gebruikersvereisten voor het werken met ML-experimenten.
Een nieuwe versie configureren
Nadat u een experimentversie hebt uitgevoerd, kunt u uw modellen indien nodig verfijnen door een nieuwe versie te maken.
Doe het volgende:
-
Selecteer op het tabblad Trainingsgegevens, Modellen of Analyseren het model dat u wilt gebruiken als basis voor de volgende versie.
-
Klik op Configuratie bekijken.
Het configuratiepaneel van het experiment wordt geopend.
-
Klik op Nieuwe versie maken.
Nadat u een nieuwe versie hebt gemaakt, kunt u wijzigingen aanbrengen in de configuratie ervan, zoals:
-
Bestaande functies uitsluiten
-
Eerder uitgesloten functies opnemen
-
De dataset wijzigen of vernieuwen
-
Algoritmen selecteren of deselecteren
Meer informatie over deze opties vindt u in de onderstaande secties.
Klik bij het ontwerpen van een nieuwe versie op het filterpictogram onder Functies in het configuratiepaneel van het experiment. Door te filteren kunt u gemakkelijker visualiseren welke functies zijn geïntroduceerd sinds u de trainingsdataset hebt gewijzigd. U kunt ook zien welke functies automatisch zijn gegenereerd (auto-engineered) en welke niet.
De dataset verbeteren
Als uw model niet goed scoort, wilt u wellicht de dataset controleren om eventuele problemen op te lossen. Lees meer over het verbeteren van de dataset in Uw dataset voorbereiden voor training.
Functies uitsluiten
Meer functies zorgen niet noodzakelijkerwijs voor een beter model. Om het model te verfijnen, wilt u onbetrouwbare en irrelevante functies uitsluiten, zoals:
-
Functies met een te hoge correlatie. Sluit van twee gecorreleerde functies de functie met de minste functie-relevantie uit.
-
Functies met een te lage functie-relevantie. Die functies hebben geen enkele invloed op wat u probeert te leren.
-
Functies met een te hoge functie-relevantie. Dit kan te wijten zijn aan datalekkage.
Test dit door de functie uit de trainingsgegevens te verwijderen, voer de training vervolgens opnieuw uit en controleer of dit het model verbetert. Maakt het een groot verschil of helemaal geen verschil voor de modelscore?
Doe het volgende:
-
Open een experiment vanuit de catalogus.
-
Selecteer op het tabblad Trainingsgegevens, Modellen of Analyseren het model dat u wilt gebruiken als basis voor de volgende versie.
-
Klik op Configuratie bekijken.
Het configuratiepaneel van het experiment wordt geopend.
-
Klik op Nieuwe versie maken om een nieuwe experimentversie te configureren.
-
Wis onder Functies de selectievakjes voor functies die u niet wilt gebruiken bij de training.
Functies toevoegen
Als uw model nog steeds niet goed scoort, kan dit komen doordat de functies die een relatie hebben met het doel nog niet zijn vastgelegd in de dataset. U kunt uw dataset opnieuw verwerken en herbestemmen om de gegevenskwaliteit te optimaliseren en nieuwe functies en informatie toe te voegen. Wanneer deze gereed is, kan de nieuwe dataset worden toegevoegd aan toekomstige experimentversies. Zie De dataset wijzigen en vernieuwen.
Lees meer over het vastleggen of genereren van nieuwe functies in Nieuwe functiekolommen maken.
Instellingen voor biasdetectie wijzigen
U kunt de functies wijzigen waarop de biasdetectie moet worden uitgevoerd. Als u bijvoorbeeld nieuwe functies aan de dataset hebt toegevoegd, kunt u biasdetectie voor deze functies inschakelen.
Doe het volgende:
-
Open een experiment vanuit de catalogus.
-
Selecteer op het tabblad Trainingsgegevens, Modellen of Analyseren het model dat u wilt gebruiken als basis voor de volgende versie.
-
Klik op Configuratie bekijken.
Het configuratiepaneel van het experiment wordt geopend.
-
Klik op Nieuwe versie maken om een nieuwe experimentversie te configureren.
-
Vouw Bias uit in het trainingsconfiguratiepaneel.
-
Klik eventueel op Aanbevelingen ophalen om generatieve AI te gebruiken om functies voor te stellen die mogelijk vertekende gegevens bevatten. Zie Generatieve AI gebruiken om functies aan te bevelen voor biasdetectie.
-
Selecteer of deselecteer functies waarvoor u biasdetectie wilt uitvoeren.
Als alternatief kunt u de instellingen voor biasdetectie instellen in Schemaweergave.
Zie Bias detecteren in machine learning-modellen voor meer informatie over biasdetectie.
Algoritmen selecteren
Op basis van het gegevenstype van uw doelkolom worden automatisch geschikte algoritmen geselecteerd voor de training. U kunt de algoritmen die minder goed presteren of langzamer zijn, uitsluiten. Op deze manier verspilt u geen tijd aan deze algoritmen tijdens de training.
Zie Modelalgoritmen begrijpen voor meer informatie over hoe algoritmen worden gekozen.
Doe het volgende:
-
Open een experiment vanuit de catalogus.
-
Selecteer op het tabblad Gegevens, Modellen of Analyseren het model dat u wilt gebruiken als basis voor de volgende versie.
-
Klik op Configuratie bekijken.
Het configuratiepaneel van het experiment wordt geopend.
-
Klik op Nieuwe versie maken om een nieuwe experimentversie te configureren.
-
Schakel onder Algoritmen de selectievakjes uit voor algoritmen die u niet wilt gebruiken bij de training.
De dataset wijzigen en vernieuwen
Als uw trainingsgegevens zijn gewijzigd sinds de laatste experimentversie, kunt u de dataset wijzigen of vernieuwen voor toekomstige versies van het experiment.
Dit kan handig zijn als u modelstatistieken en prestaties voor verschillende datasets binnen hetzelfde experiment wilt vergelijken. Dit is bijvoorbeeld handig als:
-
Er een nieuwe set gegevensrecords beschikbaar is, of er updates zijn uitgevoerd op de oorspronkelijke set gegevensrecords. De transacties van de afgelopen maand kunnen bijvoorbeeld beschikbaar zijn gekomen en geschikt zijn voor gebruik bij de training, of er kan een probleem met de gegevensverzameling zijn geïdentificeerd en opgelost.
-
De oorspronkelijke trainingsdataset opnieuw is verwerkt of herbestemd, wellicht met de bedoeling de modeltraining te verbeteren. U hebt bijvoorbeeld de logica voor het definiëren van de waarden van de functiekolommen verbeterd, of zelfs nieuwe functiekolommen toegevoegd.
Het wijzigen of vernieuwen van de dataset heeft geen invloed op bestaande modellen die al zijn getraind op basis van eerdere experimentversies. Binnen een experimentversie worden de modellen alleen getraind op de trainingsgegevens die binnen die specifieke versie zijn gedefinieerd.
Vereisten
Wanneer u de dataset wijzigt of vernieuwt voor een nieuwe experimentversie, moet de nieuwe dataset aan de volgende vereisten voldoen:
-
De naam en het functietype van de doelkolom moeten hetzelfde zijn als het doel in de oorspronkelijke trainingsdataset.
- Het aantal unieke waarden in de doelkolom moet binnen hetzelfde bereik liggen als vereist voor het gegeven experimenttype. Voor een multiclass-classificatie-experiment moet de doelkolom in de nieuwe dataset bijvoorbeeld nog steeds tussen de drie en tien unieke waarden bevatten. Zie Experimenten configureren voor de specifieke bereiken.
De andere functiekolommen kunnen volledig nieuw zijn, andere namen hebben en andere gegevens bevatten.
De dataset wijzigen
Doe het volgende:
-
Selecteer op het tabblad Trainingsgegevens, Modellen of Analyseren het model dat u wilt gebruiken als basis voor de volgende versie.
-
Klik op Configuratie bekijken.
Het configuratiepaneel van het experiment wordt geopend.
-
Klik op Nieuwe versie maken om een nieuwe experimentversie te configureren.
-
Klik onder Trainingsgegevens > Dataset controleren op Dataset wijzigen.
-
Selecteer of upload de nieuwe dataset. U kunt kiezen uit:
-
Datasets: Selecteer een dataset in een ruimte waartoe u toegang hebt. Zie Tips en richtlijnen voor het uploaden en selecteren van datasets.
-
Gegevensproducten: Selecteer een dataset uit een actief gegevensproduct waartoe u toegang hebt. Zie Creating data products voor meer informatie over gegevensproducten.
-
De dataset vernieuwen
Doe het volgende:
-
Selecteer op het tabblad Trainingsgegevens, Modellen of Analyseren het model dat u wilt gebruiken als basis voor de volgende versie.
-
Klik op Configuratie bekijken.
Het configuratiepaneel van het experiment wordt geopend.
-
Klik op Nieuwe versie maken om een nieuwe experimentversie te configureren.
-
Klik onder Trainingsgegevens op Dataset vernieuwen.
U ontvangt een melding als er een datasetvernieuwing beschikbaar is. Een dataset wordt doorgaans vernieuwd wanneer het bestaande gegevensbestand wordt overschreven door de creatie van een nieuw bestand met dezelfde naam.
Tips en richtlijnen voor het uploaden en selecteren van datasets
-
Gegevensverzamelingen kunnen via de pagina Maken in het Analyse activiteitencentrum worden geüpload en zijn zichtbaar in de catalogus. U kunt ook een nieuwe gegevensverzameling direct in de catalogus uploaden vanaf de selectiepagina van de gegevensverzameling van het experiment. Om dit te doen, klik op Bestand uploaden en kies het bestand om te uploaden.
-
Alle platte bestanden die kunnen worden geüpload en geprofileerd in Qlik Cloud, worden ondersteund voor gebruik in Qlik Predict.
Voor bestanden met meerdere tabellen, zoals Microsoft Excel-bestanden met meerdere werkbladen, wordt alleen de eerste tabel geïmporteerd. Als gegevensprofilering voor een tabel mislukt (bijvoorbeeld als de tabel leeg is), wordt het bestand niet ondersteund.
De verfijnde versie uitvoeren
Wanneer u klaar bent met het configureren van de versie, kunt u deze uitvoeren.
Doe het volgende:
-
Klik op v2 uitvoeren in de rechterbenedenhoek van het scherm.
(De tekst op de knop is afhankelijk van het aantal versies dat u hebt uitgevoerd.)
Experimentversies vergelijken
Nadat de training van de nieuwe versie is voltooid, vergelijkt u de nieuwe versie met de oude om het effect van uw wijzigingen te zien. U hebt een aantal opties om modellen over verschillende experimentversies heen te vergelijken.
Snelle analyse
Gebruik de tabbladen Modellen en Trainingsgegevens in het experiment om de versie te vergelijken met oudere versies. Op het tabblad Modellen kunt u:
-
De resultaten bekijken in de tabel Modelstatistieken.
-
Aanbevolen modellen bekijken op basis van algemene vereisten voor voorspellende analyses, waaronder nauwkeurigheid en voorspellingssnelheid.
-
Schakelen tussen modellen om de verschillen te bekijken in de Samenvatting van modeltraining en andere automatisch gegenereerde diagrammen.
Zie Snelle modelanalyse uitvoeren voor meer informatie over een snelle modelanalyse.
Diepgaande analyse
U kunt dieper in uw modelanalyse duiken door over te schakelen naar de tabbladen Vergelijken en Analyseren in het experiment. Deze tabbladen bieden een geïntegreerde analyse-ervaring waarin u de modellen interactief op een gedetailleerder niveau kunt evalueren.
Het tabblad Vergelijken biedt een vergelijking van modelscores en hyperparameters voor alle modellen. Op het tabblad Analyseren kunt u zich richten op een specifiek model om de voorspellingsnauwkeurigheid, functie-relevantie en andere details te beoordelen.
Zie Modellen vergelijken en Gedetailleerde modelanalyse uitvoeren voor meer informatie.
Instellingen voor modeloptimalisatie wijzigen
U kunt intelligente optimalisatie uitschakelen nadat u een versie hebt uitgevoerd waarin deze was geactiveerd. Hierdoor kunt u de inzichten uit de intelligente optimalisatie gebruiken, terwijl u ook de nodige controle hebt om kleine, minimale aanpassingen te doen. Als alternatief kunt u intelligente modeloptimalisatie inschakelen nadat u een of meer versies hebt uitgevoerd waarin de instelling was uitgeschakeld.
Hyperparameteroptimalisatie is een instelling die nuttig kan zijn om in te schakelen tijdens het verfijningsproces van het model. Over het algemeen wordt het niet aanbevolen om deze instelling in te schakelen voor de eerste versie van het experiment.
U kunt ook wijzigen of u tijdgevoelige training wilt gebruiken, of de kolom wijzigen die als datumindex wordt gebruikt.
Doe het volgende:
-
Klik op Configuratie bekijken.
-
Klik indien nodig op Nieuwe versie maken om een nieuwe experimentversie te configureren.
-
In het paneel, opent u Modeloptimalisatie.
-
Schakel tussen de instellingen Intelligent en Handmatig om intelligente modeloptimalisatie in of uit te schakelen.
-
Als u hyperparameteroptimalisatie wilt activeren, schakelt u het selectievakje Hyperparameteroptimalisatie in en stelt u een maximale trainingstijd in.
-
Onder Op tijd gebaseerde test-train-splitsing kunt u de instellingen voor tijdgevoelige training wijzigen:
-
Om tijdgevoelige training in te schakelen, wijzigt u de standaardwaarde Geen door een specifieke kolom Datumindex in de dataset te selecteren.
-
Om tijdgevoelige training uit te schakelen, stelt u de Datumindex in op de waarde Geen.
-
Wijzig de geselecteerde kolom Datumindex in een andere kolom.
-
Experimentversies verwijderen
U kunt experimentversies verwijderen die u niet wilt bewaren. Houd er rekening mee dat alle modellen in de experimentversies ook worden verwijderd en niet kunnen worden hersteld.
Doe het volgende:
-
Ga naar het tabblad Modellen.
-
Selecteer in de tabel Modelstatistieken een model uit de experimentversie die u wilt verwijderen.
TipU kunt ook een model selecteren wanneer u zich op het tabblad Trainingsgegevens of Analyseren bevindt, met behulp van het vervolgkeuzemenu in de werkbalk. -
Klik rechtsonder op Verwijder <versienummer>.
-
Klik in het bevestigingsvenster op Verwijderen.