Inzichten over uw trainingsgegevens bekijken
Wanneer u uw trainingsgegevens toevoegt en versies van de training uitvoert, hebt u toegang tot inzichten over hoe uw gegevens worden verwerkt. De Inzichten bieden informatie over het doel en de functies in uw experiment, zoals functies die zijn weggelaten, niet beschikbaar zijn of met een speciale verwerking worden gecodeerd.
De kolom Inzichten bevindt zich in de Schemaweergave wanneer u zich op het tabblad Configuratie/Trainingsgegevens bevindt. Verkorte inzichten zijn ook beschikbaar in de
Gegevensweergave. Inzichten worden afzonderlijk gemaakt voor elk model dat binnen het experiment is getraind.
Kolom Inzichten in Schemaweergave
Inzichten worden gegenereerd:
-
Nadat u trainingsgegevens hebt toegevoegd of gewijzigd, maar nog geen experimentversies hebt uitgevoerd.
-
Nadat elke experimentversie is uitgevoerd. Er wordt een afzonderlijke set inzichten gemaakt voor elk getraind model.
De inzichten kunnen verschillen voor en na het uitvoeren van een versie. Dit komt omdat bij de start van de training Qlik Predict uw gegevens kan voorverwerken en problemen met de gegevens verder kan diagnosticeren. Voor meer informatie raadpleegt u Geautomatiseerde voorbereiding en transformatie.
Inzichten bekijken voorafgaand aan de training
Voordat u een versie van het experiment uitvoert, kunt u de Inzichten analyseren om te zien hoe de huidige trainingsgegevens worden geïnterpreteerd. Deze inzichten kunnen veranderen nadat u de versie hebt uitgevoerd.
Doe het volgende:
-
Zorg er in een experiment voor dat u de trainingsgegevens hebt toegevoegd die u wilt gebruiken voor de experimentversie.
-
Open het tabblad Configuratie/Trainingsgegevens.
-
Zorg ervoor dat u zich in de
Schemaweergave bevindt.
-
Analyseer de kolom Inzichten. Tooltips bieden aanvullende context achter de inzichten. Voor verdere uitleg over wat elk inzicht betekent, raadpleegt u Inzichten in de dataset interpreteren.
De inzichten voor een model bekijken
Nadat de modellen klaar zijn met trainen voor een experimentversie, selecteert u een model en controleert u hoe de gegevens zijn verwerkt.
Doe het volgende:
-
Voer een experimentversie uit en open vervolgens het tabblad Configuratie/Trainingsgegevens.
-
Selecteer een model in de vervolgkeuzelijst op de werkbalk.
-
Zorg ervoor dat u zich in de
Schemaweergave bevindt.
-
Analyseer de kolom Inzichten. Tooltips bieden aanvullende context achter de inzichten. Voor verdere uitleg over wat elk inzicht betekent, raadpleegt u Inzichten in de dataset interpreteren.
Inzichten in de dataset interpreteren
De volgende tabellen bieden meer details over de mogelijke inzichten die in het schema kunnen worden weergegeven.
Algemene inzichten
| Inzicht | Betekenis | Impact op configuratie | Wanneer het inzicht wordt bepaald | Aanvullende referenties |
|---|---|---|---|---|
| Constant | De kolom heeft dezelfde waarde voor alle rijen. | De kolom kan niet worden gebruikt als doel of opgenomen functie. | Voor en na het uitvoeren van de versie | Kardinaliteit |
| One-hot encoded | Het functietype is categorisch en de kolom heeft minder dan 14 unieke waarden. | Geen effect op configuratie. | Voor en na het uitvoeren van de versie | Categorische encoding |
| Impact encoded | Het functietype is categorisch en de kolom heeft 14 of meer unieke waarden. | Geen effect op configuratie. | Voor en na het uitvoeren van de versie | Categorische encoding |
| Hoge cardinaliteit | De kolom heeft te veel unieke waarden en kan de prestaties van het model negatief beïnvloeden als deze als functie wordt gebruikt. | De kolom kan niet als doel worden gebruikt. Deze wordt automatisch uitgesloten als functie, maar kan indien nodig nog steeds worden opgenomen. | Voor en na het uitvoeren van de versie | Kardinaliteit |
| Schaarse gegevens | De kolom heeft te veel null-waarden. | De kolom kan niet worden gebruikt als doel of opgenomen functie. | Voor en na het uitvoeren van de versie | Imputatie van null-waarden |
| Ondervertegenwoordigde klasse | De kolom heeft een klasse met minder dan 10 rijen. | De kolom kan niet als doel worden gebruikt, maar kan wel als functie worden opgenomen. | Voor en na het uitvoeren van de versie | - |
| Functietransformatie mislukt | Het functietype van een functie is handmatig gewijzigd ten opzichte van het standaardtype. Met deze configuratie is een fout opgetreden. | De experimentversie kan niet met succes worden uitgevoerd met deze functietransformatie. Zet het functietype van de functie terug naar de vorige waarde of sluit de functie uit van de training. | Na het uitvoeren van de versie | Functietypen wijzigen |
Inzichten in automatische functie-engineering
| Inzicht | Betekenis | Impact op configuratie | Wanneer het inzicht wordt bepaald | Aanvullende referenties |
|---|---|---|---|---|
| <aantal> automatisch gegenereerde functies | De kolom is de bovenliggende functie die kan worden gebruikt om automatisch gegenereerde functies te genereren. | Als deze bovenliggende functie wordt geïnterpreteerd als een datumfunctie, wordt deze automatisch uit de configuratie verwijderd. Het wordt aanbevolen om in plaats daarvan de automatisch gegenereerde datumfuncties te gebruiken die hieruit kunnen worden gegenereerd. Het is mogelijk om deze instelling te negeren en de functie op te nemen in plaats van de automatisch gegenereerde functies. | Voor en na het uitvoeren van de versie | Automatische functieontwikkeling |
| Automatisch gegenereerde functie | De kolom is een automatisch gegenereerde functie die kan worden of is gegenereerd op basis van een bovenliggende datumfunctie. Deze kwam niet voor in de oorspronkelijke dataset. | U kunt een of meer van deze automatisch gegenereerde functies verwijderen tijdens de experimenttraining. Als u het functietype van de bovenliggende functie wijzigt in categorisch, worden alle automatisch gegenereerde functies verwijderd. | Voor en na het uitvoeren van de versie | Automatische functieontwikkeling |
| Kon niet als datum worden verwerkt | De kolom bevat mogelijk datum- en tijdgegevens, maar kon niet worden gebruikt om automatisch gegenereerde datumfuncties te maken. | De functie is weggelaten uit de configuratie. Als er eerder automatisch gegenereerde functies zijn gegenereerd op basis van deze bovenliggende functie, worden deze verwijderd uit toekomstige experimentversies. U kunt de functie nog steeds in het experiment gebruiken, maar u moet het functietype wijzigen in categorisch. | Na het uitvoeren van de versie | Automatische functieontwikkeling |
| Mogelijke vrije tekst | De kolom is mogelijk beschikbaar voor gebruik als een vrije-tekstfunctie. | Het functietype vrije tekst is toegewezen aan de kolom. U moet een experimentversie uitvoeren om te bevestigen of de functie als vrije tekst kan worden verwerkt. | Voor het uitvoeren van de versie | Automatische functieontwikkeling |
| Vrije tekst | Er is bevestigd dat de kolom vrije tekst bevat. Deze kan als vrije tekst worden verwerkt. | Er zijn geen aanvullende configuraties vereist voor de functie. | Na het uitvoeren van de versie | Automatische functieontwikkeling |
| Kon niet als vrije tekst worden verwerkt | Na verdere analyse blijkt dat de kolom niet als vrije tekst kan worden verwerkt. | U moet de selectie van de functie in de configuratie ongedaan maken voor de volgende experimentversie. Als de functie geen hoge cardinaliteit heeft, kunt u het functietype ook wijzigen in categorisch. | Na het uitvoeren van de versie | Automatische functieontwikkeling |
Inzichten in intelligente modeloptimalisatie
| Inzicht | Betekenis | Impact op configuratie | Wanneer het inzicht wordt bepaald | Aanvullende referenties |
|---|---|---|---|---|
| Target leakage | Er bestaat een vermoeden dat de functie wordt beïnvloed door target leakage. Als dat zo is, bevat deze informatie over de doelkolom die u probeert te voorspellen. Functies met target leakage kunnen een vals gevoel van zekerheid geven over de prestaties van het model. In praktijkvoorspellingen zorgen ze ervoor dat het model zeer slecht presteert. | De functie is niet gebruikt om het model te trainen. | Na het uitvoeren van de versie | Lekken van gegevens |
| Lage permutatie-importantie | De functie heeft weinig tot geen invloed op de modelvoorspellingen. Het verwijderen van deze functies verbetert de prestaties van het model door statistische ruis te verminderen. | De functie is niet gebruikt om het model te trainen. | Na het uitvoeren van de versie | Permutatie-urgentie begrijpen |
| Sterk gecorreleerd | De functie is sterk gecorreleerd met een of meer andere functies in het experiment. Het hebben van functies die sterk met elkaar gecorreleerd zijn, vermindert de prestaties van het model. | De functie is niet gebruikt om het model te trainen. De functie waarmee deze sterk gecorreleerd is, is niet weggelaten vanwege de sterke correlatie, maar kan om een andere reden zijn weggelaten, zoals een lage permutatie-importantie. | Na het uitvoeren van de versie | Correlatie |
Inzichten in tijdreeksprognoses
| Inzicht | Betekenis | Impact op configuratie | Wanneer het inzicht wordt bepaald | Aanvullende referenties |
|---|---|---|---|---|
| Mogelijke datumindex | De functie kan mogelijk worden gebruikt als datumindex voor het tijdreeksexperiment. |
Indien gebruikt als datumindex voor een tijdreeks, kunnen de gegevens in de kolom van invloed zijn op aspecten van de tijdreeksconfiguratie, zoals hoe ver in de toekomst u kunt voorspellen. Waarden in de datumindex moeten bij elke rij of unieke groepswaarde toenemen met een vast tijdsinterval. |
Voor het uitvoeren van de versie |
Inzichten in biasdetectie
| Inzicht | Betekenis | Impact op configuratie | Wanneer het inzicht wordt bepaald | Aanvullende referenties |
|---|---|---|---|---|
| Databias gedetecteerd | Met betrekking tot de waarden in de doelkolom zijn sommige groepen (waarden) ondervertegenwoordigd in vergelijking met andere. | Analyseer de resultaten van de biasdetectie om de volgende stappen te bepalen. Dit kan het weglaten van de functie, het wijzigen van de dataset of het maken van een nieuw experiment met een herzien kader omvatten. | Na het uitvoeren van de versie | Bias detecteren in machine learning-modellen |
| Representatiebias gedetecteerd | Er is bias gedetecteerd in de manier waarop het getrainde model de gegevens van de functie gebruikt om voorspellingen te doen. | Analyseer de resultaten van de biasdetectie om de volgende stappen te bepalen. Dit kan het weglaten van de functie, het wijzigen van de dataset of het maken van een nieuw experiment met een herzien kader omvatten. | Na het uitvoeren of de versie | Bias detecteren in machine learning-modellen |