Inzichten over uw trainingsgegevens
Terwijl u uw trainingsgegevens toevoegt en versies van de training uitvoert, krijgt u inzicht in hoe er met uw gegevens wordt omgegaan. Inzichten biedt informatie over het doel en de functies in uw experiment, zoals functies die zijn verwijderd, niet beschikbaar zijn of met een speciale bewerking worden versleuteld.
U vindt de kolom Inzichten op het tabblad Gegevens als u de Schemaweergave gebruikt. Ingekorte inzichten zijn ook beschikbaar in de Gegevensweergave. Inzichten worden afzonderlijk gemaakt voor elk model dat binnen het experiment wordt getraind.
Inzichten worden gegenereerd:
-
Nadat u de trainingsgegevens hebt toegevoegd of gewijzigd, maar nog geen experimentversies hebt uitgevoerd.
-
Nadat elke experimentversie is uitgevoerd. Als een afzonderlijk set inzichten is gemaakt voor elk getraind model.
De inzichten kunnen voor en na het uitvoeren van een versie verschillen. Als de training begint, kan AutoML de gegevens namelijk voorbewerken en problemen met de gegevens diagnosticeren. Ga voor meer informatie naar Geautomatiseerde voorbereiding en transformatie.
Inzichten voorafgaand aan de training weergeven
Voordat u een versie van het experiment uitvoert, kunt u de inzichten analyseren om te zien hoe de huidige trainingsgegevens worden geïnterpreteerd. Deze inzichten kunnen veranderen nadat u de versie hebt uitgevoerd.
Doe het volgende:
Zorg in een experiment dat u de trainingsgegevens hebt toegevoegd die u voor de experimentversie wilt gebruiken.
Open het tabblad Gegevens.
Zorg dat u zich in de schemaweergave bevindt.
Analyseer de kolom Inzichten. Knopinfo biedt aanvullende context over de inzichten. Zie Inzichten over gegevensverzamelingen interpreteren voor een uitgebreide uitleg over alle inzichten.
De inzichten voor een model weergeven
Nadat de modellen hun training voor een experimentversie hebben voltooid, kunt u een model selecteren en inspecteren hoe de gegevens zijn verwerkt.
Doe het volgende:
Voer een experimentversie uit en open vervolgens het tabblad Gegevens.
Selecteer een model in de vervolgkeuzelijst in de werkbalk.
Zorg dat u zich in de schemaweergave bevindt.
Analyseer de kolom Inzichten. Knopinfo biedt aanvullende context over de inzichten. Zie Inzichten over gegevensverzamelingen interpreteren voor een uitgebreide uitleg over alle inzichten.
Inzichten over gegevensverzamelingen interpreteren
De volgende tabel toont meer informatie over de mogelijke inzichten die in het schema worden weergegeven.
Inzicht | Betekenis | Impact op configuratie | Wanneer het inzicht is bepaald | Aanvullende verwijzingen |
---|---|---|---|---|
Constante | De kolom heeft dezelfde waarde voor alle rijen. | De kolom kan niet worden gebruikt als een doel of toegevoegde functie. | Voor en nadat de versie is uitgevoerd | Kardinaliteit |
One-hot encoded | Het functietype is categorisch en de kolom bevat minder dan veertien unieke waarden. | Geen effect op configuratie. | Voor en nadat de versie is uitgevoerd | Categorische encoding |
Impact gecodeerd | Het functietype is categorisch en de kolom bevat veertien of meer unieke waarden. | Geen effect op configuratie. | Voor en nadat de versie is uitgevoerd | Categorische encoding |
Hoge kardinaliteit | De kolom bevat te veel unieke waarden en dat kan negatieve impact hebben op de prestaties van het model indien het wordt gebruikt als functie. | De kolom kan niet worden gebruikt als een doel. Hij wordt automatisch uitgesloten als functie, maar kan zo nodig nog wel worden toegevoegd. | Voor en nadat de versie is uitgevoerd | Kardinaliteit |
Verspreide gegevens | De kolom bevat te veel null-waarden. | De kolom kan niet worden gebruikt als een doel of toegevoegde functie. | Voor en nadat de versie is uitgevoerd | Imputatie van null-waarden |
Ondervertegenwoordigde klasse | De kolom heeft een klasse met minder dan tien rijen. | De kolom kan niet worden gebruikt als een doel, maar kan worden toegevoegd als een functie. | Voor en nadat de versie is uitgevoerd | - |
<aantal> automatisch ontwikkelde functies | De kolom is de bovenliggende functie die kan worden gebruikt om automatisch ontwikkelde functies te genereren. | Als de bovenliggende functie wordt geïnterpreteerd als een datumfunctie, wordt deze automatisch verwijderd uit de configuratie. Het wordt aanbevolen dat u in plaats daarvan de automatisch ontwikkelde datumfuncties gebruikt die op basis daarvan kunnen worden gegenereerd. Het is mogelijk om deze instelling te overschrijven en de functie toe te voegen in plaats van de automatisch ontwikkelde functies. | Voor en nadat de versie is uitgevoerd | Automatische kenmerkontwikkeling |
Automatisch gegenereerd functie | De kolom is een automatisch ontwikkeld functie die kan worden, of is gegeneerd vanuit een bovenliggende datumfunctie. Het komt niet voor in de oorspronkelijke gegevensverzameling. | U kunt een of meerdere van deze automatisch ontwikkelde functies tijdens de experimenttraining verwijderen. Als u het functietype van de bovenliggende functie instelt op categorisch, worden alle automatisch ontwikkelde functies verwijderd. | Voor en nadat de versie is uitgevoerd | Automatische kenmerkontwikkeling |
Kan niet worden verwerkt als datum | De kolom bevat mogelijk datum- en tijdinformatie, maar kan niet worden gebruikt om automatisch ontwikkelde datumfuncties te maken. | De functie wordt verwijderd uit de configuratie. Als automatisch ontwikkelde functies eerder zijn gegenereerd uit deze bovenliggende functie, worden ze verwijderd uit toekomstige experimentversies. U kunt de functie in het experiment nog wel gebruiken, maar u moet dit functietype wijzigen in categorisch. | Nadat de versie is uitgevoerd | Ontwikkeling van datumkenmerken |
Mogelijke vrije tekst | De kolom is mogelijk beschikbaar om te gebruiken als vrijetekstfunctie. | Het functietype Vrije tekst wordt toegewezen aan de kolom. U moet een experimentversie uitvoeren om te bevestigen of dehet functie als vrije tekst kan worden verwerkt. | Voordat de versie is uitgevoerd | Hantering van vrijetekstgegevens |
Vrije tekst | Er is bevestigd dat de kolom vrije tekst bevat. Deze kan als vrije tekst worden verwerkt. | Er zijn geen aanvullende configuraties voor de functie vereist. | Nadat de versie is uitgevoerd | Hantering van vrijetekstgegevens |
Kan niet worden verwerkt als vrije tekst | Na verdere analyse is gebleken dat de kolom niet als vrije tekst kan worden verwerkt. | U moet de functie deselecteren in de configuratie voor de volgende experimentversie. Als de functie geen hoge cardinaliteit heeft, kunt u het functietype eventueel wijzigen in Categorisch. | Nadat de versie is uitgevoerd | Hantering van vrijetekstgegevens |
Doellek | Het vermoeden bestaat dat de functie wordt beïnvloed door een doellek. Indien dit het geval is, wordt informatie bijgevoegd over de doelkolom die u probeert te voorspellen. Functies met een doellek kunnen u een vals gevoel van zekerheid geven over de prestaties van het model. In werkelijke voorspellingen zorgen ze ervoor dat model slecht presteert. | De functie is niet gebruikt om het model te trainen. | Nadat de versie is uitgevoerd | Lekken van gegevens |
Laag permutatiebelang | Defunctie heeft weinig, of geen, invloed op de modelprestaties. Door het verwijderen van deze functies worden de modelprestaties verbetert omdat ruis wordt verminderd. | De functie is niet gebruikt om het model te trainen. | Nadat de versie is uitgevoerd | Permutatie-urgentie begrijpen |
Hoge correlatie | De functie heeft een hoge correlatie met een of meer functies in het experiment. De modelprestaties nemen af als onderlinge functies een hoge correlatie hebben. | De functie is niet gebruikt om het model te trainen. De functie waarmee het een hoge correlatie heeft is niet verwijderd vanwege de hoge correlatie, maar kan om een andere reden zijn verwijderd, zoals een lage permutatie-urgentie. | Nadat de versie is uitgevoerd | Correlatie |