De belangrijkste beïnvloeders achter uw gegevens ontdekken met behulp van factoranalyse
Met factoranalyse kunt u de bronnen van specifieke trends in uw gegevens identificeren en vergelijken. Een factoranalyse helpt u bij het visualiseren en rangschikken van de invloed die een gedefinieerde set factoren heeft op de huidige gegevens voor een specifiek doelveld. Gebruik de inzichten die u ontdekt om de analytische en besluitvormingsprocessen van uw organisatie te verbeteren en te versterken.
Factoranalyse is beschikbaar in een Qlik Sense-applicatie. Voer factoranalyse uit in de werkbladweergave in de analysemodus.
Factoranalyse is niet beschikbaar in Qlik Sense Business, Qlik Cloud Analyse Standaard of Qlik Anonymous Access.
Factoranalyse in een Qlik Sense-applicatie
Wat is factoranalyse?
Factoranalyse is een vorm van statistische gegevensontdekking waarmee u kunt bepalen in welke mate verschillende factoren van invloed zijn op de uitkomst van één enkele doelmetriek. De analyse wordt uitgevoerd voor zowel kwantitatieve als kwalitatieve gegevens. De bedoeling achter een factoranalyse is om precies te achterhalen wat een bepaalde trend in de gegevens veroorzaakt, en deze inzichten te gebruiken om direct actie te ondernemen of het bewustzijn binnen de organisatie te vergroten.
In business intelligence zijn veelvoorkomende doelen waarvoor u beïnvloeders wilt evalueren velden zoals Verkoop, Klanttevredenheid, Marge, Verloop en Verkoopkosten. Voorbeelden van factoren zijn Product, Locatie, Winkelnummer en Manager.
De metrieken die in een factoranalyse worden geëvalueerd, verschillen per organisatie en use case. De doelmetriek en de verschillende factoren die de uitkomsten ervan beïnvloeden, zijn afhankelijk van het probleem dat u wilt oplossen, de beschikbare gegevens en andere factoren.
Waarom een factoranalyse gebruiken?
Factoranalyse is nuttig in business intelligence omdat het op talloze manieren kan worden toegepast om key performance indicators te verbeteren. U kunt een factoranalyse gebruiken om problemen op te lossen en inzichten te verkrijgen met betrekking tot productinvesteringen, omzetgroei, kostenreductie, klanttevredenheid en vele andere zaken.
In Qlik Sense is factoranalyse geïntegreerd in de consumentenervaring van de applicatie. Met behulp van de realtime mogelijkheden voor gegevensanalyse die eigen zijn aan Qlik Sense, kunt u een nieuwe factoranalyse uitvoeren telkens wanneer de applicatiegegevens veranderen. Hierdoor kunt u uw gegevens continu controleren op wijzigingen en snel opkomende trends ontdekken, zodat u waar nodig direct en effectief actie kunt ondernemen.
Hoe het werkt
Factoranalyse is gecentreerd rond het idee van invloed. In Qlik Sense evalueert factoranalyse de invloed die specifieke velden (functies of factoren) hebben op een bepaald veld van belang (het doel).
De gegevens die in de analyse worden gebruikt
Een factoranalyse is een specifiek onderzoek van een subset van uw gegevens. Wanneer u de analyse maakt, selecteert u bepaalde velden als de componenten van de analyse.
U moet voor elke analyse de volgende bouwstenen kiezen:
-
Doel
-
Meerdere functies
Nadat u deze componenten hebt geselecteerd, wordt er een specifieke gegevensset gemaakt op basis van uw gegevensmodel met behulp van het doel en de functies. De factoranalyse gebruikt deze gegevensset, en niet uw volledige gegevensmodel, om de invloed te bepalen die de functies op het doel hebben. Velden die u niet in de configuratie opneemt, worden niet geanalyseerd.
Hieronder vindt u meer informatie over elke component.
Invloed berekenen
In Qlik Sense wordt factoranalyse uitgevoerd door de SHAP-waarden te berekenen voor elke functiegegevenswaarde in de subset van gegevens die u analyseert. Deze SHAP-waarden worden gegenereerd op basis van een model dat is getraind door Qlik Predict. Modellen gebruiken het random forest-algoritme om de SHAP-waarden te genereren.
De SHAP-waarde is een berekening van de mate van impact die een gegevenswaarde heeft op de bijbehorende doelwaarde, in verhouding tot de andere functies in de gegevensset die specifiek is gemaakt op basis van uw factoranalyseconfiguratie. Wanneer u de resultaten van een factoranalyse bekijkt, bekijkt u aggregaties van de SHAP-waarden over alle of een bepaalde set records in de gegevensset.
Voor meer informatie over SHAP-belang in Qlik Predict, raadpleegt u SHAP importance in experimenttrainingen begrijpen.
Het doel
Het doel is het veld waarvoor u factoren wilt analyseren. U wilt bijvoorbeeld vergelijken hoe bepaalde factoren uw verkoop beïnvloeden. In dit geval selecteert u een verkoopmeting als uw doel.
Bij het selecteren van uw doel is het tijdstip van beschikbaarheid van gegevens belangrijk, met name in relatie tot de functies die u in uw analyse wilt opnemen. Voor meer informatie over de juiste tijdsbestekken voor gegevensverzameling voor uw doel en functies, raadpleegt u Functies.
Het aantal unieke waarden en het type gegevens in het doel bepalen het type probleem dat de analyse zal oplossen. Dit heeft op zijn beurt invloed op de vereisten waaraan uw gegevens moeten voldoen. Voor meer informatie, raadpleegt u Gegevensvereisten.
Factoranalyse ondersteunt de volgende probleemtypen:
-
Regressie
-
Binaire classificatie
Regressieanalyses
Regressieanalyses worden gebruikt wanneer het doel een groot aantal unieke numerieke waarden bevat. Als u een numerieke berekening (meting) als uw doel gebruikt, zal de factoranalyse de configuratie waarschijnlijk interpreteren als een regressieprobleem.
Wanneer u een meting als uw doel kiest, kunt u een basisaggregatie rechtstreeks toepassen op het veld binnen de configuratie, of een bestaand masteritem selecteren als u een complexere expressie wilt gebruiken.
Binaire classificatieanalyses
Als uw doel slechts twee unieke waarden bevat (bijvoorbeeld ja of nee), interpreteert de factoranalyse de configuratie als een binair classificatieprobleem. Binaire classificatieanalyses worden gemaakt door een binaire dimensie als doel te selecteren.
Als een veelvoorkomend voorbeeld: als u een veld Verloop in uw applicatie hebt om bij te houden welke klanten een bepaalde service hebben geannuleerd, kunt u het veld Verloop als doel selecteren om te ontdekken welke factoren ten grondslag liggen aan die beslissingen van klanten.
Functies
De functies zijn uw factoren. Dit zijn de velden die extraheerbare informatie bevatten over wat trends in de gegevens beïnvloedt. Wanneer u bijvoorbeeld een factoranalyse maakt om beïnvloeders achter de verkoop te identificeren, kunt u dimensies zoals Locatie, Producttype, Winkelnummer en Vertegenwoordiger als functies selecteren. Berekende metingen kunnen ook als functies worden gebruikt.
U moet alleen functies opnemen die gegevens bevatten die kunnen worden vastgelegd en verzameld vóór het tijdstip waarop u uw doelgegevens verzamelt. Als u functies opneemt die gegevens bevatten die u pas zou weten op het moment van gegevensverzameling voor het doel, zal de analyse vertekend zijn en geen analytische waarde bieden.
Als uw doel bijvoorbeeld Verkoop is, moet u geen functies opnemen die gegevens bevatten die daar direct van zijn afgeleid. Evenzo, als uw doel een veld Verloop is met een binaire uitkomst (Ja of Nee), moet u geen functie opnemen die de datum bevat waarop de klant is vertrokken.
Voor meer informatie over het identificeren van ongeldige analyseresultaten, raadpleegt u Ongeldige resultaten identificeren.
Aan een functie wordt een van de volgende twee typen toegewezen:
-
Categorische functie: een functie die gegevenswaarden bevat op basis van afzonderlijke, terugkerende categorieën. Een voorbeeld van een categorische functie kan een veld Continent zijn, waarin er slechts een handvol mogelijke waarden zijn en deze niet worden geïnterpreteerd als ruwe numerieke gegevens, maar in plaats daarvan als tekst. Getallen kunnen als categorieën worden gebruikt.
-
Numerieke functie: een functie waarbij de gegevenswaarden puur numerieke gegevens zijn en niet tot categorieën behoren.
Alle opgenomen functies worden specifiek geanalyseerd om te bepalen hoeveel invloed elk heeft op de huidige gegevens in het doel.
Voor meer informatie over vereisten voor het doel en de opgenomen functies, raadpleegt u Gegevensvereisten.
Applicatieselecties
De selecties die u in de applicatie maakt, worden gebruikt in de factoranalyse. U wilt bijvoorbeeld factoren voor verkoop ontdekken, maar wanneer u een dimensie Winkelnummer als functie opneemt, wilt u mogelijk alleen de invloed van vijf specifieke winkels in uw organisatie analyseren. Om dit te doen, kunt u de waarden in de applicatie selecteren en vervolgens de factoranalyse configureren.
Omdat selecties in feite filters zijn die op het gegevensmodel worden toegepast, is het belangrijk om u ervan bewust te zijn dat het maken van selecties in één veld van invloed kan zijn op de beschikbare gegevens die in de analyse kunnen worden gebruikt.
Overwegingen voor het tenant-abonnement
Factoranalyse is afhankelijk van Qlik Predict om de invloed van de functies op het doel te berekenen. Dit gebeurt door machine learning-modellen te maken die worden gebruikt om SHAP-waarden te berekenen voor de gegevenspunten die overeenkomen met de opgenomen functies in de geselecteerde gegevenssubset.
Het maken van een factoranalyse verbruikt services die worden gemeten door Qlik Predict. Een bepaalde hoeveelheid Qlik Predict-gebruik is inbegrepen bij de meeste Qlik Cloud-abonnementen. Als er meer capaciteit nodig is, is een upgrade naar een betaalde laag van Qlik Predict vereist.
Neem contact op met uw serviceaccounteigenaar en raadpleeg de voorwaarden van het abonnement dat u gebruikt om uw capaciteit voor het gebruik van factoranalyse te achterhalen.
De volgende bronnen kunnen aanvullende details bieden:
-
De productbeschrijving voor Qlik Cloud®-abonnementen
Gegevensvereisten
Minimale vereisten voor gegevensvolume
De gegevensset die is gemaakt op basis van uw doel en functies moet ten minste 400 cellen bevatten. Anders kunt u de analyse niet uitvoeren.
Andere vereisten
De volgende vereisten zijn van toepassing op de gegevensset die is gemaakt op basis van uw analyseconfiguratie:
-
Het doel moet ten minste twee unieke waarden bevatten.
-
Als het doel tussen de twee en tien unieke waarden bevat, moet elke unieke waarde in ten minste tien records in de gegevensset voorkomen.
Als u fouten tegenkomt bij het uitvoeren van een factoranalyse, kan het zijn dat de gegevens die u voor de analyse hebt geselecteerd niet aan deze vereisten voldoen. Voor andere problemen die u kunt tegenkomen en een lijst met mogelijke oplossingen, raadpleegt u Problemen oplossen .
Factoranalyse gebruiken in Qlik Sense
De volgende helponderwerpen kunnen u op weg helpen bij het maken en interpreteren van factoranalyses in Qlik Sense:
Beperkingen
Hieronder vindt u een lijst met beperkingen voor factoranalyse:
-
Velden die de gegevenstypen datum, tijd of tijdstempel bevatten, worden niet ondersteund voor gebruik als doel of als functies.