Combinaison de tables grâce à Join et Keep

Une jointure est une opération qui utilise deux tables et les combine en une seule. Les enregistrements de la table résultante sont des combinaisons d'enregistrements des tables d'origine, en général sur la base d'une valeur commune pour un ou plusieurs champs communs aux deux enregistrements contribuant à une combinaison donnée, ce qu'on appelle une jointure naturelle. Dans Qlik Sense, les jointures peuvent être réalisées dans le script, ce qui génère des tables logiques.

Il est possible de joindre des tables figurant déjà dans le script. Dans ce cas, la logique de Qlik Sense ne considère pas les tables séparées, mais plutôt le résultat de la jointure, à savoir une seule table interne. Cette solution s'avère nécessaire dans certaines situations, mais elle présente des inconvénients :

  • Les tables chargées deviennent souvent plus volumineuses et Qlik Sense fonctionne plus lentement.
  • Certaines informations risquent de se perdre : il se peut que la fréquence (le nombre d'enregistrements) précisée dans la table de départ ne soit plus disponible.

La fonctionnalité Keep, qui a pour effet de réduire l'une ou l'autre table, ou les deux, à l'intersection des données avant que les tables ne soient stockées dans Qlik Sense, a été conçue dans le but de réduire le nombre de cas où l'utilisation de jointures explicites est nécessaire.

Remarque: Dans cette documentation, le terme jointure désigne habituellement les jointures effectuées avant la création de tables logiques. L'association effectuée après la création des tables internes peut cependant être aussi considérée comme une jointure.

Jointures au sein d'une instruction SQL SELECT

Certains pilotes ODBC permettent de procéder à une jointure dans l'instruction SELECT. Cela revient pratiquement à utiliser le préfixe Join.

Toutefois, la plupart des pilotes ODBC ne sont pas capables de créer une jointure externe complète (bidirectionnelle). Ils sont uniquement capables d'effectuer une jointure externe gauche ou droite. Une jointure externe gauche (droite) n'inclut que les combinaisons où la clé de jointure existe dans la table de gauche (droite). Une jointure externe complète inclut toutes les combinaisons. Qlik Sense crée automatiquement une jointure externe complète.

En outre, la création de jointures dans les instructions SELECT s'avère bien plus compliquée que dans Qlik Sense.

Example:  

SELECT DISTINCTROW

[Order Details].ProductID, [Order Details].

UnitPrice, Orders.OrderID, Orders.OrderDate, Orders.CustomerID

FROM Orders

RIGHT JOIN [Order Details] ON Orders.OrderID = [Order Details].OrderID;

Cette instruction SELECT joint une table contenant des commandes envoyées à une entreprise fictive à une table contenant les détails des commandes. Il s'agit d'une jointure externe droite, ce qui signifie que tous les enregistrements de OrderDetails sont inclus, ainsi que ceux qui comprennent un OrderID ne figurant pas dans la table Orders. Les commandes figurant dans Orders mais pas dans OrderDetails sont cependant exclues.

Join

La façon la plus simple de créer une jointure consiste à utiliser le préfixe Join dans le script, qui joint la table interne à une autre table existante ou à la dernière table créée. La jointure est une jointure externe, qui permet de créer toutes les combinaisons possibles de valeurs des deux tables.

Example:  

LOAD a, b, c from table1.csv;

join LOAD a, d from table2.csv;

La table interne résultante comprend les champs a, b, c et d. Le nombre d'enregistrements varie en fonction des valeurs de champ des deux tables.

Remarque: Les noms des champs de jointure doivent être exactement identiques. Le nombre de champs de jointure est arbitraire. Les tables doivent généralement comporter un ou plusieurs champs en commun. En l'absence de champ commun, la fonction génère le produit cartésien des tables. Que les tables aient tous leurs champs en commun est aussi possible, mais cela n'a habituellement aucun sens. À moins que le nom d'une table déjà chargée soit spécifié dans l'instruction Join, le préfixe Join utilise la dernière table créée. L'ordre des deux instructions n'est donc pas arbitraire.

Pour plus d'informations, voir Join.

Keep

Dans le script de chargement de données, le préfixe Join explicite procède à une jointure complète des deux tables. Le résultat en est une seule table. De telles jointures produisent bien souvent de très grandes tables. L'une des principales caractéristiques de Qlik Sense est sa capacité à effectuer des associations entre plusieurs tables au lieu de les joindre, ce qui réduit l'espace mémoire utilisé, augmente la vitesse et offre une grande souplesse. La fonctionnalité keep a été conçue pour réduire le nombre de cas d'utilisation de jointures explicites.

Le préfixe Keep placé entre deux instructions LOAD ou SELECT a pour effet de réduire l'une ou l'autre table, ou les deux, à l'intersection de leurs données avant qu'elles ne soient stockées dans Qlik Sense. Le préfixe Keep doit toujours être précédé d'un des mots clés Inner, Left ou Right. La sélection des enregistrements à partir des tables suit le même principe que la jointure correspondante. Cependant, les deux tables ne sont pas jointes et sont stockées dans Qlik Sense comme deux tables nommées distinctes.

Pour plus d'informations, voir Keep.

Inner

Dans le script de chargement de données, les préfixes Join et Keep peuvent être précédés du préfixe Inner.

Utilisé avant Join, il indique que la jointure des deux tables doit être une jointure interne. La table obtenue contient ainsi uniquement des combinaisons des deux tables avec un ensemble de données complet des deux côtés.

S'il est utilisé avant Keep, il indique que les deux tables doivent être réduites à leur intersection commune avant d'être stockées dans Qlik Sense.

Example:  

Ces exemples font appel aux tables source Table1 et Table2 :

Table 1
A B
1 aa
2 cc
3 ee
Table2
A C
1 xx
4 yy

Inner Join

Pour commencer, on procède à une jointure Inner Join des tables, ce qui entraîne une table VTable ne contenant qu'une seule ligne, le seul enregistrement existant dans les deux tables, les données des deux tables étant combinées.

VTable:

SELECT * from Table1;

inner join SELECT * from Table2;

VTable
A B C
1 aa xx

Inner Keep

Si Inner Keep est utilisé à la place, vous disposez toujours de deux tables. Les deux tables sont bien entendu associées par le champ commun A.

VTab1:

SELECT * from Table1;

VTab2:

inner keep SELECT * from Table2;

VTab1
A B
1 aa
VTab2
A C
1 xx

Pour plus d'informations, voir Inner.

Left

Dans le script de chargement de données, les préfixes Join et Keep peuvent être précédés du préfixe left.

Utilisé avant Join, il indique que la jointure des deux tables doit être une jointure gauche. La table résultante contient ainsi uniquement des combinaisons des deux tables avec un ensemble de données complet provenant de la première table.

S'il est utilisé avant Keep, il indique que la seconde table doit être réduite à son intersection commune avec la première table avant d'être stockée dans Qlik Sense.

Example:  

Ces exemples font appel aux tables source Table1 et Table2 :

Table1
A B
1 aa
2 cc
3 ee
Table2
A C
1 xx
4 yy

Pour commencer, on procède à une jointure Left Join des tables, ce qui entraîne une table VTable contenant toutes les lignes de la table Table1 associées aux champs des lignes correspondantes de la table Table2.

VTable:

SELECT * from Table1;

left join SELECT * from Table2;

VTable
A B C
1 aa xx
2 cc -
3 ee -

Si Left Keep est utilisé à la place, vous disposez toujours de deux tables. Les deux tables sont bien entendu associées par le champ commun A.

VTab1:

SELECT * from Table1;

VTab2:

left keep SELECT * from Table2;

VTab1
A B
1 aa
2 cc
3 ee
VTab2
A C
1 xx

Pour plus d'informations, voir Left.

Right

Dans le script de chargement de données, les préfixes Join et Keep peuvent être précédés du préfixe right.

Utilisé avant Join, il indique que la jointure des deux tables doit être une jointure droite. La table résultante contient ainsi uniquement des combinaisons des deux tables avec un ensemble de données complet provenant de la seconde table.

S'il est utilisé avant Keep, il indique que la première table doit être réduite à son intersection commune avec la seconde table avant d'être stockée dans Qlik Sense.

Example:  

Ces exemples font appel aux tables source Table1 et Table2 :

Table1
A B
1 aa
2 cc
3 ee
Table2
A C
1 xx
4 yy

Pour commencer, on procède à une jointure Right Join des tables, ce qui entraîne une table VTable contenant toutes les lignes de la table Table2 associées aux champs des lignes correspondantes de la table Table1.

VTable:

SELECT * from Table1;

right join SELECT * from Table2;

VTable
A B C
1 aa xx
4 - yy

Si Left Keep est utilisé à la place, vous disposez toujours de deux tables. Les deux tables sont bien entendu associées par le champ commun A.

VTab1:

SELECT * from Table1;

VTab2:

right keep SELECT * from Table2;

VTab1
A B
1 aa
VTab2
A C
1 xx
4 yy

Pour plus d'informations, voir Right.