Modification des noms de champ
Il est parfois nécessaire de renommer des champs afin d'obtenir les associations voulues. Un champ peut être renommé pour trois raisons principales :
- Deux champs sont nommés différemment bien qu'ils désignent la même chose :
- Le champ ID dans la table Customers
- Le champ CustomerID dans la table Orders
Les deux champs indiquent un code d'identification client spécifique et doivent porter le même nom, soit CustomerID.
- Deux champs sont nommés de la même manière mais renvoient à des éléments différents :
- Le champ Date dans la table Invoices
- Le champ Date dans la table Orders
-
Il se peut également que des erreurs (fautes d'orthographe dans la base de données ou conventions différentes d'utilisation des majuscules et des minuscules) se produisent.
Il serait préférable de renommer les deux champs en, par exemple, InvoiceDate et OrderDate.
Les champs peuvent être renommés dans le script, ce qui évite d'avoir à modifier les données d'origine. Il existe deux façons différentes de renommer des champs, comme illustré dans les exemples suivants.
Utilisation de l'instruction alias
L'instruction LOAD ou SELECT peut être précédée d'une instruction alias.
Alias ID as CustomerID;
LOAD * from Customer.csv;
Utilisation du spécificateur as
L'instruction LOAD ou SELECT peut contenir le spécificateur as.
LOAD ID as CustomerID, Name, Address, Zip, City, State from Customer.csv;