PostgreSQL
W tej sekcji wyjaśniono, jak skonfigurować łączność z miejscem docelowym PostgreSQL przy użyciu łącznika miejsca docelowego PostgreSQL. PostgreSQL może być miejscem docelowym tylko w zadaniu replikacji. Zanim będzie można się połączyć z miejscem docelowym PostgreSQL, należy skonfigurować Wymagane uprawnienia w bazie danych. Jeśli łączysz się z PostgreSQL przez Brama danych ruchu danych, musisz również zainstalować sterownik zgodnie z opisem w Konfiguracja sterowników.
Aby uzyskać informacje o ograniczeniach i kwestiach do uwzględnienia w związku z używaniem łącznika PostgreSQL, zobacz temat Ograniczenia i uwagi.
Konfiguracja właściwości połączenia
Aby skonfigurować łącznik, wykonaj następujące czynności:
-
W obszarze Połączenia kliknij Utwórz połączenie.
-
Wybierz łącznik miejsca docelowego PostgreSQL, a następnie podaj następujące ustawienia:
Miejsce docelowe danych
-
Brama danych: Podczas pracy z bramą Brama danych ruchu danych wybierz bramę danych, która będzie używana do testowania połączenia z miejscem docelowym PostgreSQL. Powinna to być ta sama brama, która została użyta do uzyskania dostępu do źródła danych.
Informacja- To pole jest niedostępne w subskrypcji Qlik Talend Cloud Starter, ponieważ brama Brama danych ruchu danych jest nieobsługiwana na tym poziomie subskrypcji.
-
Należy też zainstalować odpowiedni sterownik na urządzeniu z Brama danych ruchu danych. Szczegółowe informacje zawiera temat Konfiguracja sterowników poniżej.
-
Dostawca usługi w chmurze: wybierz jedną z poniższych opcji odpowiednio do potrzeb:
-
Brak — wybierz, jeżeli pracujesz z:
- PostgreSQL lokalnie
- Amazon Aurora
- Azure Database for PostgreSQL – Flexible Server
- Nie Brama danych ruchu danych
-
Amazon RDS
W przypadku Amazon RDS for PostgreSQL.
-
Google Cloud — wybierz, jeżeli pracujesz z:
- Google Cloud SQL for PostgreSQL
- Google Cloud AlloyDB for PostgreSQL
-
Microsoft Azure
W przypadku Microsoft Azure Database for PostgreSQL.
-
-
Host: nazwa hosta lub adres IP komputera, na którym zainstalowana jest baza danych PostgreSQL.
-
Port: Port używany do łączenia się z bazą danych. Wartością domyślną jest 5432.
Właściwości konta
User Name (Nazwa użytkownika) i Password (Hasło): nazwa użytkownika i hasło użytkownika uprawnionego do dostępu do bazy danych PostgreSQL Server.
Właściwości bazy danych
-
Nazwa bazy danych: istnieją dwie metody określania bazy danych:
- Metoda 1 — wybór z listy: Kliknij Load databases, a następnie wybierz bazę danych.
- Metoda 2 — ręcznie: Wybierz pozycję Wprowadź nazwę bazy danych ręcznie, a następnie wprowadź nazwę bazy danych.
- SSL Mode (Tryb SSL): wybierz jedną z następujących opcji:
- disable — połączenie tylko przy użyciu nazwiska i hasła.
- allow — nawiąż szyfrowane połączenie, jeśli zażąda go serwer.
- prefer — jest to ustawienie domyślne. Ustanawia połączenie szyfrowane, gdy serwer obsługuje połączenia szyfrowane, albo połączenie nieszyfrowane, jeśli nie można nawiązać połączenia szyfrowanego.
- require — ustanawia połączenie szyfrowane, gdy serwer obsługuje połączenia szyfrowane. Jeśli nie można nawiązać połączenia szyfrowanego, próba połączenia się nie uda.
- verify-ca — opcja podobna do require, ale dodatkowo weryfikuje certyfikat urzędu certyfikacji (CA) serwera względem skonfigurowanych certyfikatów CA. Jeśli nie zostaną znalezione ważne i zgodne certyfikaty urzędu certyfikacji, próba połączenia się nie uda.
- verify-full — opcja podobna do verify-ca, ale dodatkowo przeprowadza weryfikację tożsamości nazwy hosta przez sprawdzenie nazwy hosta (tj. Qlik Talend Data Integration) używanej do połączenia z serwerem względem tożsamości w certyfikacie, który serwer wysyła do klienta. Klient sprawdza, czy nazwa hosta używana do połączenia jest zgodna z wartością nazwy pospolitej (CN) w certyfikacie serwera. Jeśli nazwa jest niezgodna, połączenie się nie uda.
- Trusted certificate urząd certyfikacji (CA), który wystawił plik certyfikatu klienta w formacie PEM.
- Client certificate: prześlij certyfikat klienta żądany przez serwer.
- Client certificate key (Klucz certyfikatu klienta): plik klucza prywatnego klienta w formacie PEM.
- CRL: certyfikat CRL. Ten plik zawiera certyfikaty odwołane przez urzędy certyfikacji. Jeśli certyfikat serwera występuje na tej liście, połączenie się nie uda.
- SSL compression (Kompresja SSL): zaznacz tę opcję, aby kompresować dane przed zaszyfrowaniem.
- Maksymalny rozmiar pliku (KB): Wybierz lub wpisz maksymalny rozmiar (w KB) pliku CSV, zanim zostanie załadowany do docelowej bazy danych PostgreSQL. Wartość domyślna wynosi 32000 KB.
Właściwości wewnętrzne
Właściwości wewnętrzne są przeznaczone dla specjalnych przypadków, w związku z czym nie są ukazywane w oknie dialogowym. Należy ich używać tylko na polecenie Qlik Pomocy technicznej.
Użyj przycisków i znajdujących się po prawej stronie pól, aby dodać lub usunąć właściwości zgodnie z potrzebą.
Nazwa
Nazwa wyświetlana dla połączenia.
Wymagania wstępne
Wymagane uprawnienia
Użytkownik określony w ustawieniach łącznika musi być zarejestrowanym użytkownikiem w bazie danych PostgreSQL.
Ponadto należy przyznać następujące uprawnienia:
- Może się logować
- Tworzenie baz danych
Konfiguracja sterowników
Sterownik driver można zainstalować za pomocą Narzędzia do instalacji sterowników (zalecane) lub ręcznie. Instalacji ręcznej należy próbować tylko w mało prawdopodobnym przypadku wystąpienia problemu z Narzędziem do instalacji sterowników.
Używanie Narzędzia do instalacji sterowników w celu instalacji sterownika
W tej sekcji opisano, jak zainstalować wymagany driver. Proces ten obejmuje uruchomienie skryptu, który automatycznie pobierze, zainstaluje i skonfiguruje wymagany driver. W razie potrzeby można także uruchamiać skrypty, aby zaktualizować i odinstalować driver.
Przygotowanie instalacji
-
Na serwerze bramy Ruch danych musi być zainstalowane środowisko Python 3.6 lub nowsze.
Środowisko Python jest preinstalowane w większości dystrybucji systemu Linux. Aby sprawdzić, która wersja środowiska Pythona jest zainstalowana w Twoim systemie, uruchom następujące polecenie:
python3 --version
Instalowanie aplikacji driver
Aby pobrać i zainstalować driver:
-
Na urządzenie bramy Ruch danych zmień katalog roboczy na:
opt/qlik/gateway/movement/drivers/bin
-
Wykonaj następujące polecenie:
Składnia:
./install postgres
Jeśli driver nie może zostać pobrany (ze względu na ograniczenia dostępu lub problemy techniczne), zostanie wyświetlony komunikat informujący, skąd pobrać driver i dokąd go skopiować na urządzenie bramy Ruch danych. Po wykonaniu tej czynności ponownie uruchom polecenie install postgres.
W przeciwnym razie zostanie wyświetlona umowa licencyjna dotycząca driver.
-
Wykonaj jedną z poniższych czynności:
- Naciśnij klawisz [Enter] wielokrotnie, aby powoli przewinąć treść umowy licencyjnej.
- Naciśnij klawisz spacji wielokrotnie, aby szybko przewinąć treść umowy licencyjnej.
- Naciśnij klawisz „q”, aby zamknąć tekst umowy licencyjnej i wyświetlić opcje jej akceptacji.
-
Wykonaj jedną z poniższych czynności:
- Wpisz „y” i naciśnij klawisz [Enter], aby zaakceptować umowę licencyjną i rozpocząć instalację.
- Wpisz „n” i naciśnij klawisz [Enter], aby odrzucić umowę licencyjną i zakończyć instalację.
-
Wpisz „v” i naciśnij klawisz [Enter], aby ponownie wyświetlić umowę licencyjną.
Zostanie zainstalowany driver.
driver — aktualizacja
Uruchom polecenie aktualizacji, jeśli chcesz odinstalować driver w poprzedniej wersji, zanim zainstalujesz dostarczony driver.
Aby pobrać i zaktualizować driver:
-
Na urządzenie bramy Ruch danych zmień katalog roboczy na:
opt/qlik/gateway/movement/drivers/bin
-
Wykonaj następujące polecenie:
Składnia:
./update postgres
Jeśli driver nie może zostać pobrany (ze względu na ograniczenia dostępu lub problemy techniczne), zostanie wyświetlony komunikat informujący, skąd pobrać driver i dokąd go skopiować na urządzenie bramy Ruch danych. Po wykonaniu tej czynności ponownie uruchom polecenie update postgres.
W przeciwnym razie zostanie wyświetlona umowa licencyjna dotycząca driver.
-
Wykonaj jedną z poniższych czynności:
- Naciśnij klawisz [Enter] wielokrotnie, aby powoli przewinąć treść umowy licencyjnej.
- Naciśnij klawisz spacji wielokrotnie, aby szybko przewinąć treść umowy licencyjnej.
- Naciśnij klawisz „q”, aby zamknąć tekst umowy licencyjnej i wyświetlić opcje jej akceptacji.
-
Wykonaj jedną z poniższych czynności:
- Wpisz „y” i naciśnij klawisz [Enter], aby zaakceptować umowę licencyjną i rozpocząć instalację.
- Wpisz „n” i naciśnij klawisz [Enter], aby odrzucić umowę licencyjną i zakończyć instalację.
- Wpisz „v” i naciśnij klawisz [Enter], aby wyświetlić umowę licencyjną od początku.
Stary driver zostanie odinstalowany, a zainstalowany zostanie nowy driver.
driver — odinstalowywanie
Uruchom polecenie odinstalowania, jeśli chcesz odinstalować driver.
Aby odinstalować driver:
-
Zatrzymaj wszystkie zadania skonfigurowane do korzystania z tego łącznika.
-
Na urządzenie bramy Ruch danych zmień katalog roboczy na:
opt/qlik/gateway/movement/drivers/bin
-
Wykonaj następujące polecenie:
Składnia:
./uninstall postgres
Sterownik driverzostanie odinstalowany.
Instalowanie sterowników i bibliotek ręcznie
Sterownik driver należy instalować ręcznie tylko wtedy, gdy automatyczna instalacja nie zakończyła się pomyślnie.
Po zainstalowaniu Brama danych ruchu danych pobierz następujące pliki RPM. Łącza do bezpośredniego pobrania tych plików można znaleźć w sekcji binary-artifacts w pliku /opt/qlik/gateway/movement/drivers/manifests/postgres.yaml. Po zakończeniu pobierania skopiuj pliki na komputer z Brama danych ruchu danych.
Kiedy brama Brama danych ruchu danych jest zainstalowana w systemie Red Hat 9.x:
- postgresql<wersja>-libs-<wersja>PGDG.rhel9.x86_64.rpm
- postgresql<wersja>-<wersja>PGDG.rhel8.x86_64.rpm
- postgresql<wersja>-odbc-<wersja>PGDG.rhel8.x86_64.rpm
Kiedy brama Brama danych ruchu danych jest zainstalowana w systemie Red Hat 8.x:
- postgresql<version>-libs-<version>PGDG.rhel8.x86_64.rpm
- postgresql<version>-<version>PGDG.rhel8.x86_64.rpm
- postgresql<version>-odbc-<version>PGDG.rhel8.x86_64.rpm
Na serwerze Data Movement gateway otwórz wiersz poleceń i wykonaj następujące czynności:
-
Zatrzymaj usługę Data Movement gateway:
sudo systemctl stop repagent
-
Opcjonalnie potwierdź, że usługa została zatrzymana:
sudo systemctl status repagent
Status powinien być następujący:
Active: inactive (dead) since <timestamp> ago
-
Zainstaluj pliki RPM.
-
Zmień katalog roboczy na <Data Movement gateway-Install-Dir>/bin.
-
Skopiuj lokalizację sterownika do pliku site_arep_login.sh w następujący sposób:
echo "export LD_LIBRARY_PATH=\$LD_LIBRARY_PATH:/usr/lib:/usr/lib64:/usr/pgsql-<version>/lib" >> site_arep_login.sh
Spowoduje to dodanie sterownika do "LD_LIBRARY_PATH" i zaktualizuje lokalizację sterownika w pliku site_arep_login.sh.
-
Opcjonalnie potwierdź, że lokalizacja sterownika została skopiowana:
cat site_arep_login.sh
-
Upewnij się, że w pliku /etc/odbcinst.ini znajduje się wpis dotyczący PostgreSQL, jak w poniższym przykładzie:
[PostgreSQL]
Description = PostgreSQL ODBC driver
Driver = /usr/pgsql-13/lib/psqlodbc.so
Setup = /usr/pgsql-13/lib/psqlodbcw.so
UsageCount = 1
-
Uruchom usługę Data Movement gateway:
sudo systemctl start repagent
-
Opcjonalnie potwierdź, że usługa została uruchomiona:
sudo systemctl status repagent
Status powinien być następujący:
Active: active (running) since <timestamp> ago
Ograniczenia i uwagi
W przypadku używania PostgreSQL jako miejsca docelowego replikacji obowiązują następujące ograniczenia:
- Operacje UPDATE i DELETE na tabelach bez klucza podstawowego/indeksu unikatowego zawierających zduplikowane rekordy są nieobsługiwane. Wszelkie zmiany w tych tabelach będą miały wpływ na wszystkie rekordy w miejscu docelowym.
- Tabele z kolumną LOB w kluczu nie są obsługiwane w trybie stosowania zoptymalizowanego pod kątem partii. Jeśli jako klucz tabeli źródłowej zostanie użyta kolumna VARBINARY, w miejscu docelowym zostanie utworzona kolumna BYTEA. Powoduje to nieprzewidywalne działanie w trybie stosowania zoptymalizowanego pod kątem partii. Jako obejście proponujemy użycie funkcji SQLite HEX do konwersji VARBINARY na VARCHAR.
Typy danych
Informacje o natywnym typie danych są zachowywane i wyświetlane w widokach zestawu danych w kolumnie Natywny typ danych. Jeśli kolumna nie jest widoczna, otwórz selektor kolumn w widoku zestawu danych i wybierz kolumnę Natywny typ danych.
Typy danych Qlik Cloud | Typy danych PostgreSQL |
---|---|
BOOL |
BOOL |
BYTES |
BYTEA |
DATE |
DATE |
TIME |
TIME |
DATETIME |
Jeżeli skala => 0 i =< 6, to: TIMESTAMP Jeżeli skala => 7 i =< 12, to: VARCHAR (37) |
INT1 |
SMALLINT |
INT2 |
SMALLINT |
INT4 |
INTEGER |
INT8 |
BIGINT |
NUMERIC |
DECIMAL (P, S) |
REAL4 |
FLOAT4 |
REAL8 |
FLOAT8 |
STRING |
Jeżeli długość wynosi 1–21845, to: VARCHAR (długość w bajtach = wartość STRING pomnożona przez trzy) Jeżeli długość wynosi 21846–2147483647, to: VARCHAR (65535) |
UINT1 |
SMALLINT |
UINT2 |
INTEGER |
UINT4 |
BIGINT |
UINT8 |
BIGINT |
WSTRING |
Jeżeli długość wynosi 1–21845, to: VARCHAR (długość w bajtach = wartość WSTRING pomnożona przez trzy) Jeżeli długość wynosi 21846–2147483647, to: VARCHAR (65535) |
BLOB |
BYTEA |
NCLOB |
TEXT |
CLOB |
TEXT |
Typy danych podczas replikacji ze źródła PostgreSQL
Podczas replikacji ze źródła PostgreSQL tabela docelowa zostanie utworzona z tymi samymi typami danych dla wszystkich kolumn, z wyjątkiem kolumn z typami danych zdefiniowanymi przez użytkownika lub PostGIS. W takich przypadkach typ danych zostanie utworzony w celu jako „character varying”.