Apache Parquet 파일 작업
Apache Parquet는 용량 데이터 집합을 저장하고 쿼리하는 데 매우 효율적인 열 기반 저장소 형식입니다. Qlik Sense에서 Parquet 파일의 데이터를 읽고 테이블을 Parquet 파일로 저장할 수 있습니다.
Parquet를 사용하면 전체 테이블을 읽는 대신 테이블의 특정 열을 효율적으로 쿼리할 수 있습니다. 따라서 빅 데이터 처리로 사용하기에 적합합니다. 또한 Parquet는 효율적인 데이터 압축 및 인코딩을 지원합니다. 이렇게 하면 저장소 공간을 더욱 줄이고 쿼리 성능을 향상시킬 수 있습니다.
Parquet 파일 만들기
스크립트에서 저장 명령을 사용하여 Parquet 파일을 만들 수 있습니다. 이전에 읽은 테이블 또는 그 일부를 선택한 위치의 명시적으로 명명한 파일로 내보내도록 스크립트에 명시합니다.
자세한 내용은 Store를 참조하십시오.
Parquet 파일에서 데이터 읽기
Qlik Sense에서 지원하는 다른 데이터 파일과 마찬가지로 Parquet 파일에서 데이터를 읽을 수 있습니다. 여기에는 데이터 관리자, 데이터 로드 편집기 또는 새 앱에 데이터를 추가하는 경우가 포함됩니다.
자세한 내용은 파일에서 데이터 로드을 참조하십시오.
LOAD 명령을 사용하여 데이터 로드 스크립트의 Parquet 파일에서 데이터를 로드할 수도 있습니다. 예:
자세한 내용은 Load를 참조하십시오.
제한 사항
-
중첩 필드 유형은 Qlik Sense에서 지원되지 않습니다. 필드가 로드되지만 콘텐츠는 null이 됩니다.
-
int96 타임스탬프 필드가 포함된 Parquet 파일은 올바르게 로드되지 않을 수 있습니다.
Int96은 표준 시간대 정보가 없는 타임스탬프를 포함하는 더 이상 사용되지 않는 데이터 유형입니다. 필드를 UTC로 읽으려고 시도하지만 공급업체 구현이 다르기 때문에 성공을 보장할 수 없습니다.
로드된 데이터를 확인하고 필요한 경우 오프셋을 사용하여 올바른 표준 시간대에 맞게 조정합니다.