Apache Parquet 파일 작업

Apache Parquet는 용량 데이터 집합을 저장하고 쿼리하는 데 매우 효율적인 열 기반 저장소 형식입니다. Qlik Sense에서 Parquet 파일의 데이터를 읽고 테이블을 Parquet 파일로 저장할 수 있습니다.

Parquet를 사용하면 전체 테이블을 읽는 대신 테이블의 특정 열을 효율적으로 쿼리할 수 있습니다. 따라서 빅 데이터 처리로 사용하기에 적합합니다. 또한 Parquet는 효율적인 데이터 압축 및 인코딩을 지원합니다. 이렇게 하면 저장소 공간을 더욱 줄이고 쿼리 성능을 향상시킬 수 있습니다.

August 2023 이전의 Qlik Sense 버전에서 만들어진 모든 기존 앱은 Parquet 지원을 활성화하려면 수동으로 업데이트해야 합니다. 이는 August 2023으로 업그레이드되는 배포와 기존 앱을 새 배포로 가져올 때 모두 필요합니다. 앱 업데이트에 대한 자세한 내용은 Qlik Sense에서 기존 앱에 대한 Parquet 파일 지원 활성화를 참조하십시오.

Parquet 파일 만들기

스크립트에서 저장 명령을 사용하여 Parquet 파일을 만들 수 있습니다. 이전에 읽은 테이블 또는 그 일부를 선택한 위치의 명시적으로 명명한 파일로 내보내도록 스크립트에 명시합니다.

자세한 내용은 Store를 참조하십시오.

Parquet 파일에서 데이터 읽기

Qlik Sense에서 지원하는 다른 데이터 파일과 마찬가지로 Parquet 파일에서 데이터를 읽을 수 있습니다. 여기에는 데이터 관리자, 데이터 로드 편집기 또는 새 앱에 데이터를 추가하는 경우가 포함됩니다.

자세한 내용은 파일에서 데이터 로드을 참조하십시오.

LOAD 명령을 사용하여 데이터 로드 스크립트의 Parquet 파일에서 데이터를 로드할 수도 있습니다. 예:

LOAD * from xyz.parquet (parquet);

자세한 내용은 Load를 참조하십시오.

제한 사항

중첩 필드 유형은 Qlik Sense에서 지원되지 않습니다. 필드가 로드되지만 콘텐츠는 null이 됩니다.
int96 타임스탬프 필드가 포함된 Parquet 파일은 올바르게 로드되지 않을 수 있습니다.

Int96은 표준 시간대 정보가 없는 타임스탬프를 포함하는 더 이상 사용되지 않는 데이터 유형입니다. 필드를 UTC로 읽으려고 시도하지만 공급업체 구현이 다르기 때문에 성공을 보장할 수 없습니다.

로드된 데이터를 확인하고 필요한 경우 오프셋을 사용하여 올바른 표준 시간대에 맞게 조정합니다.

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 알려 주십시오!

여기에 피드백을 남겨주십시오.