데이터 집합 관리
랜딩, 저장소, 변환 및 데이터 마트 데이터 작업에 포함된 데이터 집합을 관리하여 변환을 만들고 데이터를 필터링하고 열을 추가할 수 있습니다.
포함된 데이터 집합은 디자인 보기에 있는 데이터 집합 아래에 나열됩니다.
데이터 작업의 디자인 보기에 있는 데이터 집합


변환 규칙 및 명시적 변환
전역 및 명시적 변환을 모두 수행할 수 있습니다.
변환 규칙
일치하는 모든 데이터 집합에 적용할 범위에서 %를 와일드카드로 사용하는 변환 규칙을 만들어 전역 변환을 수행할 수 있습니다.
규칙을 클릭한 다음 규칙 추가를 클릭하여 새 변환 규칙을 만듭니다.
자세한 내용은 여러 데이터 집합을 변환하는 규칙 만들기을 참조하십시오.
변환 규칙은 영향을 받는 특성에서 진한 보라색 모서리로 표시됩니다.
명시적 변환
명시적 변환은 다음과 같은 경우에 만들어집니다.
편집을 사용하여 열 특성을 변경하는 경우
데이터 집합에서 이름 바꾸기를 사용하는 경우
열을 추가하는 경우
명시적 변환은 전역 변환을 재정의하고 영향을 받는 특성에 밝은 자주색 모서리로 표시됩니다.
데이터 집합 필터링
필요한 경우 데이터를 필터링하여 행의 하위 집합을 만들 수 있습니다.
필터를 클릭합니다.
자세한 내용은 데이터 집합 필터링을 참조하십시오.
데이터 집합 이름 바꾸기
데이터 집합의 이름을 바꿀 수 있습니다.
데이터 집합에서
을 클릭한 다음 이름 바꾸기를 클릭합니다.
열 추가
필요한 경우 행 수준 변환이 있는 열을 추가할 수 있습니다.
열 추가를 클릭합니다.
자세한 내용은 데이터 집합에 열 추가을 참조하십시오.
열 편집
열을 선택하고 편집을 클릭하여 열 속성을 편집할 수 있습니다.
이름
키
열을 기본 키로 설정합니다. 키 열에서 선택하거나 선택 취소하여 키를 설정할 수도 있습니다.
Null 허용
데이터 유형
열의 데이터 유형을 설정합니다. 일부 데이터 유형의 경우 길이와 같은 추가 속성을 설정할 수 있습니다.
열 제거
데이터 집합에서 하나 이상의 열을 제거할 수 있습니다.
제거할 열을 선택하고 제거를 클릭합니다.
제거된 열을 보려면 제거된 열 표시를 클릭합니다. 제거된 열은 취소선이 표시된 텍스트로 나타납니다. 제거된 열을 선택하고 되돌리기를 클릭하여 검색할 수 있습니다.
열에 대한 명시적 변경 내용 되돌리기
하나 이상의 열에 대한 모든 명시적 변경 내용을 되돌릴 수 있습니다.
변경 내용을 되돌릴 열을 선택하고 되돌리기를 클릭합니다.
전역 변환 규칙의 변경 내용은 되돌릴 수 없습니다.
추가된 열을 되돌리면 제거됩니다.
데이터 집합 설정
데이터 집합에 대한 설정을 변경할 수 있습니다. 기본 설정은 데이터 자산의 설정을 상속하는 것이지만 설정을 명시적으로 켜기 또는 끄기로 변경할 수도 있습니다.
데이터 집합에서
을 클릭한 다음 설정을 클릭합니다.
데이터 집합 유효성 검사 및 조정
데이터 작업에 포함된 모든 데이터 집합의 유효성을 검사할 수 있습니다.
모든 유효성 검사 오류와 설계 변경 내용을 보려면 유효성 검사 및 조정을 확장합니다.
데이터 집합 유효성 검사
데이터 집합 유효성 검사를 클릭하여 데이터 집합의 유효성을 검사합니다.
유효성 검사에는 다음을 확인하는 것이 포함됩니다.
모든 테이블에는 기본 키가 있습니다.
누락된 특성이 없습니다.
중복된 테이블 또는 열 이름이 없습니다.
또한 소스와 비교하여 설계 변경 내용 목록을 얻을 수 있습니다.
추가된 테이블 및 열
삭제된 테이블 및 열
이름이 변경된 테이블 및 열
변경된 기본 키 및 데이터 유형
모든 유효성 검사 오류와 설계 변경 내용을 보려면 유효성 검사 및 조정을 확장합니다.
유효성 검사 오류를 수정한 다음 데이터 집합의 유효성을 다시 검사합니다.
변경된 기본 키 또는 데이터 유형을 제외하고 대부분의 설계 변경 내용은 자동으로 조정될 수 있습니다. 이 경우 데이터 집합을 동기화해야 합니다.
데이터 집합 준비
가능한 경우 데이터 손실 없이 설계 변경을 조정하도록 데이터 집합을 준비할 수 있습니다. 데이터 손실 없이 조정할 수 없는 설계 변경 내용이 있는 경우 데이터 손실이 있는 소스에서 테이블을 다시 만들 수 있습니다.
이를 위해서는 작업을 중지해야 합니다.
을 클릭한 다음 준비를 클릭합니다.
데이터 집합이 준비되면 저장소 작업을 다시 시작하기 전에 데이터 집합의 유효성을 검사합니다.
데이터 집합 다시 만들기
소스에서 데이터 집합을 다시 만들 수 있습니다. 데이터 집합을 다시 만들면 데이터 자산에서 데이터 손실이 발생합니다. 소스 데이터가 있으면 소스에서 다시 로드할 수 있습니다.
이를 위해서는 작업을 중지해야 합니다.
을 클릭한 다음 다시 만들기를 클릭합니다.
제한 사항
Google BigQuery에서 열을 삭제하거나 이름을 바꾸면 테이블이 다시 만들어져 데이터가 손실됩니다.