Hash160() returns a 160-bit hash of the combined input expression values. The result is a 27-character string. Hash160()은 결합된 입력 표현식 값의 160비트 해시 값을 반환합니다. 결과는 27자의 문자열입니다. 해시 값은 고객 이름, 사회보장번호, 계좌번호와 같은 PII(개인 식별 정보)를 마스킹하는 데 유용합니다.
=Hash160(ProductID, ProductName, SupplierID)는 27자 키를 계산합니다.
결과 테이블
TransactionID
ProductID
ProductName
SupplierID
Hash160(ProductID, ProductName, SupplierID)
1
101
Widget A
S001
CY`&^(N,E/#`TJT4&]/7N1Q+*T3
2
102
Widget B
S002
O7(1;V1%MG;Z+A[/H)G5&`6RA0(
3
101
Widget A
S001
CY`&^(N,E/#`TJT4&]/7N1Q+*T3
Hash160 함수의 출력을 비교합니다. 첫 번째와 세 번째 TransactionID 레코드에는 ProductID, ProductName 및 SupplierID 문자열의 조합이 이러한 행에서 동일하기 때문에 해시 값이 중복됩니다.
예 - 데이터를 익명화하기 위한 Hash160 시나리오
개요
금융 서비스 회사는 신용 카드 번호, 주민등록번호, 고객 이름 등 중요한 고객 정보를 처리합니다. 개인 정보를 보호하고 일반 데이터 보호 규정(GDPR)이나 건강보험 양도성 및 책임법(HIPAA)과 같은 규정을 준수하려면 분석을 위한 보고서를 생성할 때 중요한 데이터를 익명화해야 합니다. 하지만 고객의 ID를 밝히지 않고도 다양한 데이터 집합에서 동일한 고객을 추적할 수 있도록 일관성을 유지해야 합니다.
데이터 로드 편집기를 열고 아래의 로드 스크립트를 새 탭에 추가합니다.
로드 스크립트에는 다음이 포함됩니다.
Example이라는 데이터 테이블에 로드되는 데이터 집합입니다.
데이터 테이블의 필드는 다음과 같습니다.
CustomerID
CustomerName
SSN
로드 스크립트
Example:
Load *
inline [
CustomerID, CustomerName, SSN
101, John Doe, 123-45-6789|
102, Jane Smith, 987-65-4321
];
결과
데이터를 로드하고 시트를 엽니다. 새 테이블을 만들고 다음 필드를 차원으로 추가합니다.
CustomerID
CustomerName
SSN
다음과 같이 계산 차원을 만듭니다.
=Hash160(CustomerName)
=Hash160(SSN)
결과 테이블
CustomerID
CustomerName
SSN
Hash160(CustomerName)
Hash160(SSN)
101
John Doe
123-45-6789|
GMD(*B9*!PQ&MTY2@$4A\KCL?[0
N&[PSH:I$M?OF<5/9LV&N*;`CZ(
102
Jane Smith
987-65-4321
EP@9]GSI)5G\I*,B?H,C?A$%VG:
HCFXMR'2=\3WF6?_\6LN;.*6:K?
출력은 다음과 같은 이점이 있는 고유 키를 생성합니다.
데이터 개인정보 보호: 원래의 중요한 데이터는 직접 볼 수 없지만 해시 값은 여러 레코드에서 일관되게 유지됩니다. 이를 통해 고객의 실제 ID를 노출하지 않고도 고객 활동을 집계하는 등의 분석이 가능해집니다.
규정 준수: 회사는 중요한 필드를 해싱하여 데이터 개인정보 보호 규정을 준수합니다.
보안: 해시 함수는 되돌릴 수 없는 고정된 크기의 출력을 생성하므로 중요한 데이터에 대한 보호 계층을 추가합니다.
이 페이지가 도움이 되었습니까?
이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 개선 방법을 알려 주십시오!