LevenshteinDist - 스크립트 및 차트 함수
LevenshteinDist()는 두 문자열 사이의 Levenshtein 거리를 반환합니다. 이는 한 문자열을 다른 문자열로 변경하는 데 필요한 최소 단일 문자 편집 수(삽입, 삭제 또는 대체)로 정의됩니다.
이 함수는 퍼지 문자열 비교에 유용합니다.
구문:
LevenshteinDist(text1, text2)
반환 데이터 유형: 정수
| LevenshteinDist('Kitten','Sitting') | 3을 반환합니다. |
로드 스크립트
T1:
Load *, recno() as ID;
Load 'Silver' as String_1,* inline [
String_2
Sliver
SSiver
SSiveer ];
T1:
Load *, recno()+3 as ID;
Load 'Gold' as String_1,* inline [
String_2
Bold
Bool
Bond ];
T1:
Load *, recno()+6 as ID;
Load 'Ove' as String_1,* inline [
String_2
Ove
Uve
Üve ];
T1:
Load *, recno()+9 as ID;
Load 'ABC' as String_1,* inline [
String_2
DEFG
abc
ビビビ ];
set nullinterpret = '<NULL>';
T1:
Load *, recno()+12 as ID;
Load 'X' as String_1,* inline [
String_2
''
<NULL>
1 ];
R1:
Load
ID,
String_1,
String_2,
LevenshteinDist(String_1, String_2) as LevenshteinDistance
resident T1;
Drop table T1;
결과
| 1 | Silver | Sliver | 2 |
| 2 | Silver | SSiver | 2 |
| 3 | Silver | SSiveer | 3 |
| 4 | Gold | 굵게 | 1 |
| 5 | Gold | BOOL | 3 |
| 6 | Gold | Bond | 2 |
| 7 | Ove | Ove | 0 |
| 8 | Ove | Uve | 1 |
| 9 | Ove | Üve | 1 |
| 10 | ABC | DEFG | 4 |
| 11 | ABC | abc | 3 |
| 12 | ABC | ビビビ | 3 |
| 13 | 엑스 | | 1 |
| 14 | 엑스 | - | 1 |
| 15 | 엑스 | 1 | 1 |