실험 구성 | Qlik Cloud 도움말
기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

실험 구성

실험 구성은 모델이 대상을 예측하는 데 사용할 대상 및 기능을 선택하는 것으로 이루어집니다. 여러 선택적 설정을 구성할 수도 있습니다.

대상을 선택하는 데 도움을 주기 위해 기록 데이터 세트가 분석되고 데이터 세트의 각 열에 대한 요약 통계가 표시됩니다. 적합한 데이터만 포함되도록 데이터 세트에 여러 자동 전처리 단계가 적용됩니다. 데이터 전처리에 대한 자세한 내용은 자동 데이터 준비 및 변환을 참조하십시오.

v1을 실행한 후 필요한 경우 모델 학습을 추가로 세분화하기 위해 새 실험 버전을 만들 수 있습니다. 자세한 내용은 모델 정제을 참조하십시오.

요구 사항 및 권한

ML 실험 작업에 대한 사용자 요구 사항에 대해 자세히 알아보려면 Working with experiments을 참조하십시오.

인터페이스

다음 섹션에서는 실험을 구성하기 위해 실험 인터페이스를 탐색하는 방법을 개략적으로 설명합니다. 인터페이스에 대한 자세한 내용은 실험 인터페이스 탐색을 참조하십시오.

탭 탐색

실험을 만들면 구성 탭이 열립니다. 여기서 실험의 대상 및 기능을 구성할 수 있습니다.

하나 이상의 실험 버전을 실행한 후 구성 탭은 학습 데이터가 됩니다. 다른 탭도 사용할 수 있게 됩니다. 이러한 다른 탭을 통해 해당 버전에서 방금 학습시킨 모델을 분석할 수 있습니다. 다른 기능 선택으로 후속 버전을 구성해야 하는 경우 학습 데이터 탭으로 돌아갈 수 있습니다.

스키마 보기데이터 보기

구성/학습 데이터 탭에서 다음 보기 간에 전환할 수 있습니다.

  • 행 스키마 보기: 기본 보기입니다. 이 보기에서 데이터 세트의 각 열은 정보 및 통계가 포함된 스키마의 행으로 표시됩니다.

  • 표 데이터 보기: 각 열에 대한 자세한 정보 및 샘플 데이터에 액세스하는 데 사용할 수 있는 대체 보기입니다.

ML 실험의 스키마 보기

ML 실험의 스키마 보기

ML 실험의 데이터 보기

ML 실험의 데이터 보기

실험 구성 패널

실험 구성 패널에서 실험 학습을 추가로 사용자 지정할 수 있습니다. 이 패널은 새 실험에서 기본적으로 열려 있습니다.

버전을 실행한 후 컨트롤 구성 보기를 클릭하여 다음 버전을 구성할 패널을 엽니다.

실험 구성 패널을 사용하여 다음을 수행할 수 있습니다.

  • 대상 및 실험 유형 선택

  • 버전 이름 설정

  • 기능 추가 또는 제거

  • 실험의 새 버전 구성

  • 훈련 중인 모델 유형 보기

  • 훈련 데이터 세트를 변경하거나 새로 고치도록 선택

  • 알고리즘 추가 또는 제거

  • 모델 최적화 설정 변경

  • 시계열 모델의 경우 예측 설정 지정

  • 편향 감지 구성

실험 구성 패널

선택한 대상, 실험 유형 및 기본 기능 선택이 포함된 실험 구성 패널

대상 및 실험 유형 선택

첫 번째 학습을 시작할 때까지 대상 열과 실험 유형을 변경할 수 있습니다. 그 이후에는 편집할 수 없도록 잠김 상태가 됩니다.

대상 열에는 머신 러닝 모델이 예측하려는 값이 포함되어 있습니다.

실험 유형은 대상과 대상에 포함된 데이터 유형에 의해 결정됩니다. 실험 유형은 학습시키려는 모델 유형을 정의합니다. 다음 옵션을 사용할 수 있습니다.

  • 이진 분류: 두 가지 가능한 값(예: 예 또는 아니요)이 있는 대상을 예측하도록 모델을 학습시킵니다. 데이터는 모든 기능 유형일 수 있습니다.

  • 다중 클래스 분류: 3~10개의 가능한 값(예: 범주 목록)이 있는 대상을 예측하도록 모델을 학습시킵니다. 데이터는 모든 기능 유형일 수 있지만 고유한 비수치 클래스(값)가 10개보다 많은 열은 대상으로 선택할 수 없습니다.

  • 회귀: 10개 이상의 가능한 값이 있는 대상, 특히 수치 기능 유형의 대상을 예측하도록 모델을 학습시킵니다.

  • 시계열: 기록 데이터를 활용하여 특정 미래 기간의 대상 값을 예측하도록 모델을 학습시킵니다. 대상은 10개 이상의 고유한 값을 가져야 하며 수치 데이터를 가져야 합니다. 자세한 내용은 시계열 실험 작업을 참조하십시오.

  1. In 행 스키마 보기 또는 표 데이터 보기, 열 위로 마우스를 가져갑니다.

  2. 표시되는 대상 아이콘을 클릭합니다.

    이제 대상 열은 대상로 표시되고 다른 사용 가능한 열은 기능으로 자동 선택됩니다.

    스키마 보기에서 대상 선택

    대상 기호가 있는 데이터 세트 열.
  3. 실험 구성 패널의 실험 설정에서 필요한 경우 학습 전에 대상을 변경할 수 있습니다.

  4. 정보 메모실험 설정에는 실험 유형 선택기가 포함될 수 있습니다. 예를 들어 데이터 세트 및 대상에 대해 시계열 예측이 가능한 경우 실험 유형을 회귀에서 시계열로 변경하는 옵션이 있습니다.

대상 및 실험 유형을 선택하면 실험의 첫 번째 버전을 실행할 수 있습니다. 자세한 내용은 실험 학습에서 읽어보십시오. 이 시점에서 아래에 설명된 추가 구성을 수행하거나 학습 결과를 검토한 후 구성을 조정할 수 있습니다.

실험 학습이 계속됨에 따라 데이터가 해석되고 처리되는 방식에 대한 설명이 표시됩니다. 자세한 내용은 데이터 세트 인사이트 해석을 참조하십시오.

기능 열 선택

대상이 설정되면 다른 사용 가능한 열 중 모델 학습에 포함할 열을 선택할 수 있습니다. 모델의 일부로 원하지 않는 기능은 제외합니다. 해당 열은 데이터 세트에 유지되지만 학습 알고리즘에는 사용되지 않습니다.

실험 구성 패널 상단에서 데이터 세트의 셀 수를 확인할 수 있습니다. 이 수가 데이터 세트 제한을 초과하는 경우 기능을 제외하여 제한 미만으로 낮출 수 있습니다.

다양한 방법으로 기능 열을 선택할 수 있습니다:

스키마 보기데이터 보기에서

기본 보기에서 다음을 수행할 수 있습니다.

  • 사용 가능한 모든 기능 포함을 선택 해제한 다음 포함할 기능만 선택합니다.

  • 포함하지 않으려는 기능의 확인란을 수동으로 선택 해제합니다.

  • 검색을 수행하고 필터링된 검색 결과의 모든 기능을 제외하거나 포함합니다.

실험 구성 패널에서

실험 구성 패널에서 다음을 수행할 수 있습니다.

  • 포함하지 않으려는 기능의 확인란을 수동으로 선택 해제합니다.

  • 실험의 첫 번째 버전을 실행한 후 포함할 상위 기능 수를 정의할 수 있습니다.

실험 구성 패널의 기능 섹션

Qlik 프로젝트 실험 구성 패널의 기능 섹션

기능을 선택하면 기능 유형이 자동으로 할당됩니다. 가능한 기능 유형은 다음과 같습니다.

  • 범주형

  • 수치형

  • 날짜

  • 자유 텍스트

기능 유형은 기능 열에 포함된 데이터를 기반으로 할당됩니다. 기능이 특정 기준을 충족하는 경우 자동 엔지니어링된 기능의 기반이 되도록 선택될 수 있습니다. 원하는 경우 해당 기능이 자동 기능 엔지니어링에 사용되는지 여부를 변경할 수 있습니다. 자동 기능 엔지니어링에 대한 자세한 내용은 자동 기능 엔지니어링을 참조하십시오.

데이터 세트의 특정 열은 실험의 기능으로 선택할 수 없거나 특정 처리가 적용될 수 있습니다. 실험 학습을 탐색할 때 데이터가 해석되고 처리되는 방식에 대한 설명이 표시됩니다. 자세한 내용은 데이터 세트 인사이트 해석을 참조하십시오.

편향 감지 구성

민감한 데이터가 포함된 기능에 대해 편향 감지를 활성화할 수 있습니다. 편향 감지는 실험을 실행할 때 수행됩니다. 편향 감지를 실행하기 전에 생성형 AI를 사용하여 학습 데이터에서 민감할 수 있는 기능을 검색하려면 권장 사항 가져오기를 클릭할 수도 있습니다.

편향 감지는 기능이 예측에서 불공정한 결과를 초래할 모델의 가능성을 높이는지 또는 원본 데이터가 본질적으로 편향되어 있는지 여부를 결정합니다.

  1. ML 실험에서 학습 구성 패널의 편향을 확장합니다.

  2. 편향 감지를 위한 기능을 선택하기 전에, 생성형 AI를 사용하여 편향된 데이터를 포함할 수 있는 기능을 제안하도록 권장 사항 가져오기를 선택적으로 클릭할 수 있습니다. 편향 감지를 위한 기능 권장을 위해 생성형 AI 사용을 참조하십시오.

  3. 편향 감지를 실행하려는 기능을 선택하거나 선택 취소합니다.

또는 행 스키마 보기에서 원하는 기능에 대한 편향 감지를 켭니다.

편향 감지에 대한 자세한 내용은 머신러닝 모델에서 편향 감지을 참조하십시오.

알고리즘 선택

기본적으로 사용 가능한 모든 알고리즘이 포함되며 사용하지 않으려는 알고리즘은 제외할 수 있습니다. 일반적으로 첫 번째 학습 결과를 확인한 후 모델 세분화의 일부로 이 작업을 수행합니다. 자세한 내용은 모델 정제에서 읽어보십시오.

실험 구성 패널의 알고리즘 섹션

Qlik 프로젝트 실험 구성 패널의 알고리즘 섹션.

기능 유형 변경

데이터 세트가 로드되면 데이터 유형 및 기타 특성을 기반으로 열이 범주형, 수치형, 날짜 또는 자유 텍스트로 처리됩니다. 경우에 따라 이 설정을 변경할 수 있습니다.

예를 들어 요일이 1~7 숫자로 표시되는 경우 각 숫자는 범주형 값을 나타냅니다. 기본적으로 연속적인 순위가 지정된 수치 값으로 처리되므로 범주형으로 처리하려면 구성을 수동으로 변경해야 합니다.

열에 날짜 및 시간 정보가 포함된 것으로 식별되면 새로 생성된 자동 엔지니어링된 기능의 기반으로 사용됩니다. 이 경우 원래 열(상위 기능)은 날짜 기능 유형을 갖는 것으로 처리됩니다.

상위 기능을 날짜 기능에서 범주형 또는 수치형 기능으로 변경할 수 있습니다. 예를 들어 기능이 날짜로 식별되었지만 문자열이나 숫자로 처리해야 하는 경우에 유용합니다. 이 작업을 수행하면 실험 학습에서 해당 자동 엔지니어링된 기능을 더 이상 사용할 수 없습니다.

  1. In 행 스키마 보기, 기능을 찾습니다.

  2. 이 기능의 기능 유형 열에서 아래쪽 화살표를 클릭합니다.

  3. 목록에서 값을 선택합니다.

또는 표 데이터 보기에서 기능 유형을 변경할 수 있습니다. 기능을 찾은 다음 현재 기능 유형 옆에 있는 아래쪽 화살표를 클릭합니다. 목록에서 값을 선택합니다.

시계열 예측

이동하는 시계열 실험을 학습시키는 경우 구성에 따라 특정 기능 유형 변환이 자동으로 적용됩니다. 예를 들어 다변량 예측에 사용할 그룹을 선택하면 이러한 그룹의 기능 유형이 자동으로 범주형으로 전환됩니다.

예측에 미치는 영향

수동으로 기능 유형을 변경한 다음 결과 모델을 배포하는 경우 기능 유형 재정의는 해당 모델로 만든 예측에 사용되는 적용 데이터 집합의 기능에 적용됩니다.

데이터 세트 변경

첫 번째 실험 버전을 실행하기 전뿐만 아니라 버전을 실행한 후에도 학습 데이터 세트를 변경할 수 있습니다.

첫 번째 버전을 실행하기 전에 데이터 세트를 변경하면 데이터 세트를 변경하기 전에 수행한 모든 구성이 손실됩니다.

  1. 실험 구성 패널의 학습 데이터데이터 세트 검토에서 데이터 세트 변경을 클릭합니다.

  2. 새 데이터 세트를 선택합니다.

모델 세분화 중(실험 버전을 실행한 후) 데이터 세트를 변경하고 새로 고치는 방법에 대한 자세한 내용은 데이터 세트 변경 및 새로 고침을 참조하십시오.

모델 최적화 구성

실험 유형이진 분류, 다중 클래스 분류 또는 회귀인 경우 다음 설정을 조정하여 모델을 최적화할 수 있습니다.

  • 지능형 모델 최적화 켜기 또는 끄기

  • 하이퍼파라미터 최적화 켜기 또는 끄기

  • 시간 인식 학습 켜기 또는 끄기

이러한 옵션은 실행하는 실험의 각 버전에 대해 켜거나 끌 수 있습니다.

실험 구성 패널의 모델 최적화 섹션

Qlik 프로젝트 학습 구성 패널의 모델 최적화 섹션

지능형 최적화 구성

기본적으로 실험은 지능형 모델 최적화를 사용합니다. 지능형 모델 최적화를 사용하면 Qlik 프로젝트가 기능 선택을 반복하고 데이터에 고급 변환을 적용하여 모델 세분화 프로세스를 대신 처리합니다.

지능형 최적화에 대한 자세한 내용은 지능형 모델 최적화을 참조하십시오.

이 설정을 꺼서 학습시키는 모델을 수동으로 세분화할 수 있습니다. 예를 들어 지능형 모델 최적화로 모델 학습을 시작한 다음 v2에 대해 수동 세분화로 전환하여 구성을 추가로 조정할 수 있습니다.

  1. 컨트롤 구성 보기를 클릭합니다.

  2. 이미 실험 버전을 하나 이상 실행한 경우 새 버전을 클릭합니다.

  3. 패널에서 모델 최적화를 확장합니다.

  4. 지능형에서 수동으로 전환합니다.

  5. 슬라이더를 사용하여 학습의 최대 실행 기간을 설정합니다.

하이퍼파라미터 최적화 구성

하이퍼파라미터 최적화를 사용하여 모델을 최적화할 수 있습니다. 이는 학습 시간을 크게 늘릴 수 있는 고급 옵션입니다. 하이퍼파라미터 최적화는 지능형 최적화를 끄는 경우 사용할 수 있습니다.

자세한 내용은 하이퍼파라미터 최적화을 참조하십시오.

  1. 컨트롤 구성 보기를 클릭합니다.

  2. 이미 실험 버전을 하나 이상 실행한 경우 새 버전을 클릭합니다.

  3. 패널에서 모델 최적화를 확장합니다.

  4. 지능형에서 수동으로 전환합니다.

  5. 선택 하이퍼파라미터 최적화 확인란을 선택합니다.

  6. 선택적으로 최적화 시간 제한을 설정합니다. 기본 시간 제한은 1시간입니다.

시간 인식 학습 구성

시계열 차원을 고려하여 모델을 학습시키려면 실험 버전에 대해 시간 인식 학습을 활성화합니다. 이 옵션을 사용하려면 데이터 세트에 관련 시계열 정보가 포함된 열이 있어야 합니다.

시간 인식 학습이 켜져 있으면 Qlik 프로젝트는 특수 교차 검증 및 null 대체 프로세스를 사용하여 모델을 학습시킵니다.

자세한 내용은 시간 인식 모델 만들기시간 기반 교차 유효성 검사을 참조하십시오.

  1. 컨트롤 구성 보기를 클릭합니다.

  2. 이미 실험 버전을 하나 이상 실행한 경우 새 버전을 클릭합니다.

  3. 패널에서 모델 최적화를 확장합니다.

  4. 시간 기반 테스트-학습 분할에서 데이터를 정렬하는 데 사용할 날짜 인덱스를 선택합니다.

학습 데이터에 대한 인사이트 보기

실험의 구성/학습 데이터 탭에서 학습 데이터 처리에 대한 인사이트를 볼 수 있습니다. 이 정보는 표 행 스키마 보기인사이트 열에서 확인할 수 있습니다. 표시되는 정보는 현재 학습 데이터로 버전을 실행했는지 여부에 따라 다릅니다. 인사이트 열의 변경 사항은 기능을 사용할 수 없는 이유 또는 기능이 자동으로 삭제된 이유를 식별하는 데 도움이 될 수 있습니다.

각 인사이트의 의미에 대한 자세한 내용은 데이터 세트 인사이트 해석을 참조하십시오.

관련 학습 자료:

자세한 정보

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 알려 주십시오!