Процессор Dates (Даты)
Выполняет операции, связанные с датой.
Процессор Dates (Даты) позволяет применять различные функции к полям, связанным с датами, временем и метками времени. Доступные функции могут использоваться для расчета, очистки, изменения или преобразования дат.
Использование
Процессор Dates (Даты) принимает один входной поток и может генерировать только один выходной поток.
Свойства
Свойства для настройки работы с датами.
Свойство | Конфигурация |
---|---|
Имя функции |
|
Поля для обработки |
Выберите одно или несколько полей, к которым требуется применить функцию в списке. Примечание к подсказкеЕсли требуется применить одну и ту же функцию сразу к нескольким полям, щелкните
![]() |
Создать новое поле | Включите этот параметр, чтобы создать новое поле после применения функции. Если этот параметр не включен, существующее поле будет сохранено и изменено. |
Переименовать новое поле | Присвойте пользовательское имя вновь созданному полю. |
Чтобы переименовать процессор или отредактировать его описание, щелкните значок Изменить рядом с названием процессора на панели Свойства.
Дополнительная информация о том, как работать с датами
Существует три различных формата, связанных с датами, которые принято называть датами.
-
Время, которое обозначает время суток
-
Дата, которая обозначает определенный день
-
Метка времени, созданная из даты и времени
Даты в большинстве случаев определяются автоматически в потоке данных. Однако чтобы правильно ввести даты в систему, необходимо использовать одну из функций Преобразовать в в следующих случаях.
-
Даты отформатированы таким образом, что не могут быть определены автоматически.
-
Их требуется преобразовать в тот же формат даты, который используется в потоке данных, основываясь на локализации пользователя, создавшего поток данных.
-
Требуется убедиться, что они установлены в определенном формате. В противном случае форматы дат, которые не распознаются, преобразуются в Null.
Ограничения
-
В некоторых случаях форматирование дат не работает из-за ограничений подсистемы. Это относится к функции Формат и функции Преобразовать в. Это произойдет только при обновлении исходного входного поля, но не при создании нового поля.
-
Из-за ограничения подсистемы, когда дата загружается из формата, который изначально поддерживает даты, например Excel, не всегда можно установить формат этой даты.
Предопределенные форматы даты
В этой таблице перечислены различные форматы, которые предопределены в функции «Поток данных», но при ручном вводе поддерживаются и другие форматы. Для получения дополнительной информации о том, как должны выглядеть форматы, заданные вручную, см. раздел Описания форматов чисел и времени.
Формат | Тип | Пример |
---|---|---|
ГГГГ-ММ-ДД | Дата | 1999-03-22 |
ГГГГММДД | Дата | 19990322 |
М/Д/ГГГГ | Дата | 3/22/1999 |
М/Д/ГГ | Дата | 3/22/99 |
ММ/ДД/ГГ | Дата | 03/22/99 |
МММ Д, ГГГГ | Дата | Mar 22, 1999 |
ММММ Д, ГГГГ | Дата | March 22, 1999 |
ГГГГ-ММ-ДД чч:мм | Метка времени | 1999-03-22 05:06 |
ГГГГ-ММ-ДД чч:мм:сс | Метка времени | 1999-03-22 05:06:07 |
ГГГГ-ММ-ДДТчч:мм | Метка времени | 1999-03-22T05:06 |
ГГГГ-ММ-ДДТчч:мм:сс | Метка времени | 1999-03-22T05:06:07 |
М/Д/ГГГГ чч:мм тт | Метка времени | 3/22/1999 05:06 AM |
М/Д/ГГ чч:мм тт | Метка времени | 3/22/99 05:06 AM |
ММ/ДД/ГГ чч:мм тт | Метка времени | 03/22/99 05:06 AM |
М/Д/ГГГГ чч:мм:сс тт | Метка времени | 3/22/1999 05:06:07 AM |
М/Д/ГГ чч:мм:сс тт | Метка времени | 3/22/99 05:06:07 AM |
ММ/ДД/ГГГГ ЧЧ:мм:сс тт | Метка времени | 03/22/99 05:06:07 AM |
МММ Д, ГГГГ ч:мм:сс тт | Метка времени | Mar 22, 1999 5:06:07 AM |
ДНЕД, ММММ Д, ГГГГ ч:мм:сс тт | Метка времени | Monday, March 22, 1999 5:06:07 AM |
чч:мм | Время | 05:06 |
чч:мм:сс | Время | 05:06:07 |
чч:мм тт | Время | 05:06 AM |
чч:мм:сс тт | Время | 05:06:07 AM |
Пример: преобразование дат и работа с датами
В этом сценарии показано, как подготовить набор данных с информацией о потенциальных клиентах для обучения эксперимента машинного обучения с целью определения определить, какие из них могут стать действительными клиентами. Среди имеющейся информации у нас есть несколько полей, содержащих даты, например, FirstContactDate и TrialDate.
Сначала необходимо убедиться, что два поля даты используют общий формат. Используйте первый процессор Dates (Даты) с функцией Преобразовать в дату для полей FirstContactDate и TrialDate. Теперь эти два поля используют один и тот же формат Д/ММ/ГГГГ.
Для второго процессора Dates (Даты) используйте функцию Вычислить разницу дат, чтобы отобразить количество дней между первым контактом и началом ознакомления.
После этого процессор Fork (Вилка) используется для создания первого вывода из полученных данных, а для получения второй порции выходных данных будет использоваться третий процессор Dates (Даты). С помощью функции «Извлечь части даты» можно оставить только информацию о годе и месяце в поле FirstContactDate, что облегчит ее чтение и обработку в будущем эксперименте машинного обучения.
После операции агрегирования поток данных можно запустить для обучения модели, и окончательный поток данных будет выглядеть следующим образом:
Пример: вычисление разницы между датами
Данные, используемые в качестве источника в этом примере, содержат ссылку на заказы, включая дату заказа и дату отгрузки.
Чтобы получить некоторое представление о задержке, необходимой для отправки заказов, можно использовать процессор Dates (Даты) для расчета время между размещением заказа и его отправкой.
В свойствах процессора выберите Вычислить разницу дат в качестве функции и День в качестве единицы времени. Выберите Order Date (Дата заказа) в качестве поля для обработки и Ship Date (Дата отгрузки) в качестве второго поля для расчета разницы во времени. Введите имя для нового поля, которое требуется создать, задайте цель и запустите поток данных.
Цель этого потока данных будет включать новый столбец с количеством дней, потраченных на отправку заказов, который можно использовать в аналитике.