Можно ли добавить Стратифицированный метод разбиения выборки в настройках узла Логистическая регрессия?

0 голосов
Marcel в категории Как сделать...

Можно ли в настройках Loginom в  узле Логистическая регрессия, при разбиении выборки на обучающее и тестовое множество добавить Стратифицированный метод как при узле Разбиение на множества, или как использовать разбиение настоенное в узле Разбиение на множеста в узле Логистическая регрессия при обучение узла? 

Ответы: 2 шт.

0 голосов
Natalia Solomentseva
Здравствуйте. Такого способа нет. Однако, Ваше обращение передано разработчикам. Возможно, такой метод разбиения будет реализован в будущем.
Marcel

Спасибо.

Для упрощения можно ли сейчас, при нынешних настройках, используя случайный метод разбиения  в узле Логисстической регресии, в  порту Выход регрессии добавить поле которое бы указывало к какому множеству (обучающее или тестовое) относится каждое  наблюдение (как к примеру есть уже в узле Разбиение на множества при выходном наборе данных поле Тестовое множество-true/false). Это дало бы возможность сравнить структуру 2 выборок и результаты регрессии при экспорте в Excel.

Natalia Solomentseva

Возможно, подойдет вариант с использованием узла Слияние:

На странице Настройка слияния данных выбрать тип операции Левое соединение и сделать связи между совпадающими полями обоих наборов данных.

Marcel

вариант с использованием узла Слияние в этом случае не подходит. 

При использовании логистической регрессии в настройках  есть уже настройка Разбиение на множества (обучающее или тестовое). По обучающей выборке в дальнейшем строится модель (получаем коэффициенты модели), а по тестовой - тестируются результаты полученные в при обучающей выборке.

моя просьба состоит в том, чтобы в порту Выход регрессии и в Таблице Выход регрессии в Визуализаторы  был дополнительный столбец который указывал бы к какому множеству (обучающее или тестовое) относится каждое наблюдение в массиве данных.

спасибо

0 голосов
sergey.maximov

Если известно количество записей,попадающих в каждое из множеств, то Стратифицированный метод  разбиения в узле Логистическая регрессия можно использовать следующим образом:

  1. Настроить узел Разбиение множества с нужным вариантом разбиения;
  2. Отсортировать результат (первый порт) по полю IsTestSet (Тестовое множество);
  3. В узле Логистическая регрессия указать Метод разбиения = Последовательный и задать нужное количество записей для каждого множества.

Если количество записей динамическое - то в этом случае сценарий реализации будет намного сложнее, но думаю, что тоже реализуем.

Marcel

Использовал в узле  Разбиение на множестваСтратифицированный метод, и Loginom добавляет на выходе поле Тестовое множество в последовательным набором (обучающее и тестовое множество) 

В узле Логистическая регрессия указал Метод разбиения = Последовательный и задал нужное количество записей для каждого множества.

Спасибо

...