Калибровка (поправка на априорную вероятность) логрегрессионной модели

0 голосов
newbie в категории Алгоритмы

Пытаюсь в Loginom решить проблему редкого класса. Для того, чтобы её решить в Deductor можно было использовать сэмплинг, выбрав отбор со смещением и указав подходящий фактор, что позволяло привести соотношение  событий к 50 на 50. После чего уже в узле логистической регрессии указать истинные частоты событий и не-событий в разделе калибровки. 

Однако в лог регрессии в Loginom параметра "калибровка" я вообще не вижу. Есть ли какой-то способ указать истинные частоты, или теперь регрессия вообще не требует отбора со смещением для получения максимально одинаковой частоты событий и не-событий и нужные алгоритмы уже встроены в неё?

Ответ: 1 шт.

0 голосов
Никита Докукин

Возможность калибровки (поправки на априорную вероятность) пока отсутствует, однако будет реализована в будущем.

Если после операции сэмплирования обучающее множество не отражает реальное распределение плохих и хороших, то необходимо вносить поправку на априорные вероятности в константу.

где

  • p - вероятность события для популяции.
  • r - вероятность события для обучающего множества.

После вычисления новой константы для модели логистической регрессии необходимо пересчитать вероятность события для всех объектов. Только после этого можно проводить оценку качества логистической регрессии.

...