Прогнозирование изменений оттока навигация по вмешательствам и повторной подготовке

Прогнозирование изменений оттока навигация, вмешательства и повторная подготовка

Переобучение моделей оттока представляет себя уникальные вызовы, которые требуют особого внимания

Фото от CrowN на Unsplash

Переобучение моделей машинного обучения, особенно тех, которые фокусируются на предсказании оттока клиентов, является важным шагом, чтобы обеспечить их актуальность и точность со временем. Однако, переобучение моделей оттока представляет себя уникальные вызовы, которые требуют особого внимания. Среди наиболее заметных вызовов — отличить причинно-следственные связи от влияния вмешательств — выделение клиентов, которые остались из-за проактивной программы удержания с целью нацелить на них эксклюзивные меры.

Влияние вмешательства на переобучение оттока

Рассмотрим следующую последовательность событий:

  1. Подготовка исходной модели: Обучение модели с использованием исторических данных о клиентах.
  2. Применение модели: Определение определенных клиентов, угрожающих уйти.
  3. Вмешательство бизнеса: Взаимодействие с этими клиентами для убеждения их остаться или использование мер, таких как акции и персонализированные предложения, для стимулирования удержания.
  4. Переобучение с новыми данными: Когда производительность модели ухудшается, приходит время для переобучения — модель обновляется с использованием более свежих данных, которые включают результаты этих вмешательств.

Представьте себе ситуацию: клиенту прогнозируется отток, он обращается к представителю службы удержания, и в итоге остается. Возникает сложность в определении причины его решения — Изменило ли вмешательство его мнение или было ли он неправильно классифицирован моделью с самого начала? При переобучении модели на таких двусмысленных данных, существует риск искажения будущих прогнозов модели — пометка данного клиента как “оставшийся” может быть вводящей в заблуждение, так как он мог бы уйти, если бы мы не убедили его остаться. Также это касается и меток оттока — вмешательство может быть единственным триггером для оттока, что делает некоторые метки оттока ненадежными.

Когда усилия по удержанию затрудняют ясность модели

Возможные способы борьбы с предвзятостью:

  1. Контрольные группы и синтетические данные: Создание подмножества “вероятных отказов от услуг”, которым не применяются никакие меры. Сравнивая результаты между этой контрольной группой и вмешательствами, можно определить реальное влияние вмешательств — если определенный сегмент клиентов уходит чаще, когда к нему применяются меры, то исключение его из вмешательства должно быть исследовано. При переобучении можно использовать данные из контрольной группы и исключить данные из группы с вмешательствами, чтобы обеспечить модели надежные метки оттока. Недостатком этого метода является потеря важных данных, поэтому для компенсации исключения клиентов с вмешательствами можно попытаться генерировать синтетические образцы контрольной группы, чтобы представить таких клиентов. Это может быть сделано с помощью SMOTE и других стратегий повышения выборки.
  2. Обратная связь через опросы: Прямое взаимодействие с клиентами после вмешательства для понимания причин их оставания/ухода. Собранные инсайты могут помочь понять эффективность вмешательств и помочь различить между истинными оставшимися клиентами и теми, кто был убежден усилиями.
  3. Слияние моделей: Попробуйте объединить исходную обучающую модель с новой. Усреднение прогнозов или использование ансамблевых методов может снизить риск, что предвзятость одной модели будет доминировать в общем прогнозе. Заметьте, что с течением времени исходные данные обучения могут терять актуальность.

Моделирование эффекта вмешательства: Золотой стандарт для уточнения прогнозов оттока

В отличие от традиционных моделей оттока, которые предсказывают, кто может уйти, моделирование эффекта вмешательства определяет клиентов, поведение которых меняется непосредственно из-за вмешательства. Путем сравнения группы с вмешательством и контрольной группы эти модели предсказывают, кто остается благодаря вмешательству, а с другой стороны кто уходит из-за вмешательства. Такой целевой подход помогает бизнесам оптимизировать ресурсы и максимизировать ценность клиентов.

Клиенты могут быть разделены на четыре теоретические категории, в зависимости от того, были ли они подвергнуты усилиям по удержанию:Суровые случаи: Клиенты, которые не уйдут. Направление на них не приносит дополнительной прибыли, но добавляет расходы, такие как коммуникационные усилия и возможные финансовые поощрения.Безнадежные случаи: Клиенты, которые уйдут в любом случае, независимо от мер. Они не приносят дохода и могут привести к снижению затрат по сравнению с Суровыми случаями, так как не используют предлагаемые поощрения.Возможные поддающиеся влиянию: Клиенты, которые остаются только после усилий по удержанию. Они приносят дополнительный доход.Нельзя тревожить: Клиенты, которые уйдут только в случае направленности на них. Оставление их в покое является выгодным, в то время как нанесение им ущерба добавляет значительные затраты без получения дохода, делая их “спящими собаками”.

Цель модели потенциального повышения состоит в том, чтобы исключительно нацелиться на возможных поддающихся влиянию. Однако проблема заключается в том, что мы не можем определить, к какой категории относятся отдельные лица. Мы не можем одновременно обрабатывать их и иметь их в контрольной группе. Итак, как мы можем их идентифицировать? Как мы можем знать, убеждены ли они или не собирались уйти изначально? В этом и заключается суть модели повышения.

Существует несколько подходов к моделированию повышения для решения этой проблемы, мы рассмотрим метод “Трансформированного результата”. Для этого метода требуются данные из контрольной и тестовой групп, и он переводит наше внимание с задач классификации на задачу регрессии. Метки назначаются на основе определенной формулы, и для случайного назначения теста с вероятностью 0,5, целевая переменная принимает следующие значения:

Метки Трансформированного результата (для вероятности теста 50%)

Мы можем использовать функцию потерь, такую как среднеквадратическая ошибка (MSE), в качестве метрики для решения этой регрессионной задачи: Для Возможных поддающихся влиянию, контрольная группа помечена как 0, а тестовая – как 2. Наименьшая среднеквадратическая ошибка между ними будет там, где оценка равна 1, что представляет влияние на Возможных поддающихся влиянию. Для Нельзя тревожить, контрольная группа равна -2, а тестовая – 0, с оптимальным прогнозом -1, что означает влияние. Для Безнадежных случаев и Суровых случаев, лучший прогноз – 0. Идеально осуществлять целевую нацеленность на высшую оценку, чтобы попытаться сохранить Возможных поддающихся влиянию и избежать Нельзя тревожить и других в максимально возможной степени.

Как мы исследовали, пейзаж прогнозирования оттока, со всей его сложностью мер и изменяющихся данных, представляет трудности для бизнеса. Переобучение моделей – это не просто техническое упражнение, но и часть понимания поведения клиентов и осознания реального удержания. Использование инструментов, таких как контрольные группы, механизмы обратной связи и моделирование повышения. Но, возможно, самое важное – признание того, что данные не являются статичными. Наше понимание поведения клиентов должно быть адаптивным. Принятие этой динамической ситуации, непрерывное совершенствование моделей и внимание к изменяющимся паттернам станет ключом к успешному прогнозированию и управлению оттоком в будущем.

Дополнительная информация: