Прогнозирование и сегментация стоимости жизненного цикла клиента в страховании

Прогнозирование и сегментация стоимости жизненного цикла клиента в страховании новые способы определения стоимости и оценки выплат по страховым полисам

Сколько стоит клиент для вашего бизнеса? Это не тривиальный вопрос, но имеющий глубокие последствия для вашей маркетинговой стратегии, прибыльности и роста. В этой статье я рассмотрю ценность клиента на протяжении его жизненного цикла (CLV) — от концепции до применения на примере.

Что такое ценность клиента на протяжении его жизненного цикла?

Ценность клиента на протяжении его жизненного цикла — это основная метрика для понимания клиентов. Это прогноз стоимости отношений с клиентом для бизнеса компании. Такой подход позволяет организациям демонстрировать будущую стоимость, которую они могут получить от своих маркетинговых кампаний.

Зачем рассчитывать ценность клиента на протяжении его жизненного цикла?

Один из ключевых аргументов в пользу расчета ценности клиента на протяжении его жизненного цикла — это удержание клиентов. Marketing Metrics показывает, что вероятность продажи новому клиенту составляет 5-20%, в то время как вероятность продажи уже существующему клиенту составляет 60-70%. Это означает, что большее количество продаж повторным клиентам принесет больше прибыли.

Как рассчитать ценность клиента на протяжении его жизненного цикла?

Существуют несколько способов расчета ценности клиента на протяжении его жизненного цикла, от коллективного подхода до индивидуального подхода.

Простое определение ценности клиента на индивидуальном уровне — это чистая текущая стоимость всех денежных потоков, связанных с отношением с клиентом.

Где Pi,t — цена, которую клиент заплатил в момент времени t, Ci,t — стоимость обслуживания клиента в момент времени t, 𝑖 — ставка дисконтирования, PRi,t — вероятность активности клиента в момент времени t, и ACi — затраты на привлечение клиента.

Как применить ценность клиента на протяжении его жизненного цикла?

После расчета ценности клиента на протяжении его жизненного цикла, вы можете использовать эту информацию для выбора стратегий:

  • Сегментировать ваших клиентов
  • Оптимизировать привлечение клиентов
  • Повысить удержание
  • Улучшить прогнозирование
  • Определить лучших клиентов

Существует несколько способов расчета ценности клиента на протяжении его жизненного цикла, и цель этого исследования — распространение предиктивной аналитики в сфере страхования. В этом исследовании я использовал данные о покупках клиентов для построения статистических моделей, которые прогнозируют ценность клиента на протяжении определенного периода. Я использовал набор данных автомобильного страхования в США, содержащий информацию о политиках страхования клиентов на протяжении 1 года, с меньше чем 10 000 записями и 24 переменными, такими как месячная страховая премия, страховая сумма по требованию, код местоположения и типичные характеристики, используемые в ценообразовании страхования от несчастных случаев. Вы можете следовать этим шагам, посмотрев эту заметку.

-Предварительный анализ данных

Предварительный анализ данных помогает выявить информацию, полученную от переменных, включая анализ одной и двух переменных, и предоставляет возможность получить характеристики об типичном клиенте. Типичный клиент приобретает страховку в течение первых двух месяцев года, живет в Калифорнии, в пригородной зоне, имеет высшее образование, состоит в браке и приобретает базовую страховку на автомобиль четырехдверного типа VoAGI.

-Моделирование стоимости пожизненного клиента (CLV)

На данном этапе целью является прогнозирование CLV за последние 3 месяца года с использованием предыдущих месяцев в качестве обучающей выборки для модели. Я сравнивал 4 модели.

GLM использован в качестве эталона, так как эта модель используется в актуарной области. Затем я использовал современное машинное обучение для захвата нелинейной взаимосвязи между характеристиками и зависимыми переменными, 2 ансамблевые модели: случайный лес и градиентный бустинг, а также нейронную сеть в качестве последней модели.

Сравнивая модели, градиентный бустинг показал лучшую производительность как на обучающей, так и на тестовой выборке. GLM – слабая модель, случайный лес немного переобучается, а нейронные сети хорошо подходят. Просматривая форму распределений, GLM имеет совершенно отличное распределение от наблюдаемых значений, тогда как другие модели близки к истинным значениям. Хорошее распределение у нейронных сетей. Победителем в плане производительности является градиентный бустинг.

Далее я применил модели кластерного анализа к 8 числовым признакам набора данных. В рамках этой активности я использовал методы кластеризации K-Means, GMM и иерархической кластеризации. Результаты интересны при анализе сегментации переменных с помощью исследовательской визуализации с использованием t-SNE и моделей кластеризации.

Идея использования кластеризации в сочетании с t-SNE состоит в создании инструмента визуализации сегментации, полезного для решения задач портфельного запроса и выявления скрытой структуры данных.

В кластеризации K-means самый большой розовый кластер помечен как один, объединяя данные, мы наблюдаем, что примерно 50% премий и сумм исков сосредоточены в этом кластере.

С помощью прогнозирования актуарии могут повысить точность прогноза, снизить затраты и избыток, а также улучшить прибыльность компании. Сегментация помогает актуариям обнаруживать новые тенденции и помогать маркетологам создавать таргетированные кампании, которые привлекут различные сегменты клиентов.

Ссылки: