Понимание инструментальных переменных

Использование инструментальных переменных ключ к пониманию

ПРИЧИННАЯ НАУКА ДАННЫХ

Как оценить причинные эффекты, когда невозможно случайным образом рандомизировать лечение

Обложка, изображение автора

A/B-тесты являются золотым стандартом причинного вывода, потому что они позволяют нам делать верные причинные высказывания с минимальными предположениями благодаря рандомизации. Фактически, случайным образом назначая лечение (лекарство, рекламу, продукт и т. д.), мы можем сравнить интересующий нас результат (болезнь, доход фирмы, удовлетворенность клиентов и т. д.) среди объектов (пациентов, пользователей, клиентов и т. д.) и связать среднюю разницу в результатах с причинным эффектом лечения.

Однако во многих ситуациях невозможно случайным образом рандомизировать лечение по этическим, юридическим или практическим причинам. Одна из распространенных ситуаций в онлайн-среде – это функции по запросу, такие как подписки или премиум-членства. Другие ситуации включают функции, для которых мы не можем различать клиентов, например, страховые контракты, или функции, которые настолько глубоко закодированы, что эксперимент может не стоить затрат. Можем ли мы все же делать верные причинные выводы в таких ситуациях?

Ответ – да, благодаря инструментальным переменным и соответствующему экспериментальному дизайну, называемому дизайн поощрения. Во многих вышеупомянутых ситуациях мы не можем случайно назначать лечение, но мы можем побудить клиентов его принять. Например, мы можем предложить скидку на подписку или изменить порядок представления вариантов. В то время как клиенты имеют последнее слово в принятии лечения, мы все же можем оценить причинный эффект лечения. Давайте посмотрим, как.

Оценка программ подписки

В остальной части статьи мы будем использовать игрушечный пример. Предположим, мы – компания, производящая товары, начали еженедельную рассылку, чтобы продвигать обновления товара и функций. Мы хотим понять, стоит ли рассылка усилий и будет ли она в конечном итоге успешна в увеличении продаж. К сожалению, мы не можем провести стандартный A/B-тест, потому что нельзя заставить клиентов подписаться на рассылку. Это значит, что мы не можем оценить ее? Не совсем.

Допустим, мы также провели A/B-тест по новому уведомлению в нашем мобильном приложении, которое продвигает рассылку. Случайная выборка наших клиентов…