Исследователи компании Apple предлагают новую модель тензорного разложения для коллаборативной фильтрации с неявной обратной связью.

Apple researchers propose a new tensor decomposition model for collaborative filtering with implicit feedback.

Возможность выводить предпочтения пользователей из прошлого поведения является важной для эффективных персонализированных рекомендаций. Факт того, что многие продукты не имеют звездных рейтингов, делает эту задачу экспоненциально более сложной. Прошлые действия обычно интерпретируются в двоичной форме, чтобы указать, взаимодействовал ли пользователь с определенным объектом в прошлом. На основе этих двоичных данных необходимо сделать дополнительные предположения для вывода предпочтений пользователей из такого скрытого ввода.

Разумно предположить, что зрители наслаждаются контентом, с которым они взаимодействовали, и игнорируют контент, который не привлек их внимания. Однако это предположение редко верно на практике. Возможно, потребитель не взаимодействует с продуктом, потому что не знает о его существовании. Поэтому более правдоподобно предположить, что пользователи просто игнорируют или не обращают внимания на аспекты, с которыми нельзя взаимодействовать.

Исследования предположили, что склонность предпочитать продукты, с которыми пользователь уже знаком, перед теми, с которыми он не знаком. Эта идея послужила основой для моделирования персонализированных рекомендаций на базе байесовского ранжирования (BPR). В BPR данные преобразуются в трехмерный бинарный тензор D, где первое измерение представляет пользователей.

В новом исследовании Apple создана вариант популярной базовой модели ранжирования продуктов (BPR), которая не зависит от транзитивности. Для обобщения они предлагают альтернативное разложение тензора. Они представляют Sliced Anti-symmetric Decomposition (SAD) – новую модель на основе неявной обратной связи для коллаборативной фильтрации. Используя новую трехмерную тензорную перспективу взаимодействий пользователь-продукт, SAD добавляет еще один скрытый вектор к каждому продукту, в отличие от обычных методов, которые оценивают скрытое представление пользователей (векторы пользователей) и продуктов (векторы продуктов). Чтобы создать взаимодействия между продуктами при оценке относительных предпочтений, этот новый вектор обобщает предпочтения, полученные с помощью обычного скалярного произведения, до обобщенных скалярных произведений. Когда вектор сворачивается в 1, SAD становится передовой моделью коллаборативной фильтрации; в этом исследовании мы позволяем его значению определяться из данных. Решение разрешить значения нового вектора продукта превышать 1 имеет далекоидущие последствия. Наличие циклов в попарных сравнениях интерпретируется как доказательство того, что у пользователя нет линейных психических моделей.

Команда представляет быстрый метод координатного спуска для оценки параметров SAD. Для быстрого и точного оценивания параметров используется простой стохастический градиентный спуск (SGD). Используя симулированное исследование, сначала они демонстрируют эффективность SGD и выразительность SAD. Затем, используя вышеупомянутый набор бесплатных ресурсов, они ставят SAD в сравнение с семью альтернативными передовыми моделями рекомендаций. Эта работа также показывает, что включение ранее игнорируемых данных и связей между сущностями позволяет обновленной модели предоставлять более надежные и точные результаты.

В этой работе исследователи называют коллаборативную фильтрацию неявной обратной связью. Однако применение SAD не ограничивается упомянутыми типами данных. Например, наборы данных с явными рейтингами содержат частичные порядки, которые могут быть использованы непосредственно во время подгонки модели, в отличие от текущей практики оценки пост-фактум консистентности модели.