Как Tastry «Научила Компьютер Ощущать Вкус».

Как Tastry научила компьютер ощущать вкус

Как Tastry использует новую химию и AI для предсказания предпочтений потребителей.

С самого начала вопрос, на который мы хотели ответить, был: “Можем ли мы расшифровать уникальные матрицы вкуса основанных на сенсорике продуктов и уникальные биологические предпочтения потребителей, чтобы точно предсказывать их понравится?” Краткий ответ – да.

Однако, в начале наших исследований мы обнаружили, что существующие методы химического анализа и имеющиеся данные о предпочтениях потребителей не предоставляют статистически значимых корреляций или предсказаний. Мы понимали, что нам придется создать свои собственные данные, чтобы продвигаться вперед.

Во-первых, нам нужно было создать метод аналитической химии, который бы максимально прозрачно представлял химию (включая летучие и неточные соединения, растворенные и спектральные данные и т. д.). Мы также нуждались в расшифровке матрицы вкуса таким образом, чтобы можно было приблизительно понять, как люди воспринимают эту химию на своем языке.

Во-вторых, нам нужно было создать метод постоянного и точного получения, дополнения и отслеживания биологических сенсорных предпочтений большой, разнообразной и постоянно растущей группы реальных потребителей, чтобы использовать их как нашу истину в основе.

Почему существующие методы не могут предсказать предпочтения потребителей по основанным на сенсорике продуктам

Когда мы начали наши исследования в 2015 году, у нас была гипотеза, что все, что вам нужно знать о вкусе вина, то есть вкус, аромат, текстура и цвет – существует в химии. Однако, недоставало более всестороннего метода анализа.

Чтобы объяснить эту ограниченность, важно понимать, что химия продуктов на основе сенсорики в основном сосредоточена на контроле качества, то есть сколько аналита содержится в смеси? Фокус обычно не на оценке всех аналитов, их относительных соотношений или того, как они сочетаются на человеческом языке для создания вкуса. Вот это слепое пятно, которое нам нужно было прояснить, потому что на человеческом языке происходят динамические взаимодействия между сотнями соединений на человеческом языке. Человеческий вкус ощущает “химический суп” из ароматических соединений одновременно, а не по одному соединению, как это делает машина. Взаимодействие этих множественных соединений в сочетании с уникальной биологией каждого потребителя предоставляет важный контекст относительно того, какие характеристики химии проявляются в этом человеке.

В той мере, в которой учитывается сенсорика, просто говоря, типичный подход выглядит так:

  • Данные опроса показывают, что людям нравится масло.
  • Диацетил – соединение, обычно ассоциируемое с вкусом масла.
  • Если мы сделаем шардоне с большим количеством диацетила, больше людей это понравится.

Основные проблемы этого подхода.

  1. Вкус нельзя предсказать только количественным определением соединений. Заданная концентрация диацетила может восприниматься как масло в одном вине или году, но не в другом. Это потому, что в вине есть сотни других соединений, и в зависимости от их концентраций и соотношений диацетил может быть скрыт или проявлен. В отличие от машины, люди ощущают все соединения одновременно, их органы чувств не анализируют каждое соединение по отдельности, поэтому любое отдельное измерение не обязательно предсказуемо.

 

  1. Люди воспринимают и передают вкусы по-разному. Даже среди группы экспертов половина может описывать что-то как вкус яблока, а другая половина – как грушу. А обычные потребители еще менее предсказуемы. Исходя из нашего исследования, мы считаем, что вкус человека недостаточно осязаем, чтобы точно передаваться просто через язык от одного человека к другому. Наши описания слишком неопределенны, и наши определения варьируются в зависимости от индивидуальной биологии и культурного опыта. Например, в США большинство потребителей описывают восприятие бензальдегида как “вишня”, но большинство потребителей в Европе описывают его как “марципан”… даже в одном и том же вине.

 

  1. Вкусы, которые воспринимают потребители, не имеют корреляции с тем, нравится им это или нет. В нашем исследовании было отмечено, что потребители не решают приобрести вино, потому что оно вкусит как вишня. Они просто делают вывод, что им понравилось вино, и им, скорее всего, оно понравится снова.

Пример: Это недостаточное понимание не уникально для сегмента вина. Мы встречались с руководителями и исследователями крупнейших компаний по производству ароматизаторов и парфюмерных изделий в мире. Один из руководителей описал свое разочарование от недавнего проекта по созданию нового шоколада с лавандой. Эта компания потратила миллионы долларов на организацию и проведение фокус-групп с потребителями, которые специально любят шоколад, любят лаванду, и любят шоколад с лавандой. В конечном итоге результаты были такими, что участники опроса согласились в том, что это был шоколад с лавандой, но они также согласились в том, что им не понравился этот конкретный шоколад с лавандой.

В результате этих исследований, мы пришли к заключению, что мы должны сосредоточиться на прогнозировании того, какие химические матрицы нравятся потребителям и в какой степени, вместо того, чтобы определять, какие вкусы они воспринимают.

Чем наш подход отличается

Мусор на входе, мусор на выходе. Когда речь идет о качестве данных, мы поняли, что действительный набор данных для обучения нельзя получить из существующих коммерческих или сгенерированных на основе данных массового участия. Мы должны были создать свой собственный, внутренний.

Первое, что нам понадобилось, это химический метод, который позволит увидеть деликатное равновесие летучих, нелетучих, растворенных веществ, спектральных данных и т.д. вина в одном мгновении, чтобы быть более понятным для человеческого вкуса.

Годы экспериментов привели к разработке методологии, которая генерирует более 1 миллиона данных для каждого образца. Эти детализированные и ошеломляющие объемы данных затем обрабатываются алгоритмами машинного обучения, разработанными нашей командой по науке о данных для декодирования взаимосвязей, которые определяют восприятие человека на основе соотношения анализируемых веществ и групп анализируемых веществ.

После доказательства эффективности этого метода мы начали анализировать и декодировать матрицу вкусов множества тысяч вин по всему миру и разработали комплексную базу данных по вкусам в мире вина.

Связь предпочтений потребителей с химией

Затем нам нужно было понять, какие матрицы вкусов предпочитают разные потребители, давая им попробовать и оценить вино, которое мы проанализировали. На протяжении многих лет мы проводили регулярные двойные слепые дегустационные панели с участием тысяч потребителей, каждый из которых пробовал несколько десятков или сотен вин со временем. Среди респондентов были новички в вине, обычные потребители вина, эксперты, виноделы и сомелье.

Массовые системы обычно пропускают или игнорируют важные данные. Например, по шкале Паркера большинство людей даже не ставят оценку вину ниже середины диапазона 80 баллов. Но мы выяснили, что потребители не любят то, что им не нравится, больше, чем любят то, что им нравится. Поэтому крайне важно иметь полное представление о предпочтениях, особенно отрицательных предпочтениях.

Мы использовали наше новаторское машинное обучение, чтобы понять уникальные предпочтения потребителей к разным типам матриц вкусов в вине. Со временем это позволило нам точно предсказать их предпочтения по винам, которые они еще не пробовали. В ходе этого процесса мы также узнали, что отдельные вина, а также отдельные предпочтения, уникальны, похоже, на отпечатки пальцев. Мы пришли к выводу, что, вопреки обычным практикам в отрасли, потребителей и вина нельзя точно классифицировать или фильтровать в обобщениях.

Пример: Две женщины могут иметь одинаковую географию, культуру, этническую принадлежность, образование, доход, машину, телефон и обе любить Sauvignon Blanc от Kim Crawford, но одна может любить Morning Fog chardonnay, а другая ненавидеть его. Единственная надежная предсказуемость видна с их биологическим вкусом.

Как масштабировать эту инновацию?

То, что мы создали, было отличным, но дегустационные панели дорогостоящие и требуют много времени. Было бы невозможно провести ежегодную дегустационную панель с участием всех 248 миллионов американцев старше 21 года, чтобы понять, какие вина им нравятся.

Мы хотели создать масштабируемый инструмент, который имел бы такую же эффективность в предсказании предпочтений потребителя, не требуя участия в дегустационных панелях или выражения предпочтений по большому набору ранее пробованных вин.

Наше решение заключалось в том, чтобы позволить ИИ выбирать простые продукты питания, которые имели общие химические характеристики с винами. Респонденты наших дегустационных панелей отвечали на несколько сотен таких вопросов о своих предпочтениях в пище и вкусах, которые не связаны прямо с вином, например: “Как вы относитесь к зеленому сладкому перцу?” или “Как вы относитесь к грибам?”

Эти вопросы были использованы TastryAI как аналоги типов и соотношений соединений, часто встречающихся в основной химии вина. Мы, как люди, не можем расшифровать или понять эти сложные корреляции и закономерности, но для машинного обучения это прекрасная задача.

Используя эти данные, TastryAI научилась предсказывать предпочтения потребителя в вине на основе их ответов на опрос о предпочтениях в пище. В результате мы смогли исключить необходимость в каких-либо специфических данных о вине от потребителя для предсказания его предпочтений в вине.

Сколько данных нам требуется, чтобы понять предпочтения потребителя?

Несмотря на то, что мы начали с сотен вопросов о предпочтении пищи, чем больше ответов, тем точнее результаты, однако после 9-12 вопросов эффективность сокращается. Принцип Парето действует здесь: лучшие вопросы о предпочтении пищи обеспечивают примерно 80% понимания вкусов потребителя.

На сегодняшний день обычно проводится опрос из 10-12 вопросов о красном вине, а также из 10-12 вопросов о белом, розовом и игристом вине.

Это позволяет создать масштабное решение. Поскольку мы запускали различные пилотные проекты несколько лет назад, сейчас на электронной коммерции появилось много похожих на игры квизов. Потребитель проходит 30-секундный опрос, отвечая на вопросы о любителей ли его клубники или кофе, и получает рекомендации по винам в качестве награды. Отличие заключается в том, что эти квизы являются фильтрами по заметкам о вкусе, то есть, если вы любите клубнику, то вам подойдет вино, которое описывается вкусом темного фрукта, или если вы любите кофе, то вам понравится вино, описываемое как терпкий. Но мы выяснили, что если эти описания соответствуют вкусовым предпочтениям этого человека, они не могут предсказать, понравится ли ему вино. В то же время, это захватывающее занятие, потребителям нравятся квизы.

Рекомендации от Tastry связаны с матрицей вкуса вина. TastryAI не является фильтром по заметкам о вкусе, он не спрашивает, нравится ли вам аромат или вкус грибов в вине, он пытается понять, какие соединения вам нравятся или не нравятся на основании ваших биологических предпочтений. Каждый вопрос дает множество понимания, потому что каждый вопрос перекрывается и наполняет другие. Так что после вопроса о грибах, возможно, следующий вопрос будет: “Как вы относитесь к вкусу зеленого перца?” Искусственный интеллект может знать, что, например, 33 соединения в определенном соотношении обычно отвечают за восприятие грибов, и 22 соединения обычно отвечают за вкус зеленого перца – но важно отметить, что некоторые из этих соединений присутствуют и в том и в другом случае. Если вы говорите, что любите грибы, но не любите зеленый перец, то искусственный интеллект будет более уверен в том, что вам нравятся некоторые соединения, уверен в том, что вам не нравятся другие соединения, и те, которые пересекаются, вероятно, имеют контекстуальный характер .

Вы можете представить себе многомерную модель этих знаний, где искусственный интеллект выявляет соединения, которые вам нравятся или не нравятся в сочетании с другими соединениями.

Из этого предпочтительного опроса о вкусе, а также отзывов потребителей, мы собираем анонимные данные о вкусовых предпочтениях со всего мира. Электронная коммерция или крупный ритейлер могут запустить Tastry Quiz в приложении и получить тысячи ответов от потребителей из разных регионов США всего за несколько часов. Единственные данные, которые мы получаем, – это почтовый индекс. Мы используем его для применения производных от байесовской регрессии, которая учитывает географическое распределение известных вкусов потребителей, которые мы собираем и контролируем, а также других данных, и прогнозирует остальные более чем 200 миллионов потребительских предпочтений в США. Мы используем это значительно улучшенное набор данных в качестве источника истины, чтобы предсказывать, как вина будут продаваться на рынке на уровне магазина, местного или регионального.

Виртуальная фокус-группа Tastry

Анализируя вино, расшифровывая его вкусовую матрицу и оценивая его приемлемость с учетом комбинации реальных и виртуальных вкусов, искусственный интеллект в настоящее время обладает точностью в 92,8% при прогнозировании среднего потребительского рейтинга вина в США. Другими словами, искусственный интеллект может предсказать средний рейтинг вина в 5 звезд, с погрешностью не более 1/10-ой звезды.

Легче всего представить искусственный интеллект как “виртуальную фокус-группу” предпочтений потребителей.

Винодельни используют TastryAI для проведения симуляций того, как воспримут их вино потребители, еще до того, как они вложат несколько лет и миллионы долларов в его производство. Оптовые торговцы используют TastryAI для определения регионов, в которых разные вина покажут себя лучше всего. Розничные торговцы используют TastryAI для оптимизации ассортимента на полках и онлайн. А потребители используют TastryAI, чтобы избежать риска покупки вина, которое им не понравится.