Кто заработает деньги на золотой лихорадке генеративного искусственного интеллекта?

Кто заработает на золотой лихорадке ГИИ?

Золотая лихорадка в области генеративного искусственного интеллекта (GenAI) в самом разгаре. GenAI теперь создает контент – слова, изображения, видео и аудио – который часто невозможно отличить от того, что производят люди. Писательство, визуальный дизайн, программирование, маркетинг, производство игр, музыкальное сочинение и дизайн продукта – всего лишь несколько областей творческого труда человека, которые быстро оказываются под влиянием GenAI. Поскольку творческие услуги интегрируются в продукты, такие как Microsoft Office 365, Slack, Discord, Salesforce Cloud и Gmail, GenAI увеличит производительность миллиардов людей раньше, чем мы сможем это осознать. Мы вскоре будем использовать GenAI для создания черновых вариантов всего, что угодно.

Итак, кто будет зарабатывать деньги на GenAI? Я задал этот вопрос сервису текст-в-изображение OpenAI под названием Dall-E-2, и он создал следующее изображение. Неплохо.

В 2018 году я написал популярный блог о том, кто будет зарабатывать деньги на искусственном интеллекте. Вот моя статья-продолжение о миллиардах, вложенных в GenAI в тысячах новых случаев использования. По сути, в этой золотой лихорадке есть пять “уровней” потенциального захвата ценности:

1. Инфраструктура – компании, предлагающие чипы и облачную инфраструктуру, на которой будут работать огромные компьютерные модели GenAI.

2. Фундаментальные модели – компании, создающие огромные текстовые, графические, аудио и другие модели, генерирующие творческий контент.

3. Приложения – крупные и малые фирмы, создающие приложения, которые будут использоваться потребителями, бизнесом и государствами для творческих задач.

4. Отрасли и организации – которые в рамках своей творческой деятельности извлекут ценность из приложений, инструментов и платформ GenAI.

5. Страны – которые создадут, экспортируют и развернут технологии GenAI как внутри, так и за пределами своих границ.

В каждом из этих уровней кто будет победителем?

1. Инфраструктура GenAI

Крупные технологические компании уже доминируют в инфраструктуре GenAI с помощью своих облачных сервисов и аппаратных чипов.

Microsoft и Google хорошо зарекомендовали себя на рынке облачных услуг в США, в то время как Baidu и Alibaba занимают сильное положение в Китае. Их огромная облачная инфраструктура суперкомпьютеров разработана для запуска сложных, дорогостоящих и объемных текстовых, визуальных и аудио моделей GenAI. Уже сейчас множество разработчиков используют их облачные API-сервисы и инструменты для создания приложений, и этот тренд ожидается ускорение по мере того, как предприниматели бросаются решать практически бесконечное количество случаев использования GenAI. Amazon пока молчит о фундаментальных моделях, поэтому большой вопрос – как они на это отреагируют.

GenAI требует огромной вычислительной мощности для создания творческого контента. Сэм Альтман, генеральный директор OpenAI, сказал:

мы в какой-то момент должны монетизировать ChatGPT и Dall-E-e; затраты на компьютеры заставляют задуматься.

Слухи ходят о том, что обучение GPT-3 от OpenAI обошлось в 12 миллионов долларов США только на счетах за энергию. Неудивительно, что OpenAI получила дополнительные 10 миллиардов долларов США инвестиций от Microsoft в начале 2023 года, большая часть которых будет представлена в виде кредитов доступа к суперкомпьютерной инфраструктуре Microsoft Azure.

Производители чипов слюнявятся от необходимости суперкомпьютерной мощности. С рыночной капитализацией более полутора триллионов долларов, акции NVIDIA (NASDAQ: NVDA) выросли с 60 долларов в 2018 году до 240 долларов в начале 2023 года. Большие технологические компании также инвестируют в собственные оптимизированные для искусственного интеллекта чипы. Недавнее запрещение экспорта продвинутых AI-чипов в Китай ускорит государственную помощь Китая и внутренние инвестиции в отрасль полупроводников (а также повысит геополитические напряжения). Учитывая необходимые инвестиции, победителями в этой области станут те, кто является или поддерживается крупными игроками.

 

2. Основные модели

 

Размер и масштаб BigTech дают им конкурентное преимущество в разработке Основных моделей GenAI. Эти модели обучаются на огромных объемах данных, используя вычислительные ресурсы BigTech. Например, текстовая модель GPT-3 от OpenAI, известная как Large Language Model (LLM), обучалась на примерно 45 терабайт текстовых данных, представляющих полтриллиона слов, которые были “собраны” из большей части англоязычного интернета. Аналогично, модель Dall-E-2 от OpenAI, основанная на тексте и изображениях, обучалась на 650 миллионах пар изображений и подписей.

BigTech не хочет потерять свое лидерство в облачных сервисах, не сумев захватить огромные потоки доходов, генерируемые миллиардами конечных пользователей этих Основных моделей в будущем. Microsoft сотрудничает с OpenAI, а Google недавно запустил своего языкового чат-бота Bard, который дополняет его модель Imagen для создания фотореалистичных изображений на основе входного текста.

Китайский BigTech также не стоит на месте. Alibaba тестирует свою собственную чат-службу. Baidu уже предоставляет модель ERNIE-ViLG для преобразования текста в изображения и в настоящее время тестирует новую чат-службу. Размер BigTech дает ему несколько преимуществ, которые стартапам будет сложно воспроизвести.

   

BigTech имеет преимущество масштаба в решении проблем истины, предвзятости и токсичности в Основных моделях

 

BigTech, возможно, является единственными игроками, способными справиться с более темной стороной GenAI. Хотя GenAI все еще находится в зачаточном состоянии, проблемы с Основными моделями становятся очевидными. Проблемы варьируются от истины (GenAI производит контент, который является просто неверным), предвзятости (предубеждение против определенных групп) и токсичности (например, расистский, мизогинистский или ненавистническая речь). В начале 2023 года рыночная капитализация Alphabet упала на огромные 100 миллиардов долларов, так как финансовые рынки испугались ошибочных и оскорбительных ответов чат-службы Bard от Google. Ограниченная версия чат-бота Bing от Microsoft также показала тревожные (и даже расистские) ответы от пользователей, нарушивших ограничения, хотя его акции не упали так резко. Существует также новый тип кибератак, известных как prompt injections, которые могут обойти защитные ограждения, внедряя вредоносные инструкции.

Одной из проблем, с которыми сталкиваются разработчики этих Основных моделей, будет обеспечение ответственности и точности их выводов. Основные модели не могут просто выводить предвзятый и токсичный контент, который был собран с самых отдаленных уголков интернета. Эти модели также обладают “галлюцинаторными” способностями. Это означает, что они уверенно предоставляют хорошо структурированные и красноречивые ответы на вопросы, которые могут быть фактически неверными. Как сказал Ноам Шазир, сооснователь Character.AI, в New York Times:

“… эти системы не предназначены для истины. Они предназначены для правдоподобного разговора.”

Или, другими словами, они уверенные мастера в выдаче бредовых ответов.

BigTech не может позволить себе репутационные, финансовые и стратегические риски, которые могут принести с собой сбои моделей. Они создают системы надзора, которые включают ограждения и настройку моделей. Чтобы завоевать доверие пользователей и соответствовать вероятным регуляторным требованиям, BigTech должен разработать решения для прозрачности модели, ее объяснимости и указания источников. Обучение с подкреплением на основе обратной связи от людей (RLFH) потребует огромной армии людей для проверки и оценки ответов модели на вопросы. Это не простые проблемы, которые можно решить в масштабе. Еще раз, BigTech хорошо позиционирован благодаря своему доступу к капиталу, инженерному таланту, наборам данных и масштабу своих циклов обратной связи от миллиардов пользователей.

 

Большие технологические компании не всегда подходят для каждой ситуации

 

Несмотря на их размер и масштаб, большие технологические компании не смогут контролировать всю золотую лихорадку вокруг основных моделей. Их модели, хотя и горизонтальные, отлично подходят для ответов на любые возможные вопросы потребителей. Однако они не всегда так хорошо подходят для потребностей предприятий с вертикальными задачами. Почему? Горизонтальные модели больших технологических компаний (1) не всегда хорошо справляются с специализированными задачами, (2) часто не защищают корпоративные собственные данные, (3) не обучены на неанглийских языках, (4) не обладают прозрачностью и объяснимостью, (5) не так хорошо подходят для использования на персональных устройствах и в предприятии, (6) могут быть дорогими в использовании в облаке, и (7) создают зависимость компании от больших технологических компаний.

 

Несколько крайне хорошо финансируемых стартапов предлагают альтернативы основным моделям больших технологических компаний

 

Основные модели больших технологических компаний не подходят для всех. Это оставляет место для нескольких крайне хорошо финансируемых стартапов, которые собрали сотни миллионов, а то и миллиарды долларов.

  • Anthropic, основанная в 2021 году, сосредоточена на более надежных, объяснимых и управляемых языковых моделях и привлекла более 1 миллиарда долларов, последнее вложение в размере 300 миллионов долларов было сделано Google.
  • AI21labs привлекла 119 миллионов долларов для своей текстовой модели Jurassic-1. С более чем 178 миллиардами параметров, Jurassic-1 по размеру сопоставим с GPT-3.
  • Cohere привлекла 165 миллионов долларов для языковых моделей и обработки естественного языка (NLP) в качестве сервиса.
  • BLOOM – это исследовательский проект LLM, поддерживаемый частным сектором Hugging Face и европейскими исследовательскими институтами, направленный на создание открытой LLM с 176 миллиардами параметров. Он был обучен на 46 языках, включая двадцать африканских языков, которые плохо представлены в большинстве LLM.
  • Британская компания Stability AI недавно привлекла огромные 100 миллионов долларов при оценке более 1 миллиарда долларов для своего сервиса генерации изображений с открытым исходным кодом, Stable Diffusion.

Большие технологические компании осознают ограничения своих моделей, особенно Microsoft, который недавно объявил, что предприятия смогут “настраивать” свои модели, не опасаясь раскрытия корпоративных данных, чтобы создать лучшую модель для всех.

Однако эти шаги не удовлетворят всех. Немецкий стартап Adelph Alpha, привлекший 31 миллион долларов, обращается к волнениям предприятий относительно основных моделей больших технологических компаний с помощью собственных моделей, ориентированных на “европейский” рынок. Однако неясно, смогут ли они конкурировать в масштабе.

Большие технологические компании победят в гонке за горизонтальными основными моделями, оставив место для нескольких высококапитализированных стартапов-альтернатив. Возможно, модели с открытым исходным кодом, такие как BLOOM и Stable Diffusion, получат масштаб или, по крайней мере, найдут свое место. Как обычно, будут инструменты и поставщики услуг, которые извлекут выгоду, упрощая работу с этими основными моделями. Но в целом:

Доминирование больших технологических компаний на рынке будет усиливаться благодаря их способности эффективно предоставлять свои основные модели бесплатно, поскольку они будут зарабатывать большую часть денег на своих облачных сервисах.

3. Приложения генеративного искусственного интеллекта

 

Хотя большие технологические компании победят в золотой лихорадке GenAI, приложения будут представлять собой более равные возможности. Существующие предприятия-разработчики программного обеспечения, стартапы “полного стека” и тысячи стартапов, использующих эти основные модели, будут предлагать новые приложения GenAI.

Традиционные предприятия-разработчики программного обеспечения, такие как Salesforce и Microsoft, органически или через поглощение привнесут возможности GenAI своим миллиардам пользователей. Microsoft также интегрирует свой сервис чат-ботов GenAI в свое приложение для поиска Bing, прямо конкурируя с гегемонией Google в области поиска.

Небольшое количество хорошо финансируемых стартапов будет предлагать специализированные “полноценные” приложения. В областях с специализированными данными, последовательностями и вычислительными требованиями эти компании будут разрабатывать собственные базовые модели. Например, GenAI может революционизировать открытие лекарств и материаловедение, создавая собственные модели с приложениями. Инвесторы будут привлечены к этим стартапам, так как они могут предложить значительные финансовые вознаграждения, а также сильную конкурентоспособность.

Например, Adept AI собрала 65 миллионов долларов для разработки следующего поколения роботизированной автоматизации процессов (RPA) с естественным языковым интерфейсом на основе LLMs. В режиме скрытности Inflection.ai делает нечто подобное. Character.AI, чат-бот, принимающий голос и знания персонажей, привлек от 200 до 250 миллионов долларов при оценке около 1 миллиарда долларов для полноценной реализации специализированных LLMs для поддержки приложений предприятия с живыми агентами.

Принятие GenAI будет чрезвычайно быстрым. Если первый черновик, скажем, созданного с помощью ИИ маркетингового предложения не идеален, его легко отредактировать. ChatGPT было самым быстрорастущим потребительским приложением в истории с более чем 100 миллионами активных пользователей в месяц всего за два месяца после запуска. Это означает, что борьба за бесконечное количество творческих применений GenAI будет жесткой и быстрой.

   

Для каждого возможного случая использования будет существовать приложение GenAI “Copilot”

 

Применение GenAI увидят потребители, бизнесы и организации по всему миру, используя приложения, созданные на основе этих базовых моделей стартапами. Многие стартапы GenAI будут использовать модель бизнеса “Copilot for X” для помощи пользователям в “творческих” задачах, таких как написание или кодирование, а также в повторяющихся задачах, таких как ввод данных или заполнение форм. Вот несколько стартапов, конкурирующих за заработок в различных отраслевых случаях использования.

  1. Стартапы по написанию общего текста помогают пользователям в режиме реального времени с повседневными задачами по написанию, такими как составление электронной почты, создание документов и заполнение текстовых форм. Wordtune от AI21labs позволяет “переписывать ваш текст, как если бы это делал профессиональный копирайтер”. Король среди помощников по написанию – Grammarly, которая собрала более 400 миллионов долларов. Список стартапов по написанию длинный и включает LexHyperWriteCompose AI и Rytr.
  2. Стартапы по продажам и маркетингу включают огромный Jasper.ai, который собрал145 миллионов долларовAnyword собрала более 45 миллионов долларов для предоставления “текстового контента с высокой конверсией для продаж”. Persado собрала более 66 миллионов долларов для генерации текста, “превосходя ваш лучший вариант копирования в 96% случаев”. Стартапы все более специализируются на конкретных задачах, таких как написание описаний продуктового маркетинга.
  3. Стартапы по генерации изображений работают на базе базовых моделей текста в изображения Open AI’s DALL-E-2Stability AI’s Stable Diffusion и Midjourney’s. К ним относится Art Breeder, который помогает пользователям создавать коллажи.
  4. Стартапы по созданию потребительских лиц и аватар включают приложение Facetune от Lightricks, которое помогает создавать “идеальные” изображения для Instagram. Lightricks собрала 350 миллионов долларов. Индивидуальные “волшебные аватары” могут быть созданы пользователями очень популярного приложения Lensa AIReface, позволяющий пользователям заменять их лица в различных сценах, собрал 5.5 миллиона долларов.</li

     

    Такие стартапы выиграют?

     

    Не хватает капитала, поступающего в стартапы по применению GenAI. Стартапы полного цикла смогут привлечь большие суммы денег в отраслях, таких как поиск лекарств, где они создадут высокоспециализированные модели и приложения. В более широком B2B пространстве гонка будет горизонтальной и вертикальной, с моделями бизнеса копилота в центре внимания. С одной стороны, горизонтальные стартапы будут предоставлять услуги в разных отраслях, например, Jasper – помощник по продажам и маркетингу. С другой стороны, стартапы все больше вертикальноориентированы по отраслям, функциям и задачам.

    Победители достигнут масштаба и защищенности, реализовав следующее:

    1. Высокую рентабельность – для своего случая использования, а также краткое время подтверждения ценности.
    2. Собственные и настраиваемые основные модели – “подстроенные” под конкретных пользователей с использованием локализованных, специализированных и собственных данных компании.
    3. Рабочие процессы – доказательство применимости и глубокая интеграция в процессы клиента, что делает его трудноудаляемым после установки.
    4. Обратные связи – например, обучение с подкреплением от обратной связи от людей (RLFH), для улучшения соответствия модели намерениям пользователя.
    5. Динамика маховика – чем больше обратной связи и других отзывов, тем лучше производительность модели через “настройку”, тем больше использование, и тем больше растет импульс.
    6. Масштаб и скорость инвестиций – с учетом низкой прибыльности, так как большая часть интеллектуальной собственности находится в основных моделях, игра идет на масштаб. Те, кто быстро создадут свою марку и привлекут большое количество пользователей и клиентов для запуска маховика, процветут как лидеры категории.

    В сфере потребления B2C GenAI наиболее вероятно победу одержат горизонтальные игроки с высокой скоростью и огромными бюджетами на привлечение потребителей.

    AutogenAI, базирующаяся в Великобритании, является B2B стартапом, который хорошо позиционирован для победы в категории помощников-копилотов по управлению ставками. Они потратили последние два года на разработку приложения, которое помогает бизнесам экономить время и деньги, а также улучшает качество заявок, тендеров и предложений. Они “подстроили” OpenAI LLM, используя примеры содержимого веб-сайтов компаний, выигранных и проигранных сделок, маркетинговых текстов и годовых отчетов. Они также предоставляют интерфейс пользователя человек-машину для проверки и точности сгенерированного контента и фактов. Это также обеспечивает критическую обратную связь от человека с увеличением использования. Клиенты все чаще используют их приложение в качестве инструмента управления знаниями следующего поколения и поиска информации, что делает его более привлекательным.

    Несколько стартапов GenAI будут приобретены и станут частью крупных предприятий и потребительских приложений. Например, крупные социальные сети с миллионами пользователей приобретут последние стартапы по созданию лиц и аватаров. Существующие компании по разработке графического дизайна приобретут наиболее перспективные стартапы по редактированию изображений и видео. Microsoft, например, предлагает нативно GenAI “Microsoft Dynamics 365 Copilot” как часть своих приложений CRM и ERP.

    Вкратце, некоторые счастливые и смелые стартапы достигнут успеха, если смогут быстро создать масштаб и маховик для своих случаев использования копилотов. Аналогично, несколько стартапов полного цикла преуспеют в специализированных случаях использования, таких как поиск лекарств. Благодаря большим суммам сборов средств, унифицированным рынкам и быстрому принятию инноваций людьми, бизнесом и правительствами, американские стартапы будут доминировать. Но большинство стартапов останутся ни с чем, принеся прибыль поставщикам инструментов и оборудования во время этой золотой лихорадки – преимущественно американским BigTech.

    Это первый пост из серии о том, кто заработает на Генеративном ИИ. В последующих постах я расскажу о том, какие организации получат наибольшую выгоду от GenAI, а также какие страны и граждане получат наибольшую выгоду от этой технологии.

    Ожидаю вашей обратной связи.

        Саймон Гринман – пионер искусственного интеллекта и инноваций в области технологий. В качестве сооснователя MapQuest он помог запустить одну из первых интернет- и ИИ-брендов. В настоящее время является партнером в компании Best Practice AI, консультирующей по стратегии, технологии и управлению ИИ, недавно он был членом Глобального совета по ИИ Всемирного экономического форума, внес свой вклад в их методологии по ИИ для руководителей и руководителей верхнего звена. Саймон более десяти лет работал главным цифровым директором, руководил цифровыми трансформациями каталоговых компаний и был генеральным директором HomeAdvisor Europe, предлагающего ведущие рынки для профессионалов различных отраслей. Он сотрудничал с такими крупными компаниями, как Bowers & Wilkins, AOL и Accenture. Он активно участвует в стартап-экосистеме Великобритании и имеет степень магистра делового администрирования в Гарвардской деловой школе, а также степень бакалавра по вычислительной технике и искусственному интеллекту в Университете Сассекса. Он является членом Королевского географического общества.

    Оригинал. Размещено с разрешения.