Generative AI в финансах FinGPT, BloombergGPT и далее

Генеративное искусственное интеллект в финансовой сфере FinGPT, BloombergGPT и другие

Генеративные искусственные интеллекты (Generative AI) относятся к моделям, способным генерировать новые образцы данных, которые похожи на входные данные. Успех ChatGPT открыл множество возможностей в различных отраслях, вдохновляя предприятия на создание собственных крупных языковых моделей. Финансовый сектор, основанный на данных, стал еще более интенсивным по объему данных, чем раньше.

Я работаю в качестве специалиста по обработке данных во французской финансовой компании. Будучи там уже год, я недавно наблюдал значительный рост использования крупных языковых моделей во всех отделах для автоматизации задач и создания надежных и безопасных систем искусственного интеллекта.

Каждая финансовая услуга стремится создать свои собственные настроенные языковые модели, используя открытые модели, такие как LLAMA 2 или Falcon. Особенно это актуально для старых банков, у которых есть десятилетия финансовых данных.

До сих пор не было возможности включить такой огромный объем данных в одну модель из-за ограниченных вычислительных ресурсов и моделей с меньшей сложностью/малым количеством параметров. Однако эти открытые модели с миллиардами параметров теперь могут быть настроены на большие объемы текстовых наборов данных. Данные подобны топливу для этих моделей: чем больше данных, тем лучше результаты.

Как данные, так и модели LLM могут помочь банкам и другим финансовым услугам сэкономить миллионы долларов за счет повышения автоматизации, эффективности, точности и других факторов.

Недавние оценки Маккинси (McKinsey) свидетельствуют о том, что этот генеративный искусственный интеллект может принести банковскому сектору ежегодную экономию до 340 миллиардов долларов.

BloombergGPT и экономика генеративного искусственного интеллекта

В марте 2023 года Bloomberg представила модель BloombergGPT. Это языковая модель, созданная с нуля, с 50 миллиардами параметров, специально разработанная для финансовых данных.

Чтобы сэкономить деньги, иногда нужно потратить деньги. Обучение моделей, подобных BloombergGPT или Llama 2 от Meta, не является дешевым.

Для обучения модели Llama 2 с 70 миллиардами параметров потребовалось 1 700 000 часов работы графических процессоров (GPU). Использование графического процессора Nvidia A100 (используемого для Llama 2) на коммерческих облачных сервисах может обойтись в 1-2 доллара за каждый час работы. Рассчитывая, модель с 10 миллиардами параметров может стоить около 150 000 долларов, в то время как модель с 100 миллиардами параметров может стоить до 1 500 000 долларов.

Если не арендовать, то есть альтернатива – покупка графических процессоров. Однако покупка около 1000 графических процессоров A100 для создания кластера может обойтись в более чем 10 миллионов долларов.

Инвестиции Bloomberg в более чем миллион долларов особенно впечатляют в сочетании с быстрыми темпами развития искусственного интеллекта. Удивительно, что модель, стоимостью всего 100 долларов, всего за полгода смогла превзойти результаты BloombergGPT. В то время как при обучении BloombergGPT использовались собственные данные, подавляющее большинство (99,30%) их набора данных было общедоступным. Появляется FinGPT.

FinGPT

FinGPT – это передовая модель крупных языковых моделей (FinLLM) для финансовой сферы. Разработанный AI4Finance-Foundation, FinGPT в настоящее время опережает другие модели по отношению к экономичности и общей точности.

В настоящее время у него есть 3 версии; серия моделей FinGPT v3 улучшены с использованием метода LoRA и обучены на новостях и твитах для анализа настроений. Они демонстрируют лучшие результаты во многих тестах финансовых настроений. FinGPT v3.1 основан на модели chatglm2-6B, а FinGPT v3.2 базируется на модели Llama2-7b.

 

FINGPT

FINGPT

Операции FinGPT:

  1. Сбор и подготовка данных:
    • Получение данных: Используя данные от надежных источников, таких как Yahoo, Reuters и других, FinGPT объединяет широкий спектр финансовых новостей, охватывая акции США и Китая.
    • Обработка данных: Эти необработанные данные проходят множество этапов очистки, токенизации и инженерии запросов, чтобы обеспечить их актуальность и точность.
  2. Крупные языковые модели (LLM):
    • Обучение: Используя отобранные данные, можно настроить LLM для создания легких моделей, а также адаптировать существующие модели или интерфейсы API для поддержки приложений.
    • Стратегии настройки:
      • Тензорные слои (LoRA%20LoRA%20(Low%2DRank%20Adaptation))): Одной из ключевых проблем при разработке моделей, таких как FinGPT, является получение высококачественных размеченных данных. Учитывая эту проблему, FinGPT использует инновационный метод. Вместо полного полагания на традиционную разметку, в качестве меток используются флуктуации рыночных цен акций, что позволяет перевести настроения новостей в конкретные метки, такие как положительные, отрицательные или нейтральные. Это приводит к существенному улучшению предсказательных возможностей модели, особенно в различении положительных и отрицательных настроений. Благодаря таким методам настройки, например, LoRA, FinGPT v3 удалось оптимизировать производительность при снижении вычислительной нагрузки.
      • Обучение с подкреплением на основе обратной связи от человека: FinGPT

        Сравнение FinGPT с GPT-4 LLAMA 2 Bloomberg GPT

        Сравнение FinGPT с ChatGLM, LLAMA 2, BloombergGPT

        Текущая траектория и будущее FinGPT: июль 2023 года стал важным этапом для FinGPT. Команда представила научную статью под названием «Instruct-FinGPT: финансовый анализ настроений с помощью инструкционной настройки общих языковых моделей большого размера». В центре этой статьи исследуется метод инструкционной настройки, который позволяет FinGPT выполнять сложные финансовые анализы настроений.

        Однако FinGPT не ограничивается только анализом настроений. Фактически, доступно еще 19 разнообразных приложений, каждое из которых обещает использовать LLM-модели в новаторских способах. От создания заданий до понимания сложных финансовых контекстов, FinGPT утверждает себя как универсальная модель искусственного интеллекта в финансовой сфере.

        Как мировые банки принимают генеративный искусственный интеллект

        В начале 2023 года некоторые крупные финансовые игроки, такие как Bank of America, Citigroup и Goldman Sachs, ввели ограничения на использование ChatGPT от OpenAI своими сотрудниками, но другие представители отрасли решили принять более открытое положение.

        Например, Morgan Stanley внедрил чатботы, основанные на технологии OpenAI, в качестве инструмента для своих финансовых советников. Используя обширные внутренние исследования и данные фирмы, эти чатботы служат источником обогащенных знаний, повышая эффективность и точность финансового консультирования.

        В марте этого года хедж-фонд Citadel стремился получить лицензию на широкомасштабное использование ChatGPT. Планируется расширение областей применения, таких как разработка программного обеспечения и сложный анализ информации.

        JPMorgan Chase также прикладывает усилия для использования больших языковых моделей в обнаружении мошенничества. Их методология основана на анализе шаблонов электронной почты для выявления потенциальных компрометаций. Банк также поставил перед собой амбициозную цель: добавить до $1,5 миллиарда стоимости с помощью искусственного интеллекта к концу года.

        Что касается Goldman Sachs, они не полностью устойчивы к привлекательности искусственного интеллекта. Банк изучает возможности генеративного искусственного интеллекта для укрепления своей области разработки программного обеспечения. Как заявляет Марко Ардженти, главный информационный офицер Goldman Sachs, такая интеграция имеет потенциал превратить их рабочую силу в нечто «сверхчеловеческое».

        Применение генеративного искусственного интеллекта в банковской и финансовой отрасли

        Применение генеративного искусственного интеллекта в финансах

        Применение генеративного искусственного интеллекта в финансах

        Генеративный искусственный интеллект фундаментально изменяет финансовые операции, принятие решений и взаимодействие с клиентами. Вот подробное исследование его приложений:

        1. Предотвращение мошенничества: Генеративный искусственный интеллект находится во главе развития передовых механизмов обнаружения мошенничества. Анализируя огромные объемы данных, он может распознавать сложные паттерны и аномалии, предлагая более превентивный подход. Традиционные системы часто перегружены объемом данных и могут давать ложноположительные результаты. Генеративный искусственный интеллект, наоборот, непрерывно уточняет свое понимание, сокращает ошибки и обеспечивает более безопасные финансовые операции.

        2. Оценка кредитного риска: Традиционные методы оценки платежеспособности заемщика, хотя и надежны, устаревают. Генеративные интеллектуальные модели посредством различных параметров – от кредитной истории до тонких поведенческих паттернов – предлагают комплексный профиль риска. Это не только обеспечивает безопасное предоставление займов, но также обслуживает более широкий круг клиентов, включая тех, кто может быть недостаточно обслужен традиционными показателями.

        3. Улучшение взаимодействия с клиентами: Финансовый мир переживает революцию в обслуживании клиентов благодаря моделям генеративного искусственного интеллекта, основанным на обработке естественного языка. Эти модели мастерски понимают и отвечают на разнообразные вопросы клиентов, предлагая персонализированные решения в кратчайшие сроки. Автоматизация рутинных задач позволяет финансовым учреждениям сократить накладные расходы, оптимизировать операции и, что самое важное, улучшить удовлетворенность клиентов.

        4. Персонализированная финансовая помощь: Однообразность устарело. Сегодня потребители требуют финансового планирования, которое отвечает их уникальным потребностям и амбициям. Генеративное искусственное интеллект (ИИ) отлично справляется с этим заданием. Анализируя данные – от расходов до инвестиционных предпочтений, он разрабатывает индивидуальные финансовые маршруты. Этот всесторонний подход гарантирует, что клиенты оказываются лучше информированы и более подготовлены к управлению своими финансовыми перспективами.

        5. Алгоритмическая торговля: Аналитические способности генеративного ИИ оказываются бесценными в непостоянном мире алгоритмической торговли. Анализируя данные – от рыночных тенденций до мнения из новостей, он предоставляет точные прогнозы, позволяя финансовым экспертам оптимизировать стратегии, предвидеть рыночные сдвиги и ограничивать потенциальные риски.

        6. Укрепление фреймворков соответствия: Правила по борьбе с отмыванием денег являются критически важными для поддержания неприкосновенности финансовых систем. Генеративное ИИ упрощает соблюдение этих правил, проанализировав многосложные транзакционные данные, чтобы выявить подозрительную активность. Таким образом, это гарантирует, что финансовые учреждения соответствуют мировым стандартам, а также существенно уменьшает вероятность ложных срабатываний, упрощая операции.

        7. Кибербезопасность: В связи с постоянным развитием киберугроз финансовому сектору необходимы гибкие решения. Именно такие возможности направленного искусственного интеллекта и предоставляет генеративное ИИ. Реализуя динамические прогнозные модели, оно обеспечивает более быстрое обнаружение угроз, укрепляя финансовую инфраструктуру от потенциальных нарушений.

        Однако, как и в случае с любой развивающейся технологией, генеративное ИИ также имеет свой набор вызовов в финансовой сфере.

        Вызовы

        1. Увеличение предвзятости: Модели ИИ, несмотря на всю свою сложность, всё равно полагаются на данные, созданные людьми. Эти данные, имеющие свои врожденные предвзятости – будь то намеренные или непреднамеренные – могут привести к скрытым результатам. Например, если конкретная демографическая группа недостаточно представлена в обучающем наборе данных, выходные данные ИИ могут усугубить эту проблему. В финансовой сфере, где справедливость имеет первостепенное значение, такие предвзятости могут повлечь серьезные последствия. Финансовые лидеры должны активно выявлять эти предвзятости и обеспечивать наиболее полные и представительные обучающие наборы данных.
        2. Надежность результатов и принятие решений: Генеративное ИИ иногда может порождать ошибочные и вводящие в заблуждение результаты, часто называемые “галлюцинациями”. Подобные промахи ожидаются на этапе усовершенствования и обучения моделей ИИ, но последствия в финансовой сфере, где точность недопустима, являются серьезными. Рисковать и полагаться только на ИИ для критических решений, таких как утверждение займов, небезопасно. Вместо этого ИИ следует рассматривать как сложный инструмент, поддерживающий финансовых экспертов, а не заменяющий их. Он должен управлять вычислительной нагрузкой, предоставляя инсайты для принятия окончательных информированных решений человеком.
        3. Защита данных и соответствие законодательству: Безопасность конфиденциальных данных клиентов остается значительной проблемой при использовании генеративного ИИ. Это требует соблюдения глобальных стандартов, таких как Общие правила защиты данных (GDPR) и Закон о защите конфиденциальности клиентов в Калифорнии (CCPA). ИИ не обязательно знает или соблюдает эти ограничения, поэтому его использование должно быть ограничено строгими указаниями по защите данных, особенно в финансовой сфере, где конфиденциальность имеет первостепенное значение.
        4. Качество входных данных: Генеративный ИИ такой же хорош, какие данные ему предоставляют. Неточные или неполные данные могут привести к низкокачественным финансовым советам или решениям.

        Заключение

        От обогащения торговых стратегий до укрепления безопасности, генеративные ИИ-приложения охватывают множество возможностей и являются преобразовательными. Однако, как и с любой технологией, необходимо подходить к ее внедрению с осторожностью, обращая внимание на этические и конфиденциальные аспекты.

        Те институты, которые успешно используют возможности генеративного ИИ, соблюдая его ограничения и потенциальные риски, безусловно определят будущую траекторию всемирной финансовой арены.