Познакомьтесь с SQLCoder новой моделью с открытым исходным кодом и передовыми технологиями для преобразования вопросов на естественном языке в SQL-запросы.

Познакомьтесь с SQLCoder - новой моделью с открытым исходным кодом и передовыми технологиями для конвертации естественно-языковых вопросов в SQL-запросы.

“`html

Defog.ai выпустила SQLCoder, передовую модель для перевода запросов на естественном языке в запросы базы данных. В отношении общих схем SQL в Postgres, SQLCoder значительно превосходит все основные модели с открытым исходным кодом. При оптимизации для конкретной схемы базы данных она работает лучше, чем gpt-4.

Размер модели таков, что она может выполняться в 16-битных числах с плавающей запятой на однокристальном процессоре A100-40GB или 8-битной квантованной высокопроизводительной графической карте (например, RTX 3090/4090). Механизм оценки SQL, сгенерированного LLM, также становится открытым исходным кодом. Оценка SQL-кода может быть сложной. Исследователи хотят провести обширное, публичное и повторное тестирование, чтобы расширить возможности систем текста-к-SQL с открытым исходным кодом.

Весы модели лицензированы в соответствии с CC BY-SA 4.0. Модель бесплатна как для личного, так и для коммерческого использования. Если вы измените результаты (например, путем настройки), вы должны выложить эти изменения в открытый источник с той же лицензией.

SQLCoder – это оптимизированная версия StarCoder с использованием 15 миллиардов параметров. SQLCoder был настроен на постепенно усложняющиеся SQL-запросы, созданные вручную. Оптимизация для схемы базы данных позволяет достигать или превосходить производительность GPT-4.

За последние три месяца исследователи использовали SQLCoder с корпоративными клиентами в секторах здравоохранения, финансовых услуг и государственного сектора. Заказчики, которым не хочется, чтобы их конфиденциальные данные покидали их серверы при использовании LLM, могут использовать только собственные модели.

Модель была усовершенствована в две фазы исследовательской командой. Они отточили базовую модель StarCoder, используя только наши простые и средние запросы. Полученная модель defog-easy затем была повторно настроена на сложные и чрезвычайно сложные вопросы, чтобы создать SQLcoder. Defog По результатам нашего тестирования SQLCoder превосходит практически все популярные модели, кроме GPT-4. В частности, он превосходит модели в десять и более раз большего размера, такие как gpt-3.5-turbo и text-da-vinci-003. Эти результаты представляют только производительность SQLCoder на общих SQL-базах данных, а не на конкретных схемах базы данных. Когда SQLCoder оптимизирован для определенных схем баз данных, он может превосходить GPT-4 от OpenAI, при этом имея меньшую задержку.

Открытую версию SQLCoder можно найти по адресу https://github.com/defog-ai/sqlcoder. У нее есть множество потенциальных применений, таких как:

  • Тестирование на собственной территории
  • Работа в облаке
  • Совместная работа с другими программами

SQLCoder – это мощная программа, которая может упростить и автоматизировать операции обработки данных. Задавайте запросы к базе данных легко с помощью SQLCoder, который переводит вопросы на естественном языке в SQL-запросы.

Использование SQLCoder может помочь вам в различных ситуациях.

  • Точность SQLCoder позволяет создавать правильные и эффективные SQL-запросы.
  • SQLCoder эффективен, так как может быстро и легко создавать SQL-запросы.
  • SQLCoder создает запросы, соответствующие правилам SQL или написанные в соответствии с ними.
  • Гибкость SQLCoder означает, что он может быть изменен в соответствии с требованиями вашей программы.

“`