Новая функция генеративного искусственного интеллекта в BigQuery

Инновационное применение генеративного искусственного интеллекта в BigQuery

Как использовать удаленную функцию BigQuery GENERATE_TEXT

«Каждый может писать код и проводить анализ NLP в BigQuery с знанием SQL и хорошей структурой подсказок» [Фото от Adi Goldstein на Unsplash]

Введение

С тех пор, как я начал работать с платформой Google, Google не перестает удивлять меня своими возможностями BigQuery (BQ) и разработкой.

На самом деле, настоящий «вау»-момент для меня произошел четыре года назад.

Я помню это, словно было вчера, когда я сидел в первом ряду на конференции Big Data London 2019. Тогда я еще не знал о возможности создания моделей машинного обучения, используя только функции BigQuery, или точнее говоря, что такое BigQuery Machine Learning (BQML).

По крайней мере, до конференции, где сотрудник Google рассказал о том, как можно создавать модели классификации, кластеризации и прогнозирования временных рядов с помощью всего лишь SQL от Google.

Первая мысль, которая тогда пришла мне в голову, была: «Ты, должно быть, шутишь».

Вторая мысль, которая возникла в моей голове, была: «Это значит, что каждый, кто знает только SQL, сможет создавать модели машинного обучения?»

Как вы можете догадаться, ответ – «да», если вы используете BigQuery в качестве хранилища данных.

Теперь, используя функции BQML уже некоторое время, правильный ответ на указанный вопрос – «может быть».

Это означает, что хотя синтаксис CREATE MODEL написан на SQL, все же необходимо иметь понимание моделирования машинного обучения и статистики.

Другими словами, вам все равно нужно понимать математические основы доступных моделей для различных типов задач машинного обучения (с учителем/без учителя), проводить инженерию признаков, настраивать гиперпараметры и выполнять задачи оценки модели.

Перейдем к 2023 году, и BigQuery продолжает меня удивлять своими новыми возможностями.

На этот раз мы говорим о новых функциях генеративного искусственного интеллекта в BigQuery.

С помощью этих новых функций инженеры данных и аналитики могут выполнять задачи генерации естественного языка на текстовых данных, хранящихся в таблицах BigQuery, с помощью нескольких строк запроса.

Следовательно, целью этого блог-поста является демонстрация новых аналитических возможностей BigQuery в области генеративного искусственного интеллекта, с акцентом на одной функции