7 проектов, созданных с помощью генеративного искусственного интеллекта

7 projects created using generative artificial intelligence.

 

Для входа на рынок труда в области науки о данных ошибкой является принимать как должное, что диплом достаточен для получения работы. Одно из основных предложений – создать сильный портфолио с личными проектами, которые могут сыграть ключевую роль в выделении на фоне других и впечатлении рекрутера. 

С появлением инструментов генеративного ИИ, таких как ChatGPT, уже недостаточно стандартных проектов, таких как обнаружение объектов и рекомендательные системы, чтобы привлечь внимание компании. В последние месяцы компании открывают вакансии для людей, способных создавать решения на основе генеративного ИИ.

По этим причинам мы рассмотрим 7 идей проектов, которые используют большие языковые модели для решения задачи:

  1. Создание портфолио веб-сайта 
  2. Персонализированный голосовой помощник 
  3. Создание собственного ИИ-переводчика
  4. Анализ научных статей
  5. Создание документации по коду
  6. Автоматизация презентаций Powerpoint
  7. Анализ тональности отзывов

 

1. Создание портфолио веб-сайта 

 

Есть много учебных пособий, которые объясняют, как создать веб-сайт портфолио в области науки о данных, но это может быть действительно пугающим, чтобы начать с нуля без каких-либо знаний HTML и CSS. Я сам пробовал, и это приносит много удовлетворения, когда вы достигаете цели, но мне потребовалась неделя, чтобы найти подходящие ресурсы и воплотить в жизнь то, что я узнал. 

Теперь, с бумом больших языковых моделей, вам больше не нужно напрягаться. Вам просто нужна хорошая идея, задавайте вопросы ChatGPT, который вернет код для вашего веб-сайта. Вы можете просто начать с такой подсказки:

Я решил создать статичный веб-сайт. Можете ли вы сгенерировать HTML-код для создания веб-сайта? Более того, мне нужно иметь три страницы: страница с моим именем и краткой презентацией, страница с моими проектами в области науки о данных и страница с моим опытом работы. Кроме этих страниц, я хочу иметь вертикальное навигационное меню слева для перехода с одной страницы на другую.

 

Как и в других приложениях, вам нужно четко представлять, что вы хотите сгенерировать на своем веб-сайте портфолио.

Ссылка на проект: Создание веб-сайта портфолио в области науки о данных с помощью ChatGPT

 

2. Персонализированный голосовой помощник 

 

В своей личной жизни я использую Google Assistant, чтобы попросить его воспроизвести музыку разных жанров. Например, “Google, я хочу послушать рок-музыку”, и он мгновенно воспроизводит случайную песню из YouTube Music. Это действительно быстрее, чем ввод названия песни, и он учитывает ваши предпочтения, собирая больше данных. Не было бы здорово сделать это в качестве личного проекта? Этот проект можно легко выполнить, используя GPT-3 для ответа на вопрос и Whisper API для транскрибации аудио.

Ссылка на проект: Персонализированный голосовой помощник с помощью GPT и Whisper

 

3. Создание собственного ИИ-переводчика

 

Вы устали копировать и вставлять текст в Google Translate? Лично я также пробовал расширения Google Chrome для перевода текста на веб-страницах, но мне все равно трудно, когда мне приходится читать PDF-файлы на английском языке. Возможной альтернативой является создание собственного приложения ИИ. Каждый день появляется новая мощная большая языковая модель, которая удивляет нас своими невероятными результатами. Почему бы не воспользоваться одной из этих моделей?! 

Это приложение можно создать с использованием Hugging Face, который предоставляет множество моделей, специализированных в переводах с одного языка на другой. Например, вы можете выбрать эту модель, которая нацелена на перевод с английского на итальянский. После того, как вы выберете модель для перевода, вы можете воплотить эту идею в жизнь, создав приложение с помощью Streamlit.

Ссылка на проект: Создание собственного ИИ-переводчика

 

4. Анализ научных статей

 

Во время своей научной стипендии я узнал, как быстро и эффективно читать статьи. Но просто чтение статьи объемом не менее 30 страниц занимает много времени, и трудно быть в курсе всех исследований с этим взрывом статей, которые выходят каждый день. Чтобы повысить производительность научных исследований, не лучше ли извлекать полезную информацию из научных статей? Вот три следующих случая использования, которые могут быть полезны для вашей карьеры в области науки о данных.

 

Вопросы и ответы по документам

 

Создание вопросов и ответов на основе документов – одно из самых интересных приложений, которые приносят ценность. Большинство учебных пособий используют Chat-GPT для создания автоматической сессии вопросов и ответов, но это не единственное решение. Вы также можете создать своего персонализированного бота, используя LangChain и Sentence Transformers от HuggingFace. Для этого нужно выполнить следующие шаги:

  1. Загрузите документ PDF с помощью PyPDFLoader
  2. Извлеките фрагменты из текста
  3. Извлеките векторное представление с помощью библиотеки Sentence Transformer
  4. Создайте бота для ответов на вопросы

Ссылки на проект:

  • Вопросы и ответы по документам с использованием API Chat-GPT
  • Вопросы и ответы с использованием LangChain и Sentence Transformers

 

Сводка документов

 

Еще один распространенный случай использования – это создание сводки документа. Как и ранее, эту задачу можно автоматизировать с помощью инструментов генеративного искусственного интеллекта. Можно создать удобное веб-приложение с использованием GPT-3, LangChain и Streamlit.

Ссылка на проект: Сводка документов

 

Запрос нескольких документов

 

Если мы суммируем несколько документов одновременно, было бы замечательно иметь возможность фильтровать эти сводки по вопросам. Не правда ли здорово? Это можно сделать очень просто, используя LangChain и OpenAPI-API.

Ссылка на проект: Запрос нескольких документов

 

5. Создание документации по коду

 

Во время работы в качестве специалиста по обработке данных в моем последнем опыте я заметил, насколько важно документировать код изо дня в день. Если вы работаете один, вам не важно. Но когда вы работаете в команде, становится сложно управлять задачами без документации кода. Особенно может случиться так, что участник команды покидает компанию, и он/она был/а единственным человеком, который понимал его/её код. Даже если документация действительно полезна, это очень скучная задача, которая занимает много времени. Благодаря взрывному росту моделей на больших языках, мы снова можем избежать этой тяжелой работы, создавая Python Docstring с помощью Chat-GPT.

Ссылка на проект: Создание документации по коду

 

6. Автоматизация презентаций PowerPoint

 

Если вы являетесь специалистом по обработке данных, наверняка случалось, что вам приходилось готовить слайды PowerPoint для обсуждения результатов с клиентом. Это еще одна затратная на время работа, которую можно автоматизировать благодаря генеративному искусственному интеллекту. Вы можете попросить Bing Chat сгенерировать код VBA для создания слайдов PowerPoint, четко указав контекст и информацию для каждого слайда.

Ссылка на проект: Автоматизация презентаций PowerPoint

 

7. Анализ эмоциональной окраски отзывов

 

В мире промышленности анализ эмоциональной окраски отзывов о продукте может помочь компаниям понять, нравятся ли клиентам продукты или нет, позволяя им улучшить сервис и оставаться конкурентоспособными на рынке. Это классический проект по науке о данных, который требует выполнения множества шагов: предобработка текста, векторное представление слов и применение модели машинного обучения.

Первый шаг является наиболее трудоемкой задачей, требующей хорошего понимания языка, на котором вы проводите анализ. Эту проблему можно быстро решить с помощью Chat-GPT. Кроме этого анализа, возможно также создать список плюсов и минусов из каждого отзыва, составить список возможных предложений для улучшения продукта и т.д.

Ссылка на проект: Анализ эмоциональной окраски отзывов

 

Финальные мысли

 

Вот и все! Вот семь проектов генеративного искусственного интеллекта, которые могут помочь вам улучшить свое резюме и повысить эффективность работы. Я рекомендую вам попробовать получать удовольствие от работы над проектами. Под влиянием вдохновения все возможно. Если у вас есть идея, попытайтесь воплотить ее на практике, и у вас получится. Спасибо за чтение. Хорошего дня!     Евгения Анелло в настоящее время является научным сотрудником в отделе информационной инженерии Университета Падуи, Италия. Ее исследовательский проект сосредоточен на непрерывном обучении в сочетании с обнаружением аномалий.