Улучшите обучение с помощью плагинов ChatGPT для студентов и учреждений

Улучшите обучение с помощью плагинов ChatGPT для студентов и учреждений' can be condensed to 'Улучшите обучение с помощью ChatGPT-плагинов для студентов и учреждений.

Введение

ChatGPT быстро стал одной из самых передовых моделей разговорного искусственного интеллекта, завораживая пользователей своей способностью генерировать текст, похожий на человеческий, на различные темы. В то время как бесплатная версия ChatGPT стала популярной, плагины ChatGPT для студентов и учебных заведений позволяют пользователям настраивать свой опыт, просматривать веб-страницы и получать доступ к специализированным модулям знаний, адаптированным под конкретные отрасли или интересы.

Плагины ChatGPT предоставляют платформу для улучшения образовательного опыта студентов в колледжах и учебных заведениях. Эти плагины могут настраивать ответы чатбота, чтобы удовлетворять определенным академическим требованиям путем интеграции специализированных инструментов и ресурсов. Возможности основной модели расширяются плагинами, которые могут предоставлять услуги по переводу языков, предоставлять предметно-специфические идеи или решать сложные математические задачи. Кроме того, с учетом различных предпочтений в обучении, они могут облегчать новые и улучшенные методы обучения.

Цели обучения

  • Понять основные случаи использования плагинов ChatGPT.
  • Изучить подобранный список популярных и влиятельных плагинов ChatGPT для студентов и учебных заведений.
  • Анализировать реальные случаи использования, где студенты могут использовать эти плагины для изучения новых концепций, понимания, анализа и решения проблем.
  • Глубоко погрузиться в генерацию ввода и вывода на основе кода для анализа данных с помощью плагинов ChatGPT.

Эта статья была опубликована в рамках марафона по науке о данных.

Генеративный искусственный интеллект и плагины ChatGPT

Генеративный искусственный интеллект революционизировал способ создания, анализа и взаимодействия с цифровыми данными, позволяя машинам создавать новые результаты на основе предоставленных входных данных. В то время как ChatGPT стал популярной платформой благодаря своей способности генерировать связный и контекстно значимый ответ, интеграция плагинов позволяет использовать более специализированные функциональные возможности, плавную интеграцию с другим программным обеспечением и настраиваемый пользовательский опыт, который ориентирован на различные отрасли, включая образовательные учреждения и студентов.

Некоторые из популярных плагинов ChatGPT для студентов:

  • Диаграммы: Плагин Diagrams для ChatGPT-4 позволяет создавать визуальные объяснения с помощью диаграмм. Он поддерживает различные синтаксисы, такие как Mermaid, GraphViz, PlantUML и многие другие. Пользователи могут обрабатывать объяснения или вносить изменения в существующие диаграммы.
  • ScholarAI: ScholarAI – это плагин, который можно использовать для доступа к рецензируемым научным статьям и исследовательским работам. С помощью этого плагина студенты могут быстро получать ответы на актуальные научные исследования, обеспечивая надежные данные для улучшения научных исследований и получения новых знаний.
  • Чат с PDF: Плагин Chat With PDF позволяет получать доступ к PDF-файлам из Интернета через ChatGPT. Это удобное средство упрощает получение информации из PDF-файлов путем указания ссылки. Студенты могут задавать вопросы или искать конкретные детали из содержимого документа.
  • Wolfram: Плагин Wolfram улучшает возможности ChatGPT, связывая его с вычислительными инструментами, математическими функциями, хорошо организованной информацией, актуальными данными и функциями визуализации. Это может быть дополнено другими плагинами, такими как Diagrams, для чтения, обработки и вычисления математических задач с использованием данных, полученных из входных диаграмм.
  • Video Insights: Плагин Video Insights помогает анализировать видео-контент в режиме реального времени и получать ценные сведения. Студенты могут использовать плагин, чтобы быстро освежить в памяти и повторить ключевые концепции из длинных видеолекций и создавать заметки.
  • Открытая лекция: Плагин Open lecture позволяет получать доступ к контенту и лекциям университетского уровня. Это означает наличие цифрового архива университетских докладов, книг и учебных материалов прямо в вашем кармане.
  • Code Interpreter: Code Interpreter – это многофункциональный плагин, который расширяет возможности искусственного интеллекта чатбота для загрузки данных, написания и редактирования кода, а также выполнения различных операций и анализа. Вы можете попросить ChatGPT проанализировать данные, создать диаграммы, редактировать файлы, выполнять математические операции и использовать его для анализа данных и многое другое.

Плагин Diagrams

Давайте подробнее рассмотрим плагин Диаграммы и его использование. Плагин Диаграммы можно использовать для создания визуализации, представляющей сложные идеи и процессы. Используя его возможности, студенты могут рисовать цифровые диаграммы, описывая их.

Например: Студент по науке о данных хочет визуализировать нейронные сети и создать для них диаграмму, описывая их особенности и детали.

Задание: Опишите нейронную сеть с 5 скрытыми слоями. Добавьте все виды деталей на диаграмму, такие как случайные значения весов в каждом скрытом слое, случайные значения смещения в каждом скрытом слое, несколько чисел нейронов в каждом слое, функцию активации и другую информацию. Используйте gpt4, не используйте плагины.

Ответ от ChatGPT

Входной слой: Здесь данные подаются в сеть. Количество нейронов в этом слое соответствует количеству входных признаков.

Скрытые слои (1-5): Здесь происходит магия. Каждый нейрон в скрытом слое получает входные данные от всех нейронов предыдущего слоя, обрабатывает их (с использованием весов, смещения и функции активации) и отправляет свой вывод всем нейронам следующего слоя.

Выходной слой: Этот слой производит окончательное предсказание или классификацию. Количество нейронов здесь обычно соответствует количеству классов или выходов.


Входной слой
|  Нейрон 1
|  Нейрон 2
|  ...
|  Нейрон N

Скрытый слой 1
|  Нейрон 1 (Вес: 0.5, Смещение: 0.3, Активация: ReLU)
|  Нейрон 2 (Вес: 0.7, Смещение: 0.2, Активация: ReLU)
|  ...
|  Нейрон M

Скрытый слой 2
|  Нейрон 1 (Вес: 0.6, Смещение: 0.1, Активация: ReLU)
|  Нейрон 2 (Вес: 0.8, Смещение: 0.4, Активация: ReLU)
|  ...
|  Нейрон O

Скрытый слой 3
|  Нейрон 1 (Вес: 0.4, Смещение: 0.5, Активация: ReLU)
|  Нейрон 2 (Вес: 0.9, Смещение: 0.2, Активация: ReLU)
|  ...
|  Нейрон P

Скрытый слой 4
|  Нейрон 1 (Вес: 0.3, Смещение: 0.3, Активация: ReLU)
|  Нейрон 2 (Вес: 0.7, Смещение: 0.6, Активация: ReLU)
|  ...
|  Нейрон Q

Скрытый слой 5
|  Нейрон 1 (Вес: 0.5, Смещение: 0.4, Активация: ReLU)
|  Нейрон 2 (Вес: 0.6, Смещение: 0.7, Активация: ReLU)
|  ...
|  Нейрон R

Выходной слой
|  Нейрон 1 (Вес: 0.8, Смещение: 0.5, Активация: Sigmoid)
|  Нейрон 2 (Вес: 0.9, Смещение: 0.6, Активация: Sigmoid)
|  ...
|  Нейрон S

Дополнительное задание: Теперь используйте плагин диаграммы, чтобы создать нейронную сеть на основе вышеприведенных данных.

Ответ от ChatGPT

Вот диаграмма нейронной сети с помеченными весами и смещениями для каждого нейрона:

На этой диаграмме:
Каждый круг представляет собой нейрон. Метки внутри нейронов в скрытых слоях и слое вывода указывают веса (W) и смещения (B) для данного нейрона.
Соединения (изображены синим цветом) представляют поток данных и веса между нейронами.

Диаграмму можно дальше изменить или улучшить. Диаграмму можно создать, используя определенные форматы raw GraphViz, которые можно протестировать на kroki.io. Используя этот формат, пользователь может автоматизировать создание конкретных диаграмм, изменять значения и изменять компоновку с высокой точностью.

Давайте рассмотрим простой пример:

Дополнительное задание: Вставьте исходный код диаграммы в формате Graphviz для kroki.io вышеуказанной диаграммы.

Ответ от ChatGPT

digraph G {
 rankdir=LR;
 node [shape=circle, style=filled, color=lightblue];

 subgraph cluster_0 {
 label="Входной слой";
 I1;
 I2;
 I3 [label="..."];
 I4;
 }

 subgraph cluster_1 {
 label="Скрытый слой 1";
 H11 [label="W: 0.5\nB: 0.3"];
 H12 [label="W: 0.7\nB: 0.2"];
 H13 [label="..."];
 H14;
 }

 subgraph cluster_2 {
 label="Скрытый слой 2";
 H21 [label="W: 0.6\nB: 0.1"];
 H22 [label="W: 0.8\nB: 0.4"];
 H23 [label="..."];
 H24;
 }

 subgraph cluster_3 {
 label="Скрытый слой 3";
 H31 [label="W: 0.4\nB: 0.5"];
 H32 [label="W: 0.9\nB: 0.2"];
 H33 [label="..."];
 H34;
 }

 subgraph cluster_4 {
 label="Скрытый слой 4";
 H41 [label="W: 0.3\nB: 0.3"];
 H42 [label="W: 0.7\nB: 0.6"];
 H43 [label="..."];
 H44;
 }

 subgraph cluster_5 {
 label="Скрытый слой 5";
 H51 [label="W: 0.5\nB: 0.4"];
 H52 [label="W: 0.6\nB: 0.7"];
 H53 [label="..."];
 H54;
 }

 subgraph cluster_6 {
 label="Выходной слой";
 O1 [label="W: 0.8\nB: 0.5"];
 O2 [label="W: 0.9\nB: 0.6"];
 O3 [label="..."];
 O4;
 }

 {I1 I2 I3 I4} -> {H11 H12 H13 H14} [color=blue];
 {H11 H12 H13 H14} -> {H21 H22 H23 H24} [color=blue];
 {H21 H22 H23 H24} -> {H31 H32 H33 H34} [color=blue];
 {H31 H32 H33 H34} -> {H41 H42 H43 H44} [color=blue];
 {H41 H42 H43 H44} -> {H51 H52 H53 H54} [color=blue];
 {H51 H52 H53 H54} -> {O1 O2 O3 O4} [color=blue];
}

Когда мы вставляем этот код изображения Graphviz в kroki.io, мы можем увидеть диаграмму. Каждая из этих частей диаграммы может быть изменена.

Чат с плагином PDF

Плагин Чата с PDF полезен для студентов, чтобы быстро резюмировать PDF-файлы и записывать ключевые идеи. Например, исследователи в области науки о данных могут быстро резюмировать и записывать ключевые аспекты научных статей. Ниже приведен пример для статьи о «Обзоре крупных языковых моделей».

Задание: Резюмируйте следующий PDF-файл о крупных языковых моделях: https://arxiv.org/pdf/2307.06435.pdf

Ответ от ChatGPT: Предоставленные отрывки из PDF-файла в основном содержат детали о различных крупных языковых моделях (КЯМ) и их конфигурациях, наборах данных и ссылках. Вот краткий обзор на основе извлеченного содержимого.

Документ обсуждает различные КЯМ, включая, но не ограничиваясь:

  • ERNIE 3.0
  • Jurassic-1
  • HyperCLOV A
  • Gopher
  • GPT-NeoX-20B
  • BLOOM
  • Galactica
  • GLaM
  • LaMDA
  • MT-NLG
  • AlphaCode
  • Chinchilla
  • PaLM
  • AlexaTM
  • Sparrow
  • U-PaLM
  • GLM
  • CodeGen
  • LLaMA
  • PanGu-Σ
  • Bloomberg GPT
  • и многие другие.

Наборы данных

  1. QuAC: Симулирует диалог поиска информации между студентами и учителями с использованием скрытого текста Википедии. В нем присутствуют уникальные задачи, которых нет в наборах данных по машинному пониманию.
  2. COPA: Оценивает прогресс модели в общей области рассуждений на основе здравого смысла. Каждый вопрос состоит из предпосылки и двух альтернатив, и модель должна выбрать более правдоподобную альтернативу.
  3. WSC (Winograd Schema Challenge): Задача на понимание текста, в которой система должна разрешить ссылки в тексте, часто требуя мировых знаний и рассуждений.
  4. RACE: Набор данных на понимание текста, собранный из экзаменов по английскому языку в Китае, используется для оценки и тестирования моделей искусственного интеллекта в понимании и ответах на вопросы по длинным и сложным текстам.
  5. StrategyQA: Требует рассуждений на основе нескольких доказательств для оценки стратегической способности решения проблем моделями искусственного интеллекта.
  6. CSQA (CommonsenseQA): Набор данных для вопросно-ответной системы, требующий знания здравого смысла.
  7. GLUE (General Language Understanding Evaluation): Коллекция ресурсов для обучения, оценки и анализа систем понимания естественного языка. Включает в себя различные задачи, проверяющие широкий спектр языковых явлений.

Архитектура

  • Нормализация слоев: имеет значительное влияние на производительность и стабильность обучения языковых моделей LLM. Преднормализация (нормализация входов, а не выходов) является более распространенной среди LLM. Некоторые модели используют дополнительную нормализацию слоев перед слоем эмбеддингов для стабильности. Однако существуют дебаты о преимуществах преднормализации за определенные пределы.
  • Позиционное кодирование: влияет на производительность и стабильность обучения LLM. Различные модели получили разные результаты с использованием разных методов позиционного кодирования, таких как ALiBi и вращающиеся позиционные кодирования.
  • Параллельное внимание: это включает параллельное использование слоев внимания и прямого прохода.

Документ также рассматривает архитектурные модули, используемые в различных LLM, подчеркивая, что незначительные изменения в архитектуре и стратегиях обучения могут оказывать значительное влияние на производительность и стабильность. В статье обсуждаются эффекты нормализации слоев, позиционного кодирования и параллельного внимания на производительность LLM.

Плагин Wolfram

Студенты могут использовать плагин Wolfram для решения математических задач, построения графиков и многого другого с использованием текстовых описаний. Ниже приведен пример простой задачи линейной регрессии, решенной с использованием плагина Wolfram:

Подсказка: Используя плагин Wolfram, решите следующий вопрос:

Вопрос: Анализ линейной регрессии

Исследователь изучает связь между количеством часов, которые студенты учатся, и их итоговыми оценками по экзамену. Данные, собранные из выборки из 10 студентов, представлены ниже:

Таблица

Задачи:

  1. Постройте данные на точечной диаграмме с “Количество часов, потраченных на учебу” по оси x и “Оценка по экзамену” по оси y.
  2. Рассчитайте уравнение наилучшей прямой (линейной регрессии) для заданных данных.
  3. Используя уравнение, предскажите оценку по экзамену для студента, который учился 7 часов.
  4. Рассчитайте коэффициент детерминации (R^2) и проинтерпретируйте его значение.
  5. Обсудите выбросы или закономерности в данных.

Ответ от ChatGPT

Вот результаты анализа линейной регрессии для заданных данных:

  1. Наилучшая прямая по методу наименьших квадратов (уравнение линейной регрессии): y = 5.02597x + 45.1039

Диагностика модели

  • AIC (Критерий Акаике): 6.21293
  • BIC (Байесовский информационный критерий): 7.12068
  • R2 (Коэффициент детерминации): 0.998999
  • Скорректированный R2: 0.998874

График наилучшей прямой

Наилучшая прямая

График остатков:

Остатки

Используя уравнение y=5.02597x+45.1039, мы можем предсказать оценку на экзамене для студента, который учился 7 часов:

y=5.02597(7)+45.1039

Давайте рассчитаем это предсказание.

Для студента, который учился 7 часов, предсказанная оценка на экзамене составляет примерно y≈80.29.

Подводя итог

  1. Уравнение линии наилучшей подгонки (линейной регрессии) для данного набора данных: y=5.02597x+45.1039.
  2. Предсказанная оценка на экзамене для студента, который учился 7 часов, составляет примерно 80.29.
  3. Коэффициент детерминации R2 равен 0.998999, что указывает на то, что примерно 99.9% дисперсии оценок на экзамене может быть объяснено количеством часов учебы. Это говорит о прочной линейной связи между этими двумя переменными.
  4. График остатков и высокое значение R2 свидетельствуют о том, что линейная модель хорошо соответствует данным.

Плагин интерпретатора кода (плагин расширенного анализа данных)

Плагин расширенного анализа данных (ранее плагин интерпретатора кода) может использоваться для загрузки CSV-файлов, выполнения анализа на них, запуска определенных моделей машинного обучения и предсказания результатов. Вот пример:

Набор данных Moonlanding.csv содержит информацию о всех попытках посадки на Луну. Попросим плагин анализа данных ChatGPT выполнить EDA и показать результаты.

Подсказка: Это набор данных о всех посадках на Луну. Выполните исследовательский анализ данных и покажите все результаты.

Ответ от ChatGPT

# Попробуйте прочитать набор данных с использованием другой кодировки
moon_landing_data = pd.read_csv('/mnt/data/Moonlanding.csv', encoding='ISO-8859-1')

# Отобразить несколько первых строк
moon_landing_data.head()

# Базовая статистика и информация о наборе данных

# Сводная статистика числовых столбцов
summary_stats = moon_landing_data.describe()

# Тип данных и количество непустых значений каждого столбца
data_info = moon_landing_data.info()

unique_values = moon_landing_data.nunique()

summary_stats, unique_values

Из основной статистики и информации

  1. Набор данных содержит 158 записей.
  2. Все столбцы имеют тип данных “object” (строка).
  3. “Дополнительная информация” имеет одно отсутствующее значение.
  4. Есть 147 уникальных названий миссий, но 158 уникальных названий космических аппаратов, что может указывать на то, что некоторые миссии могут иметь несколько космических аппаратов или одно и то же название миссии использовалось несколько раз.
  5. “Ракета-носитель” имеет 51 уникальный тип, наиболее часто встречающийся – “Proton-K/D”.
  6. Набор данных содержит записи от 22 разных операторов, наиболее часто встречающимся является “United States NASA”.
  7. Есть 13 уникальных типов миссий, наиболее часто встречающийся – “Orbiter”.
  8. Столбец “Результат” имеет 6 уникальных значений, наиболее часто встречающимся является “Успешно”.
import matplotlib.pyplot as plt
import seaborn as sns

# Настройка фигуры и оси
plt.figure(figsize=(12, 6))

# Построение распределения миссий по их результатам
sns.countplot(data=moon_landing_data, y='Outcome', 
order=moon_landing_data['Outcome'].value_counts().index, palette="viridis")
plt.title('Распределение миссий по результатам')
plt.xlabel('Количество миссий')
plt.ylabel('Результат')

plt.tight_layout()
plt.show()
Визуализация

Визуализация дает представление о распределении миссий на Луну по их результатам:

  1. Большинство миссий были успешными.
  2. Значительное количество столкнулось с неудачами в запуске.
  3. Также есть значительное количество миссий с результатами, категоризированными как “Частичная неудача” или “Полная неудача”.
Визуализация

Визуализация предоставляет представление о временном распределении миссий на Луну:

  1. В конце 1950-х и в 1960-х годах произошел всплеск миссий на Луну. Этот период соответствует космической гонке между США и СССР.
  2. В конце 1970-х, 1980-х и начале 1990-х годов произошло снижение числа миссий на Луну.
  3. Начиная с середины 1990-х и продолжаясь в 2000-х и 2020-х годах, наблюдается увеличение числа миссий на Луну, что указывает на возрожденный интерес к лунной эксплорации.
Визуализация

Визуализация предоставляет представление о распределении миссий на Луну в зависимости от их типа:

  1. Миссии орбитеров являются наиболее распространенными, что указывает на то, что многие миссии были направлены на орбиту Луны без посадки.
  2. Миссии мимоходом и миссии с ударом также относительно часто встречаются.
  3. Миссий с роверами, образцами возврата и посадочными аппаратами меньше, что указывает на то, что миссии, связанные с физическим взаимодействием с поверхностью Луны, менее распространены.
# Топ-5 наиболее часто используемых ракет-носителей
top_rockets = moon_landing_data['Carrier Rocket'].value_counts().head(5)

top_rockets

Ракеты-носители

Пять наиболее часто используемых ракет-носителей для миссий на Луну:

  1. Протон-К/Д с 24 миссиями.
  2. Молния-М с 12 миссиями.
  3. SLS Block 1 с 11 миссиями.
  4. Сатурн V с 10 миссиями.
  5. Луна с 9 миссиями.

Эта информация дает представление о популярных ракетах, выбранных для миссий на Луну на протяжении многих лет. Это завершает наше начальное исследование данных о миссиях на Луну.

Заключение

ChatGPT — это свидетельство эволюции разговорного искусственного интеллекта, предлагая не только простой диалог. Интеграция плагинов, особенно для студентов и университетов, является трансформационным подходом к улучшению методов обучения. От предоставления визуальных объяснений с помощью плагина Diagrams до доступа к научным статьям или аналитике и EDA с помощью плагина Code Interpreter, плагины ChatGPT находят много применений для студентов. Более того, эти плагины могут быть легко интегрированы, например, путем комбинирования плагинов Diagrams и Wolfram для визуализации математических задач, что показывает синергию и потенциал этих плагинов.

Основные выводы

  • Расширенные возможности с плагинами: Плагины ChatGPT Plus позволяют пользователям настраивать свой опыт, получать специализированные знания и интегрироваться с другими программными продуктами, тем самым удовлетворяя конкретные отрасли или интересы.
  • Трансформация образования: Для студентов и учебных заведений плагины, такие как Diagrams и Scholar AI, предлагают индивидуальные опыты обучения, облегчая все, начиная от визуальных объяснений до доступа к рецензируемым исследованиям.
  • Универсальность плагинов: Студенты могут использовать несколько плагинов разными способами для обучения и создания учебного контента с помощью простых подсказок. В то время как плагин diagrams облегчает создание и изменение любой диаграммы, Wolfram позволяет пользователю легко решать простые и сложные математические задачи с использованием естественно-языковых запросов.

Часто задаваемые вопросы

Показанные в данной статье материалы не принадлежат Analytics Vidhya и используются по усмотрению автора.