Новое исследование представляет инструмент машинного обучения, который легко распознает, когда химические статьи написаны с использованием чатбота ChatGPT.

Новое исследование инструмент машинного обучения, который легко распознает, когда химические статьи созданы с помощью ChatGPT

В эпоху, о beh dominated by AI advancements, отличить человека от машинно-сгенерированного контента, особенно в научных публикациях, стало все более важным. В данной работе предлагается решение проблемы, связанное с идентификацией и различением человеческого и машинно-сгенерированного письма в химических статьях с высокой точностью.

Текущие инструменты обнаружения текста AI, включая последний классификатор OpenAI и ZeroGPT, сыграли важную роль в идентификации машинно-сгенерированного контента. Однако эти инструменты имеют ограничения, что побудило исследователей предложить специализированное решение, особенно для научного письма. Этот новый метод, отличающийся своей способностью выдерживать сложные задачи и разнообразные стили письма с высокой точностью, является значительным прорывом в этой сфере.

Исследователи пропагандируют использование специальных решений вместо общих детекторов. Они обращают внимание на необходимость инструментов для работы с тонкостями научного языка и стиля. Предлагаемый метод блеснет в этом контексте, проявляя исключительную точность даже при сложных условиях. Иллюстративным примером является генерация текста ChatGPT с помощью сложных задач, таких как создание введений на основе содержания реальных аннотаций. Это показывает эффективность метода в распознавании машинно-сгенерированного содержимого при выполнении сложных инструкций.

В основе предложенного решения лежат 20 тщательно разработанных функций, направленных на улавливание тонкостей научного письма. Модель обучена на примерах из десяти разных химических журналов и ChatGPT 3.5, и она обладает гибкостью и стабильной производительностью на разных версиях ChatGPT, включая усовершенствованный GPT-4. Интеграция XGBoost для оптимизации и надежных методов извлечения характеристик подчеркивает приспособляемость и надежность модели.

Извлечение характеристик включает различные элементы, включая подсчет предложений и слов, наличие пунктуации и определенных ключевых слов. Этот всесторонний подход обеспечивает нюансированное представление отличительных особенностей человеческого и машинно-сгенерированного текста. В статье также рассматривается производительность модели при применении к новым документам, не включенным в обучающий набор. Результаты показывают незначительное снижение производительности, а модель проявляет устойчивость при классификации текста из GPT-4, что является подтверждением ее эффективности на разных версиях языковых моделей.

В заключение, предложенный метод является заслуживающим похвалы решением приземистой задачи обнаружения машинно-сгенерированного текста в научных публикациях. Его стабильная производительность при выполнении различных задач, работа с разными версиями ChatGPT и тестирование вне области определения подчеркивают его надежность. В статье подчеркивается гибкость разработки метода, завершение цикла занимает примерно один месяц, что делает его практичным и своевременным решением, приспособляемым к изменяющемуся ландшафту языковых моделей.

Отвечая на вопросы о возможных обходах, исследователи стратегически решили не публиковать рабочие детекторы в Интернете. Этот намеренный шаг добавляет элемент неопределенности и отговаривает авторов от попыток манипулировать машинно-сгенерированным текстом, чтобы избежать обнаружения. Появление таких инструментов способствует ответственному использованию искусственного интеллекта, уменьшая вероятность нарушения академической этики.

В будущем исследователи утверждают, что обнаружение текста AI не обязательно должно превращаться в непреодолимую гонку вооружений. Вместо этого оно может рассматриваться как редакторская задача, автоматизируемая и надежная. Демонстрируемая эффективность обнаружения текста AI в научных изданиях открывает возможности для его внедрения в практику академического издания. При интеграции машинно-сгенерированного контента в журналы инструменты такого рода предлагают жизнеспособные пути вперед, поддерживая академическую целостность и стимулируя ответственное использование искусственного интеллекта в научной коммуникации.