Познакомьтесь с EasyEdit простой в использовании фреймворк для редактирования знаний с помощью искусственного интеллекта для LLM
EasyEdit - простой фреймворк для редактирования знаний с использованием искусственного интеллекта для LLM
Мы постоянно должны быть в курсе этого постоянно меняющегося мира, так же, как и модели машинного обучения, чтобы получать точный результат. Большие языковые модели часто страдают от проблем фальсификации, то есть они не знают о невидимых событиях или генерируют текст с некорректными фактами из-за устаревших/шумных данных. Например, такие LLM, как ChatGPT и LlaMA, обладают информацией только до своей последней точки обучения, и, по сути, нам нужно обновить параметрическое знание внутри LLM, чтобы изменить их конкретное поведение. Было предложено множество методов редактирования знаний или моделей для создания правок в моделях машинного обучения, минимизируя при этом влияние на несвязанные входные данные.
Для решения постоянных вызовов на основе обрезки знаний/смещенных выходных данных исследователи применяют два основных метода:
- Тонкая настройка (Fine-Tuning), традиционная тонкая настройка и дельта-настройка используют наборы данных, специфичные для области, но они потребляют огромные ресурсы и сопряжены с риском потенциального катастрофического забывания.
- Подсказка – Дополнение (Prompt Augmentation), когда предоставляются изобилие демонстраций или собранных контекстов, большие языковые модели (LLM) проявляют способность улучшать свои способности к рассуждению и улучшать свои задачи генерации путем интеграции внешних знаний. Недостатком этой техники является ее чувствительность к таким факторам, как шаблон подсказки и выбор контекстных примеров.
Из-за значительных различий между различными методами редактирования знаний и вариациями настроек задачи нет стандартного фреймворка реализации. Для решения этих проблем и создания унифицированного фреймворка исследователи представили EASYEDIT, простой в использовании фреймворк редактирования знаний для LLM. Он поддерживает передовые методы редактирования знаний и может быть легко применен к таким известным LLM, как T5, GPT-J и LlaMA.
- Языковые модели с программным обеспечением
- Познакомьтесь с SQLCoder новой моделью с открытым исходным кодом и передовыми технологиями для преобразования вопросов на естественном языке в SQL-запросы.
- Маленькая история о генеративном искусственном интеллекте вызов в рисовании
Платформа EASYEDIT вводит удобный пользовательский интерфейс “редактирования”, который позволяет легко изменять модель. Включая ключевые элементы, такие как Hparams, Method и Evaluate, этот интерфейс плавно включает различные стратегии редактирования знаний. Основным механизмом для реализации этих стратегий является функция APPLY_TO_MODEL, доступная через различные методы. На приведенной выше фигуре показан пример применения MEND к LLaMA с изменением вывода о президенте США на Джо Байдена.
EASYEDIT использует модульный подход к организации методов редактирования и оценке их эффективности, учитывая их взаимодействие и комбинацию. Платформа включает в себя ряд сценариев редактирования, включая редактирование одного экземпляра, пакетное редактирование экземпляров и последовательное редактирование. Кроме того, она проводит оценку критических метрик, таких как Надежность, Обобщение, Локальность и Переносимость, которые помогают пользователям определить наиболее подходящий метод, настроенный на их конкретные требования.
Результаты редактирования знаний на LlaMA-2 с помощью EASYEDIT показывают, что редактирование знаний превосходит традиционную тонкую настройку по надежности и обобщению. В заключение, фреймворк EasyEdit становится ключевым достижением в области больших языковых моделей (LLM), решающим критическую потребность в доступном и интуитивном редактировании знаний.