Giskard выпускает Giskard Bot на платформе HuggingFace бот, который автоматически обнаруживает проблемы с моделями машинного обучения, которые вы загрузили в HuggingFace Hub.

Giskard Bot на платформе HuggingFace автоматическое обнаружение проблем с загруженными моделями машинного обучения

В революционной разработке, опубликованной 8 ноября 2023 года, бот Giskard стал переломным средством в моделях машинного обучения (ML), ориентированных на модели большого языка (LLM) и табличные модели. Эта тестовая среда с открытым исходным кодом, посвященная обеспечению целостности моделей, предлагает множество функций, все безупречно интегрированные с платформой HuggingFace (HF).

Основные цели Giskard ясны:

  • Обнаружение уязвимостей.
  • Генерация доменно-специфических тестов.
  • Автоматизация выполнения наборов тестов в рамках непрерывной интеграции/непрерывного развертывания (CI/CD).

Он действует как открытая платформа для обеспечения качества ИИ, соответствуя философии сообщества Hugging Face.

Одной из наиболее значимых интеграций, внедренных ботом Giskard на HF hub. Этот бот позволяет пользователям Hugging Face автоматически публиковать отчеты о уязвимостях при каждом пуше новой модели в HF hub. Эти отчеты, отображаемые в обсуждениях HF и в карточке модели через pull request, предоставляют немедленный обзор потенциальных проблем, таких как предвзятость, этические вопросы и устойчивость.

Убедительным примером в статье является мастерство бота Giskard. Предположим, что модель анализа настроений, использующая Roberta для классификации Twitter, загружена в HF Hub. Бот Giskard быстро обнаруживает пять потенциальных уязвимостей, определяя конкретные преобразования в функции “текст”, которые значительно изменяют предсказания. Эти результаты подчеркивают важность реализации стратегий аугментации данных в процессе создания обучающего набора, предлагая глубинный анализ производительности модели.

Что отличает Giskard, это его приверженность к качеству, а не к количеству. Бот не только количественно оценивает уязвимости, но и предлагает качественные идеи. Он предлагает изменения в карточке модели, выделяя предвзятость, риски или ограничения. Эти предложения удобно представлены в виде pull request в HF hub, упрощая процесс проверки для разработчиков моделей.

Сканирование Giskard не ограничивается стандартными моделями NLP; оно расширяет свои возможности на LLM, показывая сканирование уязвимости для LLM RAG-модели, ссылающейся на доклад IPCC. Сканирование выявляет проблемы, связанные с галлюцинациями, дезинформацией, вредностью, раскрытием конфиденциальной информации и устойчивостью. Например, оно автоматически выявляет проблемы, такие как нераскрытие конфиденциальной информации о методологиях, использованных при создании докладов IPCC.

Но Giskard не заканчивается на обнаружении; он уполномочивает пользователей на полноценное устранение проблем. Пользователи могут получать доступ к специализированному пространству на Hugging Face Spaces, получая действенные идеи по обнаружению сбоев моделей. Это облегчает сотрудничество с экспертами в области и дизайн тестов, приспособленных к уникальным случаям использования ИИ.

Отладка тестов становится эффективной с помощью Giskard. Бот позволяет пользователям понять коренные причины проблем и предоставляет автоматизированные идеи во время отладки. Он предлагает тесты, объясняет вклад слов в предсказания и предлагает автоматические действия на основе полученных исходов.

Giskard – это не односторонняя улица; он поощряет обратную связь от экспертов в области через свою функцию “Пригласить”. Эта агрегированная обратная связь предоставляет всестороннее представление о потенциальных улучшениях модели, помогая разработчикам повысить точность и надежность модели.