Познакомьтесь с моделью Nous-Hermes-Llama2-70b передовой языковой моделью, настроенной на более чем 300 000 инструкций.

Meet the Nous-Hermes-Llama2-70b model, an advanced language model trained on over 300,000 instructions.

Трансформер Hugging Face является чрезвычайно популярной библиотекой на языке Python, которая предоставляет предобученные модели, которые чрезвычайно полезны для различных задач обработки естественного языка. Ранее он поддерживал только PyTorch, но теперь также поддерживает Tensorflow. Nous-Hermes-Llama2-70b – это языковая модель NLP, которая использует более лаков инструкций. Эта модель использует тот же набор данных, что и старая модель Hermes, чтобы обеспечить отсутствие значительных изменений во время обучения модели и сделать процесс еще более плавным. В модели по-прежнему есть некоторые недостатки, такие как более низкая частота галлюцинаций и отсутствие цензуры OpenAI.

Обучение модели проводилось на больших наборах данных, которые были невероятно объемными в терминах обрабатываемых данных и их стиле. Данные были найдены из разных источников и объединены в один набор данных, что привело к разнообразию знаний в обработанном наборе данных. Набор данных собирал данные из разных источников, таких как Teknium, Karan4D, Emozilla, Huemin Art и Pygmalion AI. Модель обучается с использованием модели Alpaca. Исследовательская группа провела оценку человеком на входных данных из набора данных самооценки, чтобы оценить Alpaca. Исследователи собрали этот набор оценок и охватили разнообразный список инструкций, ориентированных на пользователя, которые покрывают практически все.

Исследователи также заявили, что от этой модели, которая была выполнена, также выиграют инженеры по подсказкам. Исследователи считают, что публикация вышеуказанных активов позволит академическому сообществу проводить научные исследования по контролю языковых моделей, следующих инструкциям, и в конечном итоге приведет к разработке новых методик для решения существующих недостатков этой модели. Внедрение интерактивного демо-версии Alpaca также представляет потенциальные риски, такие как более широкое распространение вредоносного контента и снижение вероятности спама. В обработке спама в NLP также играет важную роль данная модель. Исследователи понимают, что такие меры смягчения могут быть реализованы, когда мы выпустим веса модели или если пользователи обучат свою модель, следуя инструкциям.

Будущие планы этого проекта также включают итерацию качественных данных и применение методов для удаления данных низкого качества впереди. Исследователи также должны более строго оценить Alpaca. Они также начнут с модели HELM, которая, как надеются, сможет захватить больше генеративной информации. Исследователи также хотели бы изучить риски Alpaca и попытаются дальше улучшить его безопасность.