Распознавание сущностей с LLM полная оценка

LLM Entity Recognition Full Evaluation

Языковые модели с большим объемом данных (LLMs) способны выполнять широкий спектр задач NLP, таких как распознавание именованных сущностей. В этом исследовании я протестировал open-source библиотеку, способную вызывать несколько коммерческих и open-source моделей. Итоговые результаты разнообразны…

Фото Александра Грея на Unsplash

Благодаря своему размеру, большие языковые модели (LLMs) приобрели значительные навыки обработки языка. Даже без использования примеров они способны выполнять операции обработки языка, такие как классификация, анализ тональности, извлечение концептов, распознавание именованных сущностей, перевод и другие.

SpaCy – это библиотека обработки языка, написанная на Python и Cython, которая существует с 2016 года. Большая часть обработки – это комбинация глубокого обучения, технологий Transformers (начиная с версии 3.0) и статистического анализа. Открытый подход Explosion позволяет пользователям обучать свои собственные модели и настраивать их поведение в соответствии с потребностями. Во всех случаях мы оцениваем производительность и скорость обработки этой библиотеки, которая является одним из лидеров в своей области. Более того, они предоставляют ряд предварительно обученных шаблонов, которые позволяют быстро выполнять задачи на нескольких языках.

Введенный в мае 2023 года модуль spacy-llm устраняет разрыв между этими двумя подходами, предлагая преимущества структурированного вывода как “до” и новую мощь этих новых моделей. Как обычно, эта библиотека позволяет быстро инициировать обработку на основе генеративных подходов.

Задача распознавания именованных сущностей с помощью Spacy-LLM

Spacy-LLM предоставляет ряд задач NLP “из коробки”, таких как распознавание именованных сущностей, классификация текста, лемматизация, извлечение связей, анализ тональности, категоризация спана и резюмирование. В этой статье мы сосредоточимся на первой из них: распознавание именованных сущностей.

Пример распознавания сущностей (источник: Explosion)

Мне все еще нужно объяснить, как извлекаются именованные сущности? Если да, приглашаю вас ознакомиться с моей статьей о распознавании именованных сущностей с использованием LLMs, которая является хорошим введением в использование NER и…