scikit-learn, добавлять функции к векторизованному набору документов

Я начинаю с scikit-learn, и я пытаюсь преобразовать набор документов в формат, на котором я могу применить кластеризацию и классификацию. Я видел подробности о методах векторизации и преобразования tfidf для загрузки файлов и индексации их словарей.

Однако у меня есть дополнительные метаданные для каждого документа, такие как авторы, раздел, который был ответственным, список тем и т. Д.

Как добавить функции к каждому вектору документа, сгенерированному функцией векторизации?

Interesting Posts

c ++ 11 regex медленнее, чем python

Как обновить значения с помощью pymongo?

Python: получить указатель на элемент списка

Как создать пустой массив / матрицу в NumPy?

python – сдерживается условными обозначениями pandas и / или булевым индексированием

Поворот Typeerror не может быть вызван. Я пытаюсь понять, почему мой оператор elif не может быть вызван

Можно ли сразу назначить одно и то же значение нескольким клавишам в объекте dict?

Как заставить bokeh пропускать отсутствующие даты при использовании datetime как оси x

Эффективный продукт 1D массива и трехмерного массива по одному измерению – NumPy

Разделы аннотации из pdf

DRF: Простое назначение внешнего ключа с вложенными сериализаторами?

Добавьте цикл, пока пользователь не введет правильный ответ?

Запустить полностью независимый процесс

Я не могу получить весь исходный код HTML-страницы

Сортировка связанных элементов в шаблоне Django

Python - лучший язык программирования в мире.