Tag: scikit learn

Как передать аргумент ключевого слова методу прогнозирования в конвейере sklearn

Я использую GaussianProcess внутри Pipeline . Метод predict метода GaussianProcess принимает аргументы ключевого слова его методу predict batch_size который я должен использовать для предотвращения заполнения моей памяти. Есть ли способ передать этот аргумент экземпляру GaussianProcess при вызове predict через сконфигурированный конвейер? Вот минимальный пример, адаптированный из документации sklearn, чтобы продемонстрировать, что я хочу: import numpy […]

Множественные критерии оценки во время поиска сетки в scikit-learn

В scikit-learn возможно ли как-то иметь несколько оценочных показателей в каждой точке сетки в поиске сетки с использованием структуры GridSearchCV? Например, если я хочу оценить модель как по кросс-энтропии, так и по точности, можно ли использовать GridSearchCV обе из них? Моя первая мысль заключалась в том, чтобы моя функция оценки (которая в любом случае обычна) […]

Нужно лучше понимать Python scikit-learn подходит для прогнозирования цикла или линейного результата

Вот мой кусок Python (2.7, [Я изучил Python 3, поэтому использую будущую print_function, чтобы получить форматирование печати, которое я использую для использования]), используя учебный код из scikit-learn из нескольких версий назад, оба из которых я ' м за счет корпоративной ИТ-политики. Он использует двигатель SVC. Я не понимаю, что результаты, которые я получаю для случая […]

укладка 3 переменных для kmeans scikit

У меня есть 3 переменные, которые я хочу вписать в модель kmeans. Одним из них является вектор TFIDF, один – вектор Count, а третий – количество слов в документе (предложение_list_len). Вот мой код: vectorizer=TfidfVectorizer(min_df=1, max_df=0.9, stop_words='english', decode_error='ignore') vectorized=vectorizer.fit_transform(sentence_list) count_vectorizer=CountVectorizer(min_df=1, max_df=0.9, stop_words='english', decode_error='ignore') count_vectorized=count_vectorizer.fit_transform(sentence_list) sentence_list_len # for each document, how many words are there km=KMeans(n_clusters=num_clusters, init='k-means++',n_init=10, […]

Можно ли использовать различные классификаторы в sklearn.ensemble?

Я изучал sklearn.ensemble, например, clf =AdaBoostClassifier(svm.LinearSVC(),n_estimators=10,max_samples=0.1,) Мой вопрос заключается в том, могу ли я использовать разные классификаторы как base_estimator , потому что base_estimator может принимать только один Object , если я хочу использовать LogisticRegression() для продолжения классификации экземпляров, которые не классифицируются LinearSVC() , что мне делать? Является ли это возможным?

Как точно сгенерировать меру сходства между линейными диаграммами с аналогичными функциями

Я пытаюсь сравнить одну линейную диаграмму с рядом других линейных диаграмм, и мне хотелось бы найти все диаграммы, похожие на позиции их значимых маркеров. Я уже пробовал несколько решений, которые связаны с корреляцией графиков, а затем получают дистанционную меру (стоимость полного сходства между двумя диаграммами). Итак, чем ниже мера, тем выше сходство. Другой вопрос SO […]

Как использовать GridSearchCV для нового оценщика? В этом случае ансамбль из трех классификаторов

Мой код следующий: import numpy as np from sklearn.neighbors import KNeighborsClassifier from sklearn.svm import SVC from sklearn.linear_model import SGDClassifier from sklearn.grid_search import GridSearchCV class Ensamble_lastre: def __init__(self, Csvm, Kn, alp): self.svm = SVC(C=Csvm,probability=True) self.neighbors = KNeighborsClassifier(n_neighbors=Kn) self.linear_model = SGDClassifier(alpha=alp,n_iter=15000, penalty='l2', loss='modified_huber') self.Csvm=Csvm self.Kn=Kn self.alp=alp def fit(self, X, y): self.svm.fit(X, y) self.neighbors.fit(X, y) self.linear_model.fit(X, y) def […]

Ошибка Pydot с графиком дерева решений sklearn

Я пытаюсь использовать следующий код из sklearn ( http://scikit-learn.org/stable/modules/tree.html ): from sklearn.externals.six import StringIO import pydot dot_data = StringIO() tree.export_graphviz(clf, out_file=dot_data) graph = pydot.graph_from_dot_data(dot_data.getvalue()) graph.write_pdf("iris.pdf") Я установил pydot==1.0.2 и когда я запускаю этот код с помощью ноутбука Ipython, он дает следующую ошибку. InvocationException Traceback (most recent call last) <ipython-input-22-18c25f6a061c> in <module>() 4 tree.export_graphviz(clf, out_file=dot_data) 5 […]

Как я могу привлечь решение? (TypeError: startswith в графе из данных точки, pydot)

Я новичок в работе с Scikit Learn, машинным обучением, с Python. Я пытался работать с деревом решений. Мне удалось выполнить всю очистку данных, анализ и так далее, пока я не попытался получить диаграмму дерева решений. Я работаю с Python 3.4 и pyplot2 . У меня есть функция, называемая decision_tree, которая создает модель, а затем вызывает […]

Масштабирование данных в RFECV с помощью scikit-learn

Общеизвестно масштабировать данные обучения и тестирования отдельно перед обучением и прогнозированием прогресса в задаче классификации. Я хочу внедрить вышеупомянутый процесс в RFECV который запускает тесты CV, поэтому я пробовал следующее: X_scaled = preprocessing.scale(X) сделайте X_scaled = preprocessing.scale(X) , где X – весь набор данных. Таким образом, данные обучения и тестирования не масштабируются отдельно, что не […]

Interesting Posts for Van-Lav

Заполните массив 1D numpy массивами с индексами

Как выполнить рекурсию в словаре python

Gmail, smtplib, Python. Получить самое старое, последнее сообщение электронной почты

Python: индексирование массива с использованием оператора двоеточия в произвольном измерении

Python не смог «импортировать nltk» в мой скрипт, но работает в интерпретаторе

Использование спрайтов в Pygame

Как создать интерактивное меню для приложения командной строки в python?

Есть ли библиотека python для редактирования файлов msword doc?

Точные проблемы при возврате операции нормализации

python: iif или (x? a: b)

Являются ли файлы Python 2.5 .pyc совместимыми с файлами Python 2.6 .pyc?

используя * args в struct.pack

Как удалить повторяющиеся элементы из списка, используя понимание списка?

Python Flask WTForms: Как я могу отключить поле динамически в представлении?

графический интерфейс wxPython с существующим процессом

Python - лучший язык программирования в мире.