Tag: scikit learn

Каков надлежащий способ выполнения анализа скрытого класса в Python?

Я хотел бы моделировать набор данных с использованием анализа скрытого класса (LCA) с использованием Python. Я нашел класс Factor Analysis в sklearn, но я не уверен, что этот класс эквивалентен LCA. Существует ли в Python пакет или класс для LCA?

Как определить Python, где установлен Atlas

В настоящее время я нахожусь в установке scikit-learn для Python на компьютере без корневого доступа. Использование Python 2.7 на Fedora 14. pip не установлен, поэтому я использую easy_install: easy_install –prefix=$HOME/.local -U scikit-learn Процесс установки жалуется на то, что BLAS не устанавливается. Я пытался установить scipy в прошлом и имел проблемы с поиском и установкой Atlas […]

Scikit-learn: роль весов в регрессии Риджа

Я использую библиотеку scikit-learn для выполнения Ridge Regression с весами на отдельных образцах. Это можно сделать: esimator.fit(X, y, sample_weight=some_array) . Интуитивно я ожидаю, что более крупные веса означают большую значимость для соответствующего образца. Тем не менее, я протестировал метод выше в следующем двухмерном примере: from sklearn import linear_model import numpy import matplotlib.pyplot as plt #Data […]

Является ли обработка целочисленного индекса DataFrame и результирующей матрицы SciPy одной и той же плохой идеей?

У меня есть конвейер, который использует pandas DataFrame, df , с несколькими текстовыми столбцами, объединяет их в документ и векторизовывает документ, в результате чего получается scipy.sparse.csr_matrix , назовем его X Позже я выполняю запросы ближайшего соседа, используя строки X (которые соответствуют строкам моего исходного DataFrame), и когда я хочу, скажем, отобразить текстовое имя ближайших соседей […]

Канонический корреляционный анализ в Python с помощью sklearn

Я пытаюсь использовать sklearn для выполнения канонического корреляционного анализа (CCA). Я начинаю с простого примера, который включен в руководство : from sklearn.cross_decomposition import CCA X = [[0., 0., 1.], [1.,0.,0.], [2.,2.,2.], [3.,5.,4.]] Y = [[0.1, -0.2], [0.9, 1.1], [6.2, 5.9], [11.9, 12.3]] cca = CCA(n_components=1) cca.fit(X, Y) X_c, Y_c = cca.transform(X, Y) Я понимаю, что […]

Неопределенные символы в Scipy и Scikit – узнайте о RedHat

Я пытаюсь установить Scikit-Learn на 64-разрядном сервере Red Hat Enterprise 6.6, на котором у меня нет привилегий root. Я сделал новую установку Python 2.7.9, Numpy 1.9.2, Scipy 0.15.1 и Scikit-Learn 0.16.1. Установка Atlas BLAS на сервере – 3.8.4. Я могу установить scikit-learn, но когда я пытаюсь импортировать его в Python, я получаю File "<pyinstall>/site-packages/scipy/parse/linalg/isolve/_iterative.so: undefined […]

особенности значимости результаты отличаются R и Sklearn случайной лесной регрессии

Я работаю над проблемой регрессии и использую как пакет R randomForest , так и оценку случайной лесной регрессии pleon sklearn . Пакет R может вычислять оценку важности функции двумя различными способами: Первая мера вычисляется из перестановки данных OOB: для каждого дерева регистрируется ошибка прогнозирования на внеочередной части данных (коэффициент ошибок для классификации, MSE для регрессии). […]

Ошибка в GridsearchCV sklearn

Я пытаюсь настроить классификатор GB в sklearn с помощью GridsearchCV. Вот код: from sklearn.grid_search import GridSearchCV from sklearn.ensemble import GradientBoostingClassifier param_grid = {'learning_rate': [0.1, 0.01, 0.001], 'max_depth': [4, 6], 'min_samples_leaf': [9, 17], 'max_features': [0.3, 0.1]} est = GradientBoostingClassifier(n_estimators=3000) # this may take some minutes gs_cv = GridSearchCV(est, param_grid, scoring='f1', n_jobs=-1, verbose=1, pre_dispatch=5).fit(X.values, y) # best […]

Scikit-learn SVM-классификатор умирает с ошибкой «Killed: 9»

Я пытаюсь подготовить классификатор, и моя дата обучения составляет около 870 000 записей, и скрипт python всегда убивается через некоторое время, вызывая в classifier.fit (X, Y). Я не вижу ничего в консоли, кроме сообщения «Killed: 9». Я запускаю это на своем macbook pro с 16 ГБ памяти, а данные для обучения довольно малы 90 МБ. […]

Оптимизация точности для OneClassSVM

У меня есть проблема, которая требует использования системы классификации одного класса. В настоящее время я использую python для разработки, и в результате я использую sci-kit для изучения задач машинного обучения. Из их документации OneClassSVM должен работать, как можно было бы ожидать (поставлять положительные примеры только для обучения), но результирующая модель дает мне очень неточные результаты […]

Python - лучший язык программирования в мире.