Tag: машинное обучение

ошибка в вычислении сходства текста с использованием scikit learn

Я новичок в модели векторного пространства (VSM). И я попробовал код с этого сайта . Это очень хорошая интродукция для VSM, но мне как-то удалось получить разные результаты от автора. Возможно, из-за какой-то проблемы совместимости, поскольку изучение scikit, похоже, сильно изменилось с момента написания введения. Возможно, я тоже неправильно понял это объяснение. Я использовал код […]

Низкая производительность SVM по сравнению с Random Forest

Я использую библиотеку scikit-learn для python для проблемы классификации. Я использовал RandomForestClassifier и SVM (класс SVC). Однако, в то время как ВЧ достигает около 66% точности и 68% напоминают, SVM получает только до 45%. Я выполнил GridSearch для параметров C и gamma для rbf-SVM, а также рассмотрел масштабирование и нормализацию заранее. Однако я думаю, что […]

MemoryError работы Randomforest в scikit-learn

Я следую примеру Python приведенному в разделе For Beginners – Bag of Words . Однако следующий сегмент кода дает сообщение об ошибке, например MemoryError . Что может вызвать эту ошибку forest = forest.fit(train_data_features, train["sentiment"]) Traceback (most recent call last): File "C:/Users/PycharmProjects/Project3/demo4.py", line 60, in <module> forest = forest.fit(train_data_features, train["sentiment"]) File "C:\Users\AppData\Roaming\Python\Python27\site- packages\sklearn\ensemble\forest.py", line 195, in […]

ошибка с sklearn CalibratedClassifierCV и SVM

Я хочу использовать CalibratedClassifierCV от sklearn в сочетании с SVC sklearn, чтобы сделать прогнозы для проблемы с предсказанием многоклассов (9 классов). Однако, когда я запускаю его, я получаю следующую ошибку. Этот же код не будет работать с другой моделью (например, RandomForestCalssifier). kf = StratifiedShuffleSplit(y, n_iter=1, test_size=0.2) clf = svm.SVC(C=1,probability=True) sig_clf = CalibratedClassifierCV(clf, method="isotonic", cv=kf) sig_clf.fit(X, […]

как запустить скрытые марковские модели в Python с hmmlearn?

Я попытался использовать hmmlearn из GitHub для запуска двоичной скрытой марковской модели. Это не работает: import hmmlearn.hmm as hmm transmat = np.array([[0.7, 0.3], [0.3, 0.7]]) emitmat = np.array([[0.9, 0.1], [0.2, 0.8]]) obs = np.array([0, 0, 1, 0, 0]) startprob = np.array([0.5, 0.5]) h = hmm.MultinomialHMM(n_components=2, startprob=startprob, transmat=transmat) h.emissionprob_ = emitmat # fails h.fit([0, 0, 1, […]

Запустить модель в обратном направлении в Keras

В настоящее время я играю с каркасом Keras. И сделали некоторые простые тесты классификации и т. Д. Я бы хотел найти способ запустить сеть в обратном порядке, используя выходы в качестве входных данных и наоборот. Любой способ сделать это?

xgboost: AttributeError: объект 'DMatrix' не имеет атрибута 'handle'

Проблема действительно странная, потому что эта часть работала очень хорошо с другим набором данных. Полный код: import numpy as np import pandas as pd import xgboost as xgb from sklearn.cross_validation import train_test_split # # Split the Learning Set X_fit, X_eval, y_fit, y_eval= train_test_split( train, target, test_size=0.2, random_state=1 ) clf = xgb.XGBClassifier(missing=np.nan, max_depth=6, n_estimators=5, learning_rate=0.15, subsample=1, […]

Выберите 5 точек данных, ближайших к гиперплану SVM

Я написал код Python, используя Sklearn для кластеризации моего набора данных: af = AffinityPropagation().fit(X) cluster_centers_indices = af.cluster_centers_indices_ labels = af.labels_ n_clusters_= len(cluster_centers_indices) Я изучаю использование запросов по кластеризации и, таким образом, формирую набор исходных обучающих данных: td_title =[] td_abstract = [] td_y= [] for each in centers: td_title.append(title[each]) td_abstract.append(abstract[each]) td_y.append(y[each]) Затем я тренирую свою модель […]

keras flow_from_directory over или undersample класс

Я пытаюсь выполнить двоичную классификационную проблему с Keras, используя метод ImageDataGenerator.flow_from_directory для создания пакетов. Тем не менее, мои классы очень несбалансированы, например, около 8x или 9x больше в одном классе, чем другие, заставляя модель застревать, предсказывая один и тот же класс вывода для каждого примера. Есть ли способ установить flow_from_directory либо flow_from_directory из моего небольшого […]

вычисление тестовых данных в учебнике tensorflow

Я проходил учебник по тензорному потоку https://www.tensorflow.org/versions/r0.9/tutorials/mnist/beginners/index.html import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data_sets("MNIST_data/", one_hot=True) x = tf.placeholder(tf.float32, [None, 784]) W = tf.Variable(tf.zeros([784, 10])) #weights b = tf.Variable(tf.zeros([10])) #bias y = tf.nn.softmax(tf.matmul(x, W) + b) y_ = tf.placeholder(tf.float32, [None, 10]) cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y), reduction_indices=[1])) train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy) init = […]

Python - лучший язык программирования в мире.