Tag: машинное обучение

машинное обучение – использование последних 20 строк в качестве входных данных для X для каждого значения Y

У меня очень простой код для машинного обучения здесь: # load dataset dataframe = pandas.read_csv("USDJPY,5.csv", header=None) dataset = dataframe.values X = dataset[:,0:59] Y = dataset[:,59] #fit Dense Keras model model.fit(X, Y, validation_data=(x,y_test), epochs=150, batch_size=10) Мои значения X – это 59 функций, причем 60-й столбец является моим значением Y, простой классификационной меткой 1 или 0. Учитывая, […]

Элементарные ограничения в scipy.optimize.minimize

Я использую scipy.optimize.minimize scipy.optimize.minimize, чтобы найти матрицу параметров для категориального распределения. Мне нужно наложить ограничение на то, что каждый параметр больше нуля, а сумма строк матрицы параметров – это столбец из них. Мне непонятно, как реализовать это в scipy.minimize , потому что ограничения проверяются на не-отрицательность, а не на правду. Минимизация вызывает исключение, если я […]

Как использовать SVM scikit-learn с гистограммами в качестве функций?

Я хочу использовать SVM scikit-learn с ядром chi-squared, как показано здесь . В этом случае ядро ​​находится на гистограммах, и это то, что представлены моими данными. Тем не менее, я не могу найти пример того, как они используются с гистограммами. Каков правильный способ сделать это? Правильный ли подход просто рассматривать гистограмму как вектор, где каждый […]

использование матрицы замешательства в качестве показателя оценки в перекрестной проверке в scikit learn

Я создаю конвейер в scikit learn, pipeline = Pipeline([ ('bow', CountVectorizer()), ('classifier', BernoulliNB()), ]) и вычисление точности с использованием перекрестной проверки scores = cross_val_score(pipeline, # steps to convert raw messages into models train_set, # training data label_train, # training labels cv=5, # split data randomly into 10 parts: 9 for training, 1 for scoring scoring='accuracy', […]

Не понимаю этот блок кода Python. Умножение булева с поплавком?

Я не понимаю строку q.append(p[i] * (hit * pHit + (1-hit) * pMiss)) , потому что переменная hit является логическим значением. Это логическое значение происходит от hit = (Z == world[i]) Что там происходит? У меня есть только базовое понимание Python … Все еще изучая его конструкции. p=[0.2, 0.2, 0.2, 0.2, 0.2] world=['green', 'red', 'red', […]

Tensorflow embedding_lookup

Я пытаюсь изучить слово-представление набора данных imdb «с нуля» через tf.nn.embedding_lookup() . Если я правильно ее понимаю, я должен установить слой внедрения перед другим скрытым слоем, а затем, когда я выполню градиентный спуск, слой будет «изучать» представление слов в весах этого слоя. Однако, когда я пытаюсь это сделать, я получаю ошибку формы между моим уровнем […]

TfidfVectorizer в sklearn, как конкретно ВКЛЮЧИТЬ слова

У меня есть некоторые вопросы о TfidfVectorizer . Мне непонятно, как выбираются слова. Мы можем дать минимальную поддержку, но после этого, что будет решать, какие функции будут выбраны (например, более высокая поддержка дает больше шансов)? Если мы скажем max_features = 10000 , мы всегда получаем то же самое? Если мы скажем max_features = 12000 , […]

Как подсчитать сетку сетки от GridSearchCV?

Я ищу способ построения grid_scores_ из GridSearchCV в sklearn. В этом примере я пытаюсь выполнить поиск наилучших параметров гамма и С для алгоритма SVR. Мой код выглядит следующим образом: C_range = 10.0 ** np.arange(-4, 4) gamma_range = 10.0 ** np.arange(-4, 4) param_grid = dict(gamma=gamma_range.tolist(), C=C_range.tolist()) grid = GridSearchCV(SVR(kernel='rbf', gamma=0.1),param_grid, cv=5) grid.fit(X_train,y_train) print(grid.grid_scores_) После того, как […]

Как пересечь дерево из sklearn AgglomerativeClustering?

У меня есть массив текстовых файлов numpy по адресу: https://github.com/alvations/anythingyouw//blob/master/WN_food.matrix Это матрица расстояний между терминами и друг другом, мой список терминов таков: http://pastebin.com/2xGt7Xjh Я использовал следующий код для создания иерархического кластера: import numpy as np from sklearn.cluster import AgglomerativeClustering matrix = np.loadtxt('WN_food.matrix') n_clusters = 518 model = AgglomerativeClustering(n_clusters=n_clusters, linkage="average", affinity="cosine") model.fit(matrix) Чтобы получить кластеры для […]

Сокращение циклической размерности?

Я хочу уменьшить размерность, чтобы возвращаемые размеры были круговыми. ex) Если я уменьшу 12d данных до 2d, нормированных между 0 и 1, тогда я хочу (0,0) быть как можно ближе к (.1, .1) как (.9, .9). Каков мой алгоритм? (бонусные баллы за реализацию python) PCA дает мне 2d-плоскость данных, тогда как я хочу сферическую поверхность […]

Python - лучший язык программирования в мире.