Tag: машинное обучение

Текстовая классификация Pybrain: данные и ввод

У меня есть 3 набора предложений (в зависимости от количества слов), но я не знаю, как извлекать из него функции, так что размер ввода останется прежним. Например, я пробовал сумку слов, но, поскольку вариация слова-слова вызывает изменение размера ввода, я в конечном итоге получаю ошибки. Я был бы очень признателен, если бы вы могли показать […]

ValueError: недопустимое значение заполнения с помощью <class 'pandas.core.frame.DataFrame'>

Я тренируюсь по проблеме практики прогнозирования кредита и пытаюсь заполнить недостающие значения в моих данных. Я получил данные отсюда . Чтобы завершить эту проблему, я следую этому руководству . Вы можете найти весь код ( имя файла model.py ), который я использую, и данные здесь, на GitHub. DataFrame выглядит так: df[['Loan_ID', 'Self_Employed', 'Education', 'LoanAmount']].head(10) Out: […]

Tensorflow смешивает изображения и метки при создании партии

Поэтому я несколько недель задерживался на этой проблеме. Я хочу сделать партию изображений из списка имен файлов изображений. Я вставляю список имен файлов в очередь и использую считыватель для получения файла. Затем читатель возвращает имя файла и файл прочитанного изображения. Моя проблема заключается в том, что когда я делаю пакетную обработку с использованием декодированного jpg […]

Метод прогнозирования xgboost возвращает одно и то же прогнозируемое значение для всех строк

Я создал классификатор xgboost в Python: train – это рамка данных pandas со 100k строками и 50 функциями в качестве столбцов. Цель – серия панд xgb_classifier = xgb.XGBClassifier(nthread=-1, max_depth=3, silent=0, objective='reg:linear', n_estimators=100) xgb_classifier = xgb_classifier.fit(train, target) predictions = xgb_classifier.predict(test) Однако после обучения, когда я использую этот классификатор для прогнозирования значений, весь массив результатов равен одному […]

Получить доступ к поездам и ошибке оценки в xgboost

Я начал использовать python xgboost backage. Есть ли способ получить обучение и ошибки проверки в каждую учебную эпоху? Я не могу найти его в документации Обучили простой модели и получили выход: [09:17:37] src / tree / updater_prune.cc: 74: конец обрезки дерева, 1 корень, 124 дополнительных узла, 0 обрезанных узлов, max_depth = 6 [0] eval-rmse: 0.407474 […]

Строка графика Trendline не работает с bigdataset

У меня большой набор данных с 52166 точками данных и выглядит следующим образом: bc_conc 2010-04-09 10:00:00 609.542000 2010-04-09 11:00:00 663.500000 2010-04-09 12:00:00 524.661667 2010-04-09 13:00:00 228.706667 2010-04-09 14:00:00 279.721667 Это кадр данных pandas, а индекс – в datetime. Теперь мне нравится строить данные bc_conc по времени и добавлять линию тренда. Я использовал следующий код: data […]

Высокоразмерная структура данных в Python

Каков наилучший способ хранения и анализа высокоразмерной даты в python? Мне нравится Pandas DataFrame и Panel, где я могу легко манипулировать осью. Теперь у меня есть гиперкуб (dim> = 4) данных. Я думал о таких вещах, как dict of Panels, кортеж в качестве записей в панели. Интересно, есть ли в Python тускловатая панель. update 20/05/16: […]

Обучение wordvec в Tensorflow, импорт в Gensim

Я тренирую модель word2vec из учебника tensorflow. https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/tutorials/word2vec/word2vec_basic.py После обучения я получаю матрицу внедрения. Я хотел бы сохранить это и импортировать его как обучаемую модель в gensim. Чтобы загрузить модель в gensim, команда: model = Word2Vec.load_word2vec_format(fn, binary=True) Но как мне сгенерировать fn файл из Tensorflow? благодаря

Как получить имена объектов, выбранные путем исключения функций в конвейере sklearn?

Я использую рекурсивную функцию в моем конвейере sklearn, конвейер выглядит примерно так: from sklearn.pipeline import FeatureUnion, Pipeline from sklearn import feature_selection from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.svm import LinearSVC X = ['I am a sentence', 'an example'] Y = [1, 2] X_dev = ['another sentence'] # classifier LinearSVC1 = LinearSVC(tol=1e-4, C = 0.10000000000000001) f5 = […]

Как использовать вывод полной последовательности LSTM? tensorflow

Возможно, я ошибаюсь, но здесь. Я использую код в этом сообщении . В частности, код в outputs, states = rnn.rnn(lstm_cell, _X, initial_state=_istate) # Linear activation # Get inner loop last output return tf.matmul(outputs[-1], _weights['out']) + _biases['out'] В приведенном выше коде используется схема с множеством к одному. Я хотел бы знать, могу ли я использовать схему […]

Python - лучший язык программирования в мире.