Tag: svm

разница между параметрами штрафа и потери в библиотеке LinleSVC Sklearn

Я не очень хорошо разбираюсь в теории SVM, и я использую этот класс LinearSVC в python: http://scikit-learn.org/stable/modules/generated/sklearn.svm.LinearSVC.html#sklearn.svm.LinearSVC Мне было интересно, в чем разница между параметрами штрафа и потери?

TypeError: __init __ () получил неожиданный аргумент ключевого слова 'scoring'

Как это возможно, этот демонстрационный код (взятый отсюда: http://scikit-learn.org/dev/auto_examples/grid_search_digits.html ) TypeError: __init__() got an unexpected keyword argument 'scoring' когда obviuodly scoring является параметром ( http://scikit-learn.org/dev/modules/generated/sklearn.grid_search.GridSearchCV.html#sklearn.grid_search.GridSearchCV ) ? from __future__ import print_function from sklearn import datasets from sklearn.cross_validation import train_test_split from sklearn.grid_search import GridSearchCV from sklearn.metrics import classification_report from sklearn.svm import SVC print(__doc__) # Loading the […]

Классификатор SVL NLTK завершается

Я использую классификатор SVM, встроенный в NLTK, и после обучения модели, когда я пытаюсь классифицировать документ, программа завершается Error during execution, QProcess error: 1 Execution Interrupted Я использую следующий код: classifier = nltk.classify.svm.SvmClassifier.train(train_features) for test_record in test_data_list: features = extract_features(test_record) predict = classifier.classify(features) print predict Что может быть причиной ошибки?

Большие данные по обучению и тестированию в libsvm

Я использую Libsvm в перекрестной проверке 5×2, чтобы классифицировать очень большой объем данных, то есть у меня есть образцы в 47 тыс. Для обучения и образцы 47 тыс. Для тестирования в 10 различных конфигурациях. Обычно я использую скрипт Libsvm easy.py для классификации данных, но это занимает очень много времени, я ждал результатов более 3 часов […]

Текстовая обработка с использованием SVM-классификатора

Я хочу применить классификацию SVM для целей текстового поиска, используя python nltk, и получить точность, вспомнить точность различных данных измерений. Для этого я предварительно обрабатываю набор данных и разбиваю свой набор данных на два текстовых файла, а именно: pos_file.txt (положительная метка) и neg_file .txt (отрицательная метка). И теперь я хочу применить классификатор SVM со случайной […]

Плохая ошибка формы ввода при обучении SVM с использованием scikit

Я мало нового для scikit и ML. Я пытаюсь подготовить классификатор SVM для одной и всей классификации. Я использую следующий код. g=list() for i in range(0,120): g.append(1) for i in range(120,240): g.append(2) u=set(g) numclasses=len(u) lin_clf = svm.LinearSVC() lin_clf.fit(features,u) Особенности: массив 72900 * 120. Я получаю функции от другого кода на Python и называя это здесь. […]

Как создать настраиваемый генератор перекрестной проверки в scikit-learn?

У меня есть несбалансированный набор данных, поэтому у меня есть стратегия передискретизации, которую я применяю только во время обучения моих данных. Я бы хотел использовать классы scikit – узнайте, как GridSearchCV или cross_val_score чтобы исследовать или перекрестно проверять некоторые параметры на моей оценке (например, SVC). Тем не менее, я вижу, что вы либо передаете количество […]

Почему метод classifier.predict () ожидает, что количество функций в тестовых данных будет таким же, как и в данных обучения?

Я пытаюсь создать простой классификатор документов SVM, используя scikit-learn, и я использую следующий код: import os import numpy as np import scipy.sparse as sp from sklearn.metrics import accuracy_score from sklearn import svm from sklearn.metrics import classification_report from sklearn.feature_extraction.text import CountVectorizer from sklearn.feature_extraction.text import TfidfTransformer from sklearn.feature_extraction.text import TfidfVectorizer from sklearn import cross_validation from sklearn.datasets import […]

Встроенная функция для мешков визуальных кодировок слов в python

В matlab меня есть эта функция function psi = encodeImage(encoder, im) Эта функция принимает im который является списком имен изображений encoder который является bovw.mat меня есть этот файл как кодировщик Эта функция выполняет мешок визуальных слов, кодирующих и возвращающих пространственные гистограммы изображений. Я использую эти гистограммы для обучения в классификаторе SVM. Я выполняю эту задачу […]

grid.py не дает выход

Я использую LibSVM и я использовал GRID.py для SVM . Но проблема в том, что я запустил ее grid.py больше часа, но это не дает никакого выхода. Сообщение об ошибке, которое оно дает, следующее %%%%%%%%%%%%%%%%%%%%%%% Traceback (most recent call last): File "grid.py", line 266, in run if rate is None: raise RuntimeError('get no rate') RuntimeError: […]

Python - лучший язык программирования в мире.