Tag: svm

Низкая производительность SVM по сравнению с Random Forest

Я использую библиотеку scikit-learn для python для проблемы классификации. Я использовал RandomForestClassifier и SVM (класс SVC). Однако, в то время как ВЧ достигает около 66% точности и 68% напоминают, SVM получает только до 45%. Я выполнил GridSearch для параметров C и gamma для rbf-SVM, а также рассмотрел масштабирование и нормализацию заранее. Однако я думаю, что […]

sckit-learn fit () приводит к ошибке после нормализации данных

Я пытался это сделать: Создание объектов X и y, зависящих от набора данных Разделить набор данных Нормализовать данные Поезд с использованием SVR из Scikit-learn Вот код с использованием кадра данных pandas, заполненного случайными значениями import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(20,5), columns=["A","B","C","D", "E"]) a = list(df.columns.values) a.remove("A") X = df[a] y […]

Ошибка Python в SVM classifier.predict ()

Я получаю следующую ошибку, когда выполняю классификацию новых данных со следующей командой в Python: classifier.predict(new_data) AttributeError: объект python 'SVC' не имеет атрибута _dual_coef_ В моем ноутбуке, хотя, команда работает отлично! Что не так?

ошибка с sklearn CalibratedClassifierCV и SVM

Я хочу использовать CalibratedClassifierCV от sklearn в сочетании с SVC sklearn, чтобы сделать прогнозы для проблемы с предсказанием многоклассов (9 классов). Однако, когда я запускаю его, я получаю следующую ошибку. Этот же код не будет работать с другой моделью (например, RandomForestCalssifier). kf = StratifiedShuffleSplit(y, n_iter=1, test_size=0.2) clf = svm.SVC(C=1,probability=True) sig_clf = CalibratedClassifierCV(clf, method="isotonic", cv=kf) sig_clf.fit(X, […]

Выберите 5 точек данных, ближайших к гиперплану SVM

Я написал код Python, используя Sklearn для кластеризации моего набора данных: af = AffinityPropagation().fit(X) cluster_centers_indices = af.cluster_centers_indices_ labels = af.labels_ n_clusters_= len(cluster_centers_indices) Я изучаю использование запросов по кластеризации и, таким образом, формирую набор исходных обучающих данных: td_title =[] td_abstract = [] td_y= [] for each in centers: td_title.append(title[each]) td_abstract.append(abstract[each]) td_y.append(y[each]) Затем я тренирую свою модель […]

Какое решение_function_shape для sklearn.svm.SVC при использовании OneVsRestClassifier?

Я делаю классификацию с несколькими метками, где я пытаюсь предсказать правильные теги на вопросы: (X = вопросы, y = список тегов для каждого вопроса из X). Мне интересно, какое sklearn.svm.SVC для sklearn.svm.SVC следует использовать с OneVsRestClassifier ? Из документов мы можем прочитать, что 'ovr' могут быть два значения: 'ovo' и 'ovr' : decision_function_shape : 'ovo', […]

scikit-learn preprocessing SVM с несколькими классами в конвейере

В литературе по машинному обучению настоятельно предлагается нормализовать данные для SVM ( предварительная обработка данных в scikit-learn ). И как уже было сказано , такой же стандартScalar следует применять как к учебным, так и к тестовым данным. В чем преимущества использования StandardScalar над вычетом среднего значения среднего значения и деления на стандартное отклонение (кроме возможности […]

scikit поддерживает масштабирование функций между или

SVM scikit-learn основан на LIBSVM. LIBSVM / SVM требует, чтобы данные были масштабированы, и рекомендация заключается в том, что значение функции должно быть в одном из двух диапазонов [0, 1] или [-1, 1]. То есть в типичной матрице каждый столбец является признаком, а масштабирование выполняется для каждого столбца. FAQ LIBSVM предлагает простое масштабирование для получения […]

Строковое подследующее ядро ​​и SVM с использованием Python

Как я могу использовать Subsequence String Kernel (SSK) [Lodhi 2002] для обучения SVM (поддержка векторной машины) в Python?

ValueError при использовании линейного SVM scikit-learn python

В настоящее время я работаю над крупномасштабной иерархической классификацией текстов документов ODP. Набор данных, предоставленный мне, находится в формате libSVM. Я пытаюсь запустить линейное ядро ​​SVM picon scikit-learn для разработки модели. Ниже приведены образцы данных из учебных образцов: 29 9454:1 11742:1 18884:14 26840:1 35147:1 52782:1 72083:1 73244:1 78945:1 79913:1 79986:1 86710:3 117286:1 139820:1 142458:1 146315:1 […]

Python - лучший язык программирования в мире.