X и y имеют несовместимые формы

Я пытался подобрать классификатор на 1-мерном вектор-функции из учебных примеров 1997 года с образцом того же размера, что и мои y:

clf = svm.SVC() j = 0 a = 0 listX = [] listY = [] while a <= 1996: ath_X = "".join(linesplit[a]) listX = listX + [int(ath_X)] a+=1 while j <= 1996: jth_Y = "".join(linesplit1[j]) listY = listY + [((int(jth_Y))-1)] j+=1 X = np.array(listX) y = np.array(listY) print("%s %s %s %s" % ('Dimension of X: ', len(X), 'Dimension of y: ', len(y))) print("%s %s" % (X.shape[0], y.shape[0])) print(X[1996]) print(y[1996]) clf.fit(X, y) ficheiro1.close() ficheiro.close() print("We're done") 

—> Это то, что распечатывается:

Размер X: 1997 Размер y: 1997

1997 год 1997 год

987654321

0

Traceback (последний последний вызов):

Файл «C: /Python27/qqer.py», строка 52, в clf.fit (X, y)

Файл «C: \ Python27 \ lib \ site-packages \ sklearn \ svm \ base.py», строка 166, в подгонке (X.shape [0], y.shape [0]))

ValueError: X и y имеют несовместимые формы.

X имеет 1 образец, но у 1997 года.

—> Если я распечатаю те же формы для X и y, почему я должен получить такую ​​ошибку? Есть идеи, ребята?

  • Как добавить еще одну функцию (длину текста) в текущий пакет классификации слов? Scikit учиться
  • Python scikit-learn KMeans убивается (9) при вычислении оценки силуэта
  • Неожиданные оценки перекрестной проверки с помощью scikit-learn LinearRegression
  • Инкрементный PCA на большие данные
  • Sklearn - Невозможно использовать закодированные данные в классификаторе случайных лесов
  • склеарная агломерационная кластерная матрица связывания
  • В sklearn.decomposition.PCA, почему компоненты являются отрицательными?
  • Scikit Learn Multilabel Classification: ValueError: вы, кажется, используете устаревшее представление данных с несколькими метками
  • One Solution collect form web for “X и y имеют несовместимые формы”

    Форма X должна быть (n_samples, n_features) как описано в SVC.fit docstring. 1-й массив интерпретируется как один образец (для удобства при выполнении предсказаний для отдельных выборок). Измените свой X на (n_samples, 1) .

    Python - лучший язык программирования в мире.