Tag: scipy

Как рассчитать показатель силуэты fcluster scipy, используя scikit-learn score score score?

Я использую scipy.cluster.hierarchy.linkage как алгоритм кластеризации и передаю матрицу связей результатов в scipy.cluster.hierarchy.fcluster , чтобы получить сплющенные кластеры для разных пороговых значений. Я хотел бы рассчитать показатель эффективности Silhouette и сравнить их, чтобы выбрать лучший порог, и предпочитаю не реализовывать его самостоятельно, а использовать scleit-learn sklearn.metrics.silhouette_score . Как я могу изменить результаты кластеризации в качестве […]

Невозможно загрузить набор данных Iris с помощью sklearn

Я пытаюсь импортировать данные IRIS, установленные в python 2.7, но получая ряд ошибок. Не могу понять, что именно мне не хватает. from sklearn.datasets import load_iris data = load_iris() Это дает мне ошибку ниже: Traceback (most recent call last): File "E:/Python_Projects/Machine learning/Iris_data(improved).py", line 5, in <module> from sklearn.datasets import load_iris File "C:\Python27\lib\site-packages\sklearn\datasets\__init__.py", line 7, in <module> […]

Параболоид (3D парабола)

Я пытаюсь установить эти данные x: [0,4,0.165,0.165,0.585,0.585], данные y: [.45, .22, .63, .22, .63] и данные z: [1, 0,99, 0,98,0,97,0,96] к параболоиду. Я использую инструмент curve_fit от scipy. Вот мой код: doex = [0.4,0.165,0.165,0.585,0.585] doey = [.45, .22, .63, .22, .63] doez = np.array([1, .99, .98,.97,.96]) def paraBolEqn(data,a,b,c,d): if b < .16 or b > […]

Символ “ “ `не допускается в именах объектов

Я работаю со структурой внутри файла HDF5, в котором есть имена с '/'. Когда я загружаю указанный файл, я получаю это предупреждение: ⓔ develop  In [1]  import pandas as pd ⓔ develop  In [2]  store = pd.HDFStore('data/XXX-20150423-071618.h5') ⓔ develop  In [3]  store /home/XXX/virt/env/develop/lib/python2.7/site-packages/tables/group. py:1156: UserWarning: problems loading leaf “/log“:: […]

Как создать диагональную разреженную матрицу в SciPy

Я пытаюсь создать разреженную матрицу, которая имеет двумерный рисунок, который проходит по диагонали. Это, вероятно, проще всего объяснить с помощью быстрого примера. Скажем, моя модель: [1,0,2,0,1] … Я хочу создать разреженную матрицу: [[2,0,1,0,0,0,0…0], [0,2,0,1,0,0,0…0], [1,0,2,0,1,0,0…0], [0,1,0,2,0,1,0…0], [0,0,1,0,2,0,1…0], […]] Scipy.sparse.dia_matrix кажется хорошим кандидатом, однако я просто не могу понять, как выполнить то, что я хочу, из […]

Ошибка выполнения griddata – Python / SciPy (Интерполяция)

Я использую функцию griddate для scipy для интерполяции. Что означает следующее сообщение об ошибке, которое появляется, когда python выполняет функцию griddata? File "C:\Python25\lib\site-packages\scipy\interpolate\ndgriddata.py", line 182, in griddata ip = LinearNDInterpolator(points, values, fill_value=fill_value) File "interpnd.pyx", line 192, in interpnd.LinearNDInterpolator.__init__ (scipy\interpolate\interpnd.c:2524) File "qhull.pyx", line 917, in scipy.spatial.qhull.Delaunay.__init__ (scipy\spatial\qhull.c:4030) File "qhull.pyx", line 170, in scipy.spatial.qhull._construct_delaunay (scipy\spatial\qhull.c:1269) RuntimeError: Qhull […]

Различные результаты интеграции с использованием метода Монте-Карло против scipy.integrate.nquad

Нижеуказанный MWE показывает два способа интеграции одной и той же оценки плотности ядра 2D, полученной для этих данных, с использованием функции stats.gaussian_kde() . Интеграция выполняется для всех (x, y) ниже пороговой точки (x1, y1) , которая определяет верхние пределы интегрирования (нижние пределы интегрирования – -infinity , см. MWE). Функция int1 использует простой подход Монте-Карло. Функция […]

База данных или табличное решение для временных массивов Numpy

Я создаю настольное приложение Python, которое позволяет пользователям выбирать различные формы распространения для моделирования данных о урожае сельскохозяйственных культур. У меня есть временные ряды сельскохозяйственных данных – около миллиона строк – сохранены в базе данных SQLite (хотя это не установлено в камне, если кто-то знает о лучшем выборе). Как только пользователь выберет некоторые данные, скажем, […]

Python Numpy или Pandas Linear Interpolation для значений, связанных с датой

У меня есть данные, которые выглядят следующим образом, но я также контролирую, как он отформатирован. В принципе, я хочу использовать Python с Numpy или Pandas для интерполяции набора данных для достижения второго по времени интерполированных данных, чтобы он был намного более высоким разрешением. Поэтому я хочу линейно интерполировать и создавать новые значения между каждым из […]

Matplotlib – Быстрый способ создания множества подзаголовков?

Я использую matplotlib для создания фигуры со множеством небольших подсетей (что-то вроде 4 строк, 8 столбцов). Я пробовал несколько разных способов, и самое быстрое, что я могу получить matplotlib для создания осей, составляет ~ 2 секунды. Я видел это сообщение о том, что просто использовал один объект оси, чтобы отображать много маленьких изображений, но я […]

Python - лучший язык программирования в мире.