Tag: scipy

Существует ли функция python (scipy) для определения параметров, необходимых для получения целевой мощности?

В R есть очень полезная функция, которая помогает с определением параметров для двухстороннего t-теста для получения целевой статистической мощности. Эта функция называется power.prop.test . http://stat.ethz.ch/R-manual/R-patched/library/stats/html/power.prop.test.html Вы можете вызвать его, используя: power.prop.test(p1 = .50, p2 = .75, power = .90) И он скажет вам размер выборки, необходимый для получения этой мощности. Это чрезвычайно полезно для сдерживания […]

Игнорирование значений -Inf в массивах с использованием numpy / scipy в Python

У меня есть массив NxM в numpy, который я хотел бы записать в журнал, и игнорировать записи, которые были отрицательными до начала регистрации. Когда я беру журнал отрицательных записей, он возвращает -Inf, поэтому в результате у меня будет матрица с некоторыми значениями -Inf. Затем я хочу суммировать столбцы этой матрицы, но игнорируя значения -Inf – […]

ndimage отсутствует из scipy

Я пытаюсь использовать библиотеку ndimage из scipy, но, по-видимому, отсутствует. Я провел тесты как с numpy, так и с scipy, и результаты были в порядке. Я использую numpy 1.6.1 и scipy 0.10.0, установленные из официальных пакетов на sourceforge. Бег import numpy import scipy import pprint print(scipy.version.version) print(numpy.version.version) img = scipy.ndimage.imread("") дает 0.10.0 1.6.1 Traceback (most […]

Получите матрицу U, Sigma, V * из усеченного SVD в scikit-learn

Я использую усеченный SVD из scikit-learn . В определении SVD исходная матрица A аппроксимируется как произведение A ≈ UΣV *, где U и V имеют ортонормированные столбцы, а Σ – неотрицательная диагональ. Мне нужно получить матрицы U , Σ и V * . Посмотрев исходный код, я узнал, что V * хранится в поле self.compoments_ […]

Как выполнить chi-squared goodness of fit test с использованием научных библиотек в Python?

Предположим, что у меня есть некоторые данные, которые я получил эмпирически: from scipy import stats size = 10000 x = 10 * stats.expon.rvs(size=size) + 0.2 * np.random.uniform(size=size) Он экспоненциально распределен (с некоторым шумом), и я хочу проверить это с помощью теста chi-squared goodness of fit (GoF). Каков самый простой способ сделать это с использованием стандартных […]

Установите среду «научный python»: OS X 10.7 + Numpy + Scipy + Matplotlib

Что я мог сделать вместо этого, чтобы эти элементы работали вместе? Должен ли я просто переместить все в Windows 7 (я бы предпочел не, но если это единственный надежный способ). Итак, вот что случилось: я хотел установить numpy / scipy на мой mac, который работает 10.7. К сожалению, numpy ver1.6 поддерживает только python 2.6. Я […]

Пакет статистики Python: разница между statsmodel и scipy.stats

Мне нужно несколько советов по выбору пакета статистики для Python, я сделал довольно некоторый поиск, но не уверен, что все правильно, в частности, о различиях между statsmodels и scipy.stats. Одна вещь, которую я знаю, это те, у кого есть пространство имен scikits, являются конкретными «ветвями» scipy, и то, что раньше было scikits.statsmodels, теперь называется statsmodels. […]

Как вычислить назначения кластеров из матриц привязки / расстояния в scipy в Python?

если у вас есть этот иерархический вызов кластеризации в scipy в Python: from scipy.cluster.hierarchy import linkage # dist_matrix is long form distance matrix linkage_matrix = linkage(squareform(dist_matrix), linkage_method) то какой эффективный способ перейти от этого к кластерным назначениям для отдельных точек? т.е. вектор длины N где N – число точек, где каждая запись i является номером […]

Случайное число из гистограммы

Предположим, что я создаю гистограмму с использованием scipy / numpy, поэтому у меня есть два массива: один для подсчета bin и один для краев bin. Если я использую гистограмму для представления функции распределения вероятности, как я могу эффективно генерировать случайные числа из этого распределения?

Эквивалент функции качества кластеров Matlab?

MATLAB имеет хорошую силуэтную функцию, чтобы помочь оценить количество кластеров для k-средних. Есть ли эквивалент для Pupon's Numpy / Scipy?

Python - лучший язык программирования в мире.