Tag: scipy

Эффективный поиск ближайшего соседа для разреженных матриц

У меня есть большой массив данных (текст), которые я преобразовал в разреженную матрицу term-document (я использую scipy.sparse.csr.csr_matrix для хранения разреженной матрицы). Я хочу найти для каждого документа лучшие совпадения ближайших соседей. Я надеялся, что процедура NearestNeighbor в Python scikit-learn library ( sklearn.neighbors.NearestNeighbor если быть точным) решит мою проблему, но эффективные алгоритмы, которые используют структуры данных […]

Комбинаторный взрыв при слиянии данных в пандах

Я пытаюсь объединить ряд данных в пандах. У меня есть список dfs, dfs и список их соответствующих меток labels и я хочу объединить все dfs в 1 df, чтобы общие метки из df получили суффикс из его метки в списке labels . то есть: def mymerge(dfs, labels): labels_dict = dict([(d, l) for d, l in […]

Исключительный срок: Неожиданное поведение. NaNs

Заметьте, что некоторые нанные появлялись неожиданно, по моим данным. (и расширяя и наносили все, что они касались) Провели какое-то тщательное исследование и подготовили минимальный рабочий пример: >>> import numpy >>> from scipy.special import expit >>> expit(709) 1.0 >>> expit(710) nan Expit – это обратный логит. Документальная документация здесь . Что говорит нам: expit(x) = 1/(1+exp(-x)) […]

Естественные сплайны Python с наименьшими квадратами

Я пытаюсь найти числовой пакет, который будет соответствовать естественному сплайну, который минимизирует взвешенные наименьшие квадраты. В scipy есть пакет, который делает то, что я хочу для неестественных сплайнов. import numpy as np import matplotlib.pyplot as plt from scipy import interpolate, randn x = np.arange(0,5,1.0/6) xs = np.arange(0,5,1.0/500) y = np.sin(x+1) + .2*np.random.rand(len(x)) -.1 knots = […]

Spyder IDE: как вы настраиваете символ конца строки по умолчанию?

Я использую IDE Spyder для разработки кода, и в настоящее время IDE имеет набор символов конца строки по умолчанию для CRLF. Я хотел бы использовать '\ n' вместо этого, потому что весь мой существующий исходный код использует '\ n', и поэтому я не хочу иметь кучу новых файлов, которые используют другой символ конца строки. Есть […]

Передача аргументов в fsolve

Я решаю нелинейное уравнение со многими константами. Я создал функцию для решения как: def terminalV(Vt, data): from numpy import sqrt ro_p, ro, D_p, mi, g = (i for i in data) y = sqrt((4*g*(ro_p – ro)*D_p)/(3*C_d(Re(data, Vt))*ro)) – Vt return y Затем я хочу: data = (1800, 994.6, 0.208e-3, 8.931e-4, 9.80665) Vt0 = 1 Vt […]

Имеет ли объект DataFrame от панд другие альтернативы для гетерогенных типов данных?

Раньше в NumPy были larry и структурированные / записываемые массивы , но мне интересно, если они используются больше с любой частотой, учитывая быстрое развитие пакета pandas . Исходя из R, я всегда застрял, чтобы распаковать массивы записей, чтобы изменять значения из нескольких столбцов и переназначать их обратно в структуру, но я так рад, что pandas […]

Как выполнить дискретную оптимизацию функций над матрицами?

Я бы хотел оптимизировать все 30 на 30 матриц с элементами 0 или 1. Моя целевая функция является определяющей. Одним из способов сделать это будет какой-то стохастический градиентный спуск или имитированный отжиг. Я смотрел на scipy.optimize но, похоже, он не поддерживает такую ​​оптимизацию, насколько я могу судить. scipy.optimize.basinhopping выглядел очень заманчивым, но, похоже, ему нужны […]

Булевы операции на матрицах scipy.sparse

У меня есть набор разреженных матриц, заполненных булевыми значениями, которые мне нужно выполнить с помощью логических операций (в основном с элементарным OR). как и в numpy, суммарные матрицы с dtype = 'bool' дают элементарный OR, однако есть неприятный побочный эффект: >>> from scipy import sparse >>> [a,b] = [sparse.rand(5,5,density=0.1,format='lil').astype('bool') … for x in range(2)] >>> […]

Использование scipy.spatial.Delaunay вместо встроенной версии matplotlib.tri.Triangulation

Кажется, что matplotlib.tri.Triangulation использует matplotlib.tri.Triangulation и, возможно, неправильную реализацию триангуляции Delaunay, которая должна быть заменена на qHull . Я пытаюсь построить trisurf, используя mpl_toolkits.mplot3d.plot_trisurf() и запуская кучу исключений, которые бесполезны ( IndexError s и KeyError основном, без указания того, что точно пошло не так). Поскольку scipy.spatial.Delaunay уже использует qHull, мне было интересно, есть ли способ […]

Python - лучший язык программирования в мире.