Tag: numpy

Что делает `x ` в numpy?

Скажем, у меня есть массив x = np.arange(6).reshape(3, 2) . В чем смысл x[False] или x[np.asanyarray(False)] ? Оба результата приводят к array([], shape=(0, 3, 2), dtype=int64) , что является неожиданным. Я ожидал получить IndexError из-за маски неправильного размера, как от чего-то вроде x[np.ones((2, 2), dtype=np.bool)] . Это поведение согласовано для x[True] и x[np.asanyarray(True)] , поскольку […]

Выберите строки из Numpy Rec Array

У меня есть массив Numpy rec, из которого я хотел бы сделать несколько быстрых запросов, подобных SQL: SELECT * where array['phase'] == "P" . Я хотел бы получить массив записей как вывод с каждой строкой, соответствующей строке из исходного массива, которая соответствовала критериям запроса. Есть идеи? Я почти уверен, что сделал это раньше, но просто […]

Рекомендация импорта SciPy / NumPy

Обратите внимание: я проверял на наличие дубликатов и ничего не ответил на мой вопрос. Надеюсь, вы сообщите мне, если я что-то пропустил! Чтобы очистить свой код, я искал стандартное соглашение для импорта SciPy и NumPy в мои программы. Я знаю, что нет строгого руководства, и я могу делать это так, как хочу, но время от […]

Ускорить подсчет близлежащих групп?

У меня есть кадр данных, который содержит идентификатор группы, две меры расстояния (измерение долготы / широты) и значение. Для данного набора расстояний я хочу найти количество других групп поблизости и средние значения этих других групп поблизости. Я написал следующий код, но он настолько неэффективен, что он просто не завершается в разумные сроки для очень больших […]

В Python, как я могу рассчитать корреляцию и статистическую значимость между двумя массивами данных?

У меня есть наборы данных с двумя одинаково длинными массивами данных, или я могу создать массив записей из двух элементов, и я хотел бы рассчитать корреляционную и статистическую значимость, представленные данными (которые могут быть тесно коррелированы или могут иметь нет статистически значимой корреляции). Я программирую на Python и устанавливаю scipy и numpy. Я посмотрел и […]

Python + alglib + NumPy: как избежать преобразования массивов в списки?

Контекст: Недавно я обнаружил библиотеку alglib (для численного вычисления), которая, кажется, была тем, что я искал (надежная интерполяция, анализ данных …) и не мог найти ее в numpy или scipy. Однако меня беспокоит тот факт, что (например, для интерполяции) он не принимает массив numpy в качестве допустимого формата ввода, а только обычные объекты списка python. […]

Numpy и Scipy с Amazon Elastic MapReduce

Используя mrjob для запуска кода python на Elastic MapReduce от Amazon, я успешно нашел способ обновить numpy и scipy изображения EMR. При запуске с консоли работают следующие команды: tar -cvf py_bundle.tar mymain.py Utils.py numpy-1.6.1.tar.gz scipy-0.9.0.tar.gz gzip py_bundle.tar python my_mapper.py -r emr –python-archive py_bundle.tar.gz –bootstrap-python-package numpy-1.6.1.tar.gz –bootstrap-python-package scipy-0.9.0.tar.gz > output.txt Это успешно загружает последние новинки и […]

почему в DataFrame намного эффективнее, чем на базовом массиве numpy?

Я заметил, что использование len в DataFrame намного быстрее, чем использование len в базовом массиве numpy. Я не понимаю, почему. Доступ к одной и той же информации с помощью shape тоже не помогает. Это более актуально, поскольку я пытаюсь получить число столбцов и количество строк. Я всегда обсуждал, какой метод использовать. Я собрал следующий эксперимент, […]

Поведение пользовательских плаваний NaN в Python и Numpy

Мне нужно собрать дополнительную информацию в значения NaN с плавающей запятой. Я использую float IEEE 754 с одной точностью (32-битные поплавки) в Python. Как Python и NumPy обрабатывают эти значения? теория Кажется, что стандарт IEEE 754-2008 считает, что число действительно не является числом, если установлены биты экспоненты (23..30) и установлен хотя бы один из значащих […]

Оптимизация и ускорение математической функции в python

Целью этой математической функции является вычисление расстояния между двумя (или более) белковыми структурами с использованием двугранных углов: Это очень полезно в структурной биологии, например. И я уже кодирую эту функцию в python, используя numpy, но цель состоит в том, чтобы иметь более быструю реализацию. В качестве ссылки на вычисление времени я использую функцию евклидовой дистанции, […]

 
Interesting Posts for Van-Lav
Python - лучший язык программирования в мире.