Tag: numpy

Рекомендация импорта SciPy / NumPy

Обратите внимание: я проверял на наличие дубликатов и ничего не ответил на мой вопрос. Надеюсь, вы сообщите мне, если я что-то пропустил! Чтобы очистить свой код, я искал стандартное соглашение для импорта SciPy и NumPy в мои программы. Я знаю, что нет строгого руководства, и я могу делать это так, как хочу, но время от […]

Ускорить подсчет близлежащих групп?

У меня есть кадр данных, который содержит идентификатор группы, две меры расстояния (измерение долготы / широты) и значение. Для данного набора расстояний я хочу найти количество других групп поблизости и средние значения этих других групп поблизости. Я написал следующий код, но он настолько неэффективен, что он просто не завершается в разумные сроки для очень больших […]

В Python, как я могу рассчитать корреляцию и статистическую значимость между двумя массивами данных?

У меня есть наборы данных с двумя одинаково длинными массивами данных, или я могу создать массив записей из двух элементов, и я хотел бы рассчитать корреляционную и статистическую значимость, представленные данными (которые могут быть тесно коррелированы или могут иметь нет статистически значимой корреляции). Я программирую на Python и устанавливаю scipy и numpy. Я посмотрел и […]

Python + alglib + NumPy: как избежать преобразования массивов в списки?

Контекст: Недавно я обнаружил библиотеку alglib (для численного вычисления), которая, кажется, была тем, что я искал (надежная интерполяция, анализ данных …) и не мог найти ее в numpy или scipy. Однако меня беспокоит тот факт, что (например, для интерполяции) он не принимает массив numpy в качестве допустимого формата ввода, а только обычные объекты списка python. […]

Numpy и Scipy с Amazon Elastic MapReduce

Используя mrjob для запуска кода python на Elastic MapReduce от Amazon, я успешно нашел способ обновить numpy и scipy изображения EMR. При запуске с консоли работают следующие команды: tar -cvf py_bundle.tar mymain.py Utils.py numpy-1.6.1.tar.gz scipy-0.9.0.tar.gz gzip py_bundle.tar python my_mapper.py -r emr –python-archive py_bundle.tar.gz –bootstrap-python-package numpy-1.6.1.tar.gz –bootstrap-python-package scipy-0.9.0.tar.gz > output.txt Это успешно загружает последние новинки и […]

почему в DataFrame намного эффективнее, чем на базовом массиве numpy?

Я заметил, что использование len в DataFrame намного быстрее, чем использование len в базовом массиве numpy. Я не понимаю, почему. Доступ к одной и той же информации с помощью shape тоже не помогает. Это более актуально, поскольку я пытаюсь получить число столбцов и количество строк. Я всегда обсуждал, какой метод использовать. Я собрал следующий эксперимент, […]

Поведение пользовательских плаваний NaN в Python и Numpy

Мне нужно собрать дополнительную информацию в значения NaN с плавающей запятой. Я использую float IEEE 754 с одной точностью (32-битные поплавки) в Python. Как Python и NumPy обрабатывают эти значения? теория Кажется, что стандарт IEEE 754-2008 считает, что число действительно не является числом, если установлены биты экспоненты (23..30) и установлен хотя бы один из значащих […]

Оптимизация и ускорение математической функции в python

Целью этой математической функции является вычисление расстояния между двумя (или более) белковыми структурами с использованием двугранных углов: Это очень полезно в структурной биологии, например. И я уже кодирую эту функцию в python, используя numpy, но цель состоит в том, чтобы иметь более быструю реализацию. В качестве ссылки на вычисление времени я использую функцию евклидовой дистанции, […]

Почему B = numpy.dot (A, x) настолько медленнее, что цикл B = numpy.dot (A , x))?

Я получаю результаты эффективности, которые я не могу объяснить. Я хочу собрать матрицу B, чьи i-ые записи B [i,:,:] = A [i,:,:]. Dot (x), где каждая A [i,:,:] является двумерной матрицей, и х. Я могу сделать это тремя способами, чтобы проверить производительность. Я делаю произвольные ( numpy.random.randn ) матрицы A = (10,1000,1000), x = (1000,1200). […]

Считываемость кода Scientific Python (линейные континуусы, переменные имена, импорт)

Используются ли стилистические рекомендации Python для научного кодирования? Мне сложно сохранить читаемый научный код Python. Например, предлагается использовать значимые имена для переменных и сохранять упорядоченное пространство имен, избегая import * . Таким образом, например: import numpy as np normbar = np.random.normal(mean, std, np.shape(foo)) Но эти предложения могут привести к некоторому трудночитаемому коду, особенно учитывая ширину […]

Python - лучший язык программирования в мире.