Tag: numpy

Генерирование случайных векторов евклидовой нормы <= 1 в Python?

Более конкретно, учитывая естественное число d, как я могу генерировать случайные векторы в R ^ d так, чтобы каждый вектор x имел евклидову норму <= 1? Генерирование случайных векторов через numpy.random.rand (1, d) не проблема, но вероятность такого случайного вектора, имеющего норму <= 1, предсказуемо плохо для даже не малого d. Например, даже при d […]

Как использовать pandas dataframes и массивы numpy в Rpy2?

Я хотел бы использовать pandas для всего моего анализа наряду с numpy, но использовать Rpy2 для построения моих данных. Я хочу сделать все анализы с использованием панда данных, а затем использовать полный график R через rpy2 для их построения. py2, и я использую ipython для построения. Каков правильный способ сделать это? Почти все команды, которые […]

Разница между файлом HDF5 и файлом PyTables

Есть ли разница между файлами HDF5 и файлами, созданными PyTables ? PyTables имеет две функции .isHDFfile() и .isPyTablesFile() предполагающие разницу между .isPyTablesFile() двумя форматами. Я немного поглядел на Google и собрал, что PyTables построен поверх HDF, но я не смог найти много за этим. Меня особенно интересует интероперабельность, скорость и накладные расходы. Благодарю.

Расчет собственных значений Python выполняется намного медленнее, чем вычисления MATLAB на моем компьютере. Зачем?

Я хотел бы вычислить собственные значения крупномасштабных матриц (около 1000×1000) с использованием Python 2.6.5. Я не мог сделать это быстро. Я не нашел ни одного другого потока, рассматривающего этот вопрос. Когда я бегу a = rand(1000,1000); tic; for i =1:10 eig(a); end toc; в MATLAB это занимает около 30 секунд. Аналогичный тест на Python требует […]

Как ускорить создание матрицы перехода в Numpy?

Ниже приведен самый простой способ подсчета переходов в цепочке марков и использование его для заполнения матрицы перехода: def increment_counts_in_matrix_from_chain(markov_chain, transition_counts_matrix): for i in xrange(1, len(markov_chain)): old_state = markov_chain[i – 1] new_state = markov_chain[i] transition_counts_matrix[old_state, new_state] += 1 Я пробовал ускорить его тремя способами: 1) Используя разреженный однострочный матричный шаблон на основе этого кода Matlab: transition_matrix […]

Создание | N | x | M | матрица из хэш-таблицы

Представьте, что у меня есть словарь / хэш-таблица пар строк (ключей) и их вероятностей (значений): import numpy as np import random import uuid # Creating the N vocabulary and M vocabulary max_word_len = 20 n_vocab_size = random.randint(8000,10000) m_vocab_size = random.randint(8000,10000) def random_word(): return str(uuid.uuid4().get_hex().upper()[0:random.randint(1,max_word_len)]) # Generate some random words. n_vocab = [random_word() for i in […]

Как разбить список кортежей?

определение factorize: сопоставить каждый уникальный объект в уникальное целое число. Как правило, диапазон целых чисел, сопоставленных с, равен нулю от n до 1, где n – количество уникальных объектов. Также характерны два варианта. Тип 1 – это нумерация в порядке, в котором идентифицируются уникальные объекты. Тип 2 – это когда уникальные объекты сначала сортируются, а […]

Понимание == применительно к массиву NumPy

Я новичок в Python, и я изучаю TensorFlow . В учебном пособии, использующем набор данных notMNIST , они приводят примерный код для преобразования матрицы меток в один кодируемый массив. Цель состоит в том, чтобы взять массив, состоящий из целых чисел меток 0 … 9, и вернуть матрицу, где каждое целое число было преобразовано в один […]

Быстрые циклы Numpy

Как вы оптимизируете этот код ( без векторизации, так как это приводит к использованию семантики расчета, что довольно часто не является нетривиальным): slow_lib.py: import numpy as np def foo(): size = 200 np.random.seed(1000031212) bar = np.random.rand(size, size) moo = np.zeros((size,size), dtype = np.float) for i in range(0,size): for j in range(0,size): val = bar[j] moo […]

Поиск индекса максимального значения в массиве с NumPy

Я хотел бы найти максимум в массиве float64 , исключая значения nan . Я видел функцию np.nanmax но она не np.nanmax индекс, соответствующий найденному значению. довольно странно сканировать после того, как значение специально функция обязательно использует индекс ??? Разве это не ошибка, подобная этой ошибке. нет ли способа восстановить индекс напрямую?

Python - лучший язык программирования в мире.