Быстрое (er) причудливое индексирование и сокращение?

Я пытаюсь использовать и ускорять причудливое индексирование для «объединения» двух массивов и суммирования по одной из осей результатов.

Что-то вроде этого:

$ ipython In [1]: import numpy as np In [2]: ne, ds = 12, 6 In [3]: i = np.random.randn(ne, ds).astype('float32') In [4]: t = np.random.randint(0, ds, size=(1e5, ne)).astype('uint8') In [5]: %timeit i[np.arange(ne), t].sum(-1) 10 loops, best of 3: 44 ms per loop 

Есть ли простой способ ускорить утверждение в In [5] ? Должен ли я идти с OpenMP и что-то вроде scipy.weave или Cython 's prange ?

One Solution collect form web for “Быстрое (er) причудливое индексирование и сокращение?”

numpy.take какой-то причине numpy.take намного быстрее, чем причудливая индексация. Единственный трюк в том, что он рассматривает массив как плоский.

 In [1]: a = np.random.randn(12,6).astype(np.float32) In [2]: c = np.random.randint(0,6,size=(1e5,12)).astype(np.uint8) In [3]: r = np.arange(12) In [4]: %timeit a[r,c].sum(-1) 10 loops, best of 3: 46.7 ms per loop In [5]: rr, cc = np.broadcast_arrays(r,c) In [6]: flat_index = rr*a.shape[1] + cc In [7]: %timeit a.take(flat_index).sum(-1) 100 loops, best of 3: 5.5 ms per loop In [8]: (a.take(flat_index).sum(-1) == a[r,c].sum(-1)).all() Out[8]: True 

Я думаю, что только другой способ, которым вы будете видеть большую часть улучшения скорости, помимо этого, – написать собственное ядро ​​для графического процессора, используя что-то вроде PyCUDA .

  • Подпись метода для якобиана функции наименьших квадратов в scipy
  • Как я могу получить эффект «умного резкости» на моих изображениях с помощью python?
  • Быстрая двухмерная интерполяция в Python с регулярной сеткой SciPy для разброса / нерегулярной оценки
  • Numpy и Scipy с Amazon Elastic MapReduce
  • fsolve - несоответствие между входом и выходом
  • Детерминированный скрипт python ведет себя недетерминированным образом
  • Чтение файла и построение CDF в Python
  • Установка распределения с использованием гистограммы с использованием scipy
  • Поиск корреляционной матрицы
  • Установка гамма-распределения с (python) Scipy
  • Как узнать технологию интеграции, используемую quadpack
  • Python - лучший язык программирования в мире.