Каков самый простой способ конвертировать ndarray в cv :: Mat?

Я пытаюсь создать оболочку Python / Cython для библиотеки C ++, которая использует класс cv::Mat от OpenCV. В официальной ndarray Python все функции принимают ndarray NumPy вместо cv::Mat , что довольно удобно. Но в моей собственной оболочке, как мне сделать такое преобразование? То есть, как мне создать cv::Mat из np.ndarray ?

5 Solutions collect form web for “Каков самый простой способ конвертировать ndarray в cv :: Mat?”

Как предложил kyamagu, вы можете использовать официальный код оболочки OpenCV, особенно pyopencv_to и pyopencv_from .

Я боролся так же, как и со всеми зависимостями и сгенерированными файлами заголовков. Тем не менее, можно уменьшить сложность этого, « cv2.cpp » cv2.cpp как это сделал лжеалхист , чтобы сохранить только то, что необходимо. Вам нужно будет адаптировать его к вашим потребностям и к версии OpenCV, которую вы используете, но в основном тот же код, который я использовал.

 #include <Python.h> #include "numpy/ndarrayobject.h" #include "opencv2/core/core.hpp" static PyObject* opencv_error = 0; static int failmsg(const char *fmt, ...) { char str[1000]; va_list ap; va_start(ap, fmt); vsnprintf(str, sizeof(str), fmt, ap); va_end(ap); PyErr_SetString(PyExc_TypeError, str); return 0; } class PyAllowThreads { public: PyAllowThreads() : _state(PyEval_SaveThread()) {} ~PyAllowThreads() { PyEval_RestoreThread(_state); } private: PyThreadState* _state; }; class PyEnsureGIL { public: PyEnsureGIL() : _state(PyGILState_Ensure()) {} ~PyEnsureGIL() { PyGILState_Release(_state); } private: PyGILState_STATE _state; }; #define ERRWRAP2(expr) \ try \ { \ PyAllowThreads allowThreads; \ expr; \ } \ catch (const cv::Exception &e) \ { \ PyErr_SetString(opencv_error, e.what()); \ return 0; \ } using namespace cv; static PyObject* failmsgp(const char *fmt, ...) { char str[1000]; va_list ap; va_start(ap, fmt); vsnprintf(str, sizeof(str), fmt, ap); va_end(ap); PyErr_SetString(PyExc_TypeError, str); return 0; } static size_t REFCOUNT_OFFSET = (size_t)&(((PyObject*)0)->ob_refcnt) + (0x12345678 != *(const size_t*)"\x78\x56\x34\x12\0\0\0\0\0")*sizeof(int); static inline PyObject* pyObjectFromRefcount(const int* refcount) { return (PyObject*)((size_t)refcount - REFCOUNT_OFFSET); } static inline int* refcountFromPyObject(const PyObject* obj) { return (int*)((size_t)obj + REFCOUNT_OFFSET); } class NumpyAllocator : public MatAllocator { public: NumpyAllocator() {} ~NumpyAllocator() {} void allocate(int dims, const int* sizes, int type, int*& refcount, uchar*& datastart, uchar*& data, size_t* step) { PyEnsureGIL gil; int depth = CV_MAT_DEPTH(type); int cn = CV_MAT_CN(type); const int f = (int)(sizeof(size_t)/8); int typenum = depth == CV_8U ? NPY_UBYTE : depth == CV_8S ? NPY_BYTE : depth == CV_16U ? NPY_USHORT : depth == CV_16S ? NPY_SHORT : depth == CV_32S ? NPY_INT : depth == CV_32F ? NPY_FLOAT : depth == CV_64F ? NPY_DOUBLE : f*NPY_ULONGLONG + (f^1)*NPY_UINT; int i; npy_intp _sizes[CV_MAX_DIM+1]; for( i = 0; i < dims; i++ ) _sizes[i] = sizes[i]; if( cn > 1 ) { /*if( _sizes[dims-1] == 1 ) _sizes[dims-1] = cn; else*/ _sizes[dims++] = cn; } PyObject* o = PyArray_SimpleNew(dims, _sizes, typenum); if(!o) CV_Error_(CV_StsError, ("The numpy array of typenum=%d, ndims=%d can not be created", typenum, dims)); refcount = refcountFromPyObject(o); npy_intp* _strides = PyArray_STRIDES(o); for( i = 0; i < dims - (cn > 1); i++ ) step[i] = (size_t)_strides[i]; datastart = data = (uchar*)PyArray_DATA(o); } void deallocate(int* refcount, uchar*, uchar*) { PyEnsureGIL gil; if( !refcount ) return; PyObject* o = pyObjectFromRefcount(refcount); Py_INCREF(o); Py_DECREF(o); } }; NumpyAllocator g_numpyAllocator; enum { ARG_NONE = 0, ARG_MAT = 1, ARG_SCALAR = 2 }; static int pyopencv_to(const PyObject* o, Mat& m, const char* name = "<unknown>", bool allowND=true) { if(!o || o == Py_None) { if( !m.data ) m.allocator = &g_numpyAllocator; return true; } if( PyInt_Check(o) ) { double v[] = {PyInt_AsLong((PyObject*)o), 0., 0., 0.}; m = Mat(4, 1, CV_64F, v).clone(); return true; } if( PyFloat_Check(o) ) { double v[] = {PyFloat_AsDouble((PyObject*)o), 0., 0., 0.}; m = Mat(4, 1, CV_64F, v).clone(); return true; } if( PyTuple_Check(o) ) { int i, sz = (int)PyTuple_Size((PyObject*)o); m = Mat(sz, 1, CV_64F); for( i = 0; i < sz; i++ ) { PyObject* oi = PyTuple_GET_ITEM(o, i); if( PyInt_Check(oi) ) m.at<double>(i) = (double)PyInt_AsLong(oi); else if( PyFloat_Check(oi) ) m.at<double>(i) = (double)PyFloat_AsDouble(oi); else { failmsg("%s is not a numerical tuple", name); m.release(); return false; } } return true; } if( !PyArray_Check(o) ) { failmsg("%s is not a numpy array, neither a scalar", name); return false; } bool needcopy = false, needcast = false; int typenum = PyArray_TYPE(o), new_typenum = typenum; int type = typenum == NPY_UBYTE ? CV_8U : typenum == NPY_BYTE ? CV_8S : typenum == NPY_USHORT ? CV_16U : typenum == NPY_SHORT ? CV_16S : typenum == NPY_INT ? CV_32S : typenum == NPY_INT32 ? CV_32S : typenum == NPY_FLOAT ? CV_32F : typenum == NPY_DOUBLE ? CV_64F : -1; if( type < 0 ) { if( typenum == NPY_INT64 || typenum == NPY_UINT64 || type == NPY_LONG ) { needcopy = needcast = true; new_typenum = NPY_INT; type = CV_32S; } else { failmsg("%s data type = %d is not supported", name, typenum); return false; } } int ndims = PyArray_NDIM(o); if(ndims >= CV_MAX_DIM) { failmsg("%s dimensionality (=%d) is too high", name, ndims); return false; } int size[CV_MAX_DIM+1]; size_t step[CV_MAX_DIM+1], elemsize = CV_ELEM_SIZE1(type); const npy_intp* _sizes = PyArray_DIMS(o); const npy_intp* _strides = PyArray_STRIDES(o); bool ismultichannel = ndims == 3 && _sizes[2] <= CV_CN_MAX; for( int i = ndims-1; i >= 0 && !needcopy; i-- ) { // these checks handle cases of // a) multi-dimensional (ndims > 2) arrays, as well as simpler 1- and 2-dimensional cases // b) transposed arrays, where _strides[] elements go in non-descending order // c) flipped arrays, where some of _strides[] elements are negative if( (i == ndims-1 && (size_t)_strides[i] != elemsize) || (i < ndims-1 && _strides[i] < _strides[i+1]) ) needcopy = true; } if( ismultichannel && _strides[1] != (npy_intp)elemsize*_sizes[2] ) needcopy = true; if (needcopy) { if( needcast ) o = (PyObject*)PyArray_Cast((PyArrayObject*)o, new_typenum); else o = (PyObject*)PyArray_GETCONTIGUOUS((PyArrayObject*)o); _strides = PyArray_STRIDES(o); } for(int i = 0; i < ndims; i++) { size[i] = (int)_sizes[i]; step[i] = (size_t)_strides[i]; } // handle degenerate case if( ndims == 0) { size[ndims] = 1; step[ndims] = elemsize; ndims++; } if( ismultichannel ) { ndims--; type |= CV_MAKETYPE(0, size[2]); } if( ndims > 2 && !allowND ) { failmsg("%s has more than 2 dimensions", name); return false; } m = Mat(ndims, size, type, PyArray_DATA(o), step); if( m.data ) { m.refcount = refcountFromPyObject(o); if (!needcopy) { m.addref(); // protect the original numpy array from deallocation // (since Mat destructor will decrement the reference counter) } }; m.allocator = &g_numpyAllocator; return true; } static PyObject* pyopencv_from(const Mat& m) { if( !m.data ) Py_RETURN_NONE; Mat temp, *p = (Mat*)&m; if(!p->refcount || p->allocator != &g_numpyAllocator) { temp.allocator = &g_numpyAllocator; ERRWRAP2(m.copyTo(temp)); p = &temp; } p->addref(); return pyObjectFromRefcount(p->refcount); } 

После того, как вы очистили файл cv2.cpp , вот какой-то код Cython, который позаботится о преобразовании. Обратите внимание на определение и вызов функции import_array() (это функция NumPy, определенная в заголовке, включенном где-то в cv2.cpp ), это необходимо для определения некоторых макросов, используемых pyopencv_to , если вы их не назовете, вы получите выявили недостатки сегментации.

 from cpython.ref cimport PyObject # Declares OpenCV's cv::Mat class cdef extern from "opencv2/core/core.hpp": cdef cppclass Mat: pass # Declares the official wrapper conversion functions + NumPy's import_array() function cdef extern from "cv2.cpp": void import_array() PyObject* pyopencv_from(const _Mat&) int pyopencv_to(PyObject*, _Mat&) # Function to be called at initialization cdef void init(): import_array() # Python to C++ conversion cdef Mat nparrayToMat(object array): cdef Mat mat cdef PyObject* pyobject = <PyObject*> array pyopencv_to(pyobject, mat) return <Mat> mat # C++ to Python conversion cdef object matToNparray(Mat mat): return <object> pyopencv_from(mat) 

Примечание: как-то я получил ошибку с NumPy 1.8.0 на Fedora 20 при компиляции из-за странного оператора return в макросе import_array , мне пришлось вручную удалить его, чтобы он работал, но я не могу найти этот оператор return в NumPy's 1.8.0 Исходный код GitHub

Я думаю, вы можете напрямую использовать или взять некоторую логику из конвертера из официальной оболочки python . Документации по этому модулю мало, но, возможно, вывод генератора обложек помогает понять, как его использовать.

Оказывается, нет простого способа конвертировать (любой) np.ndarray в соответствующий cv::Mat . В принципе, нужно делать всего 2 вещи:

  1. Создайте пустой cv::Mat соответствующего размера и типа.
  2. Копирование данных.

Однако дьявол скрывается в деталях. Как ndarray и Mat могут содержать довольно разные форматы данных. Например, данные в массивах NumPy могут быть в C или в порядке Fortran, объект массива может владеть своими данными или сохранять представление в другом массиве, каналы могут идти в другом порядке (RGB в NumPy против BGR в OpenCV) и т. Д.

Поэтому вместо того, чтобы пытаться решить общую проблему, я решил остаться с простым кодом, который соответствует моим потребностям и может быть легко изменен любым, кто интересуется.

Следующий код в Cython работает с изображениями float32 / CV_32FC1 с порядком байтов по умолчанию:

 cdef void array2mat(np.ndarray arr, Mat& mat): cdef int r = arr.shape[0] cdef int c = arr.shape[1] cdef int mat_type = CV_32FC1 # or CV_64FC1, or CV_8UC3, or whatever mat.create(r, c, mat_type) cdef unsigned int px_size = 4 # 8 for single-channel double image or # 1*3 for three-channel uint8 image memcpy(mat.data, arr.data, r*c*px_size) 

Чтобы использовать этот код в Cython, также необходимо объявить некоторые типы и константы, например, например:

 import numpy as np # Cython makes it simple to import NumPy cimport numpy as np # OpenCV's matrix class cdef extern from "opencv2/opencv.hpp" namespace "cv": cdef cppclass Mat: Mat() except + Mat(int, int, int, void*) except + void create(int, int, int) void* data int type() const int cols int rows int channels() Mat clone() const # some OpenCV matrix types cdef extern from "opencv2/opencv.hpp": cdef int CV_8UC3 cdef int CV_8UC1 cdef int CV_32FC1 cdef int CV_64FC1 

Противоположное преобразование (из cv::Mat в np.ndarray ) может быть достигнуто аналогичным образом.

Бонус: есть также хорошая запись в блоге, описывающая такое же преобразование изображений RGB / BGR.

Основываясь на ответе tlorieul, вот код, который я использовал для построения модуля Python / C ++:

https://gist.github.com/des0ps/88f1332319867a678a74bdbc0e7401c2

Это было протестировано с Python3 и OpenCV3.

Если это помогает, я написал обертку, которая делает именно это. Это удобная библиотека, которая регистрирует конвертер boost :: python, чтобы неявно преобразовывать между популярным форматом данных cv :: Mat OpenCV и популярным типом данных np.array () NumPy. Это позволяет разработчику перемещаться между API Open CV C ++ и API Python, написанным с использованием NumPy, с относительной легкостью, избегая необходимости писать дополнительные оболочки, которые обрабатывают или возвращают PyObjects.

Посмотрите: https://github.com/spillai/numpy-opencv-converter

  • Как изменить размер изображения с помощью OpenCV2.0 и Python2.6
  • OpenCV и Python: анализ подключенных компонентов
  • Python & OpenCV: второй по величине объект
  • отображать изображение cv2.VideoCapture внутри поверхности Pygame
  • OpenCV Hough Circle Transform требует 8-битного изображения
  • Как удалить шум из изображения с выравниванием по гистограмме?
  • Как заменить контур (прямоугольник) на изображении новым изображением с помощью Python?
  • Совместимость изображений с OpenCV - форма формы с шаблоном формы
  • openCV и python: морфологическое преобразование вне границ
  • Сглаживание краев двоичного изображения
  • Открытие видео с помощью openCV + python
  •  
    Interesting Posts for Van-Lav
    Python - лучший язык программирования в мире.