我一直在努力使用OpenCV CUDA来提高性能,例如对从AVI文件读取的视频进行腐蚀/膨胀、帧差分等处理。通常情况下,GPU(580gtx)的FPS只有CPU(AMD 955BE)的一半。在您询问我是否正确测量了fps之前,您可以肉眼清楚地看到GPU的滞后,特别是在使用高腐蚀/膨胀级别时。
似乎我没有并行读入帧?以下是代码:
CPU实现基本相同,只是当然不使用cv::gpu命名空间和GpuMat,而是使用Mat。
谢谢。
似乎我没有并行读入帧?以下是代码:
#include <opencv2/imgproc/imgproc.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/video/tracking.hpp>
#include <opencv2/gpu/gpu.hpp>
#include <stdlib.h>
#include <stdio.h>
using namespace cv;
using namespace cv::gpu;
Mat cpuSrc;
GpuMat src, dst;
int element_shape = MORPH_RECT;
//the address of variable which receives trackbar position update
int max_iters = 10;
int open_close_pos = 0;
int erode_dilate_pos = 0;
// callback function for open/close trackbar
void OpenClose(int)
{
IplImage disp;
Mat temp;
int n = open_close_pos - max_iters;
int an = n > 0 ? n : -n;
Mat element = getStructuringElement(element_shape, Size(an*2+1, an*2+1), Point(an, an) );
if( n < 0 )
cv::gpu::morphologyEx(src, dst, CV_MOP_OPEN, element);
else
cv::gpu::morphologyEx(src, dst, CV_MOP_CLOSE, element);
dst.download(temp);
disp = temp;
// cvShowImage("Open/Close",&disp);
}
// callback function for erode/dilate trackbar
void ErodeDilate(int)
{
IplImage disp;
Mat temp;
int n = erode_dilate_pos - max_iters;
int an = n > 0 ? n : -n;
Mat element = getStructuringElement(element_shape, Size(an*2+1, an*2+1), Point(an, an) );
if( n < 0 )
cv::gpu::erode(src, dst, element);
else
cv::gpu::dilate(src, dst, element);
dst.download(temp);
disp = temp;
cvShowImage("Erode/Dilate",&disp);
}
int main( int argc, char** argv )
{
VideoCapture capture("TwoManLoiter.avi");
//create windows for output images
namedWindow("Open/Close",1);
namedWindow("Erode/Dilate",1);
open_close_pos = 3;
erode_dilate_pos = 0;
createTrackbar("iterations", "Open/Close",&open_close_pos,max_iters*2+1,NULL);
createTrackbar("iterations", "Erode/Dilate",&erode_dilate_pos,max_iters*2+1,NULL);
for(;;)
{
capture >> cpuSrc;
src.upload(cpuSrc);
GpuMat grey;
cv::gpu::cvtColor(src, grey, CV_BGR2GRAY);
src = grey;
int c;
ErodeDilate(erode_dilate_pos);
c = cvWaitKey(25);
if( (char)c == 27 )
break;
}
return 0;
}
CPU实现基本相同,只是当然不使用cv::gpu命名空间和GpuMat,而是使用Mat。
谢谢。