如何在Linux上使用C++读取JPEG和PNG像素?

22

我正在进行图像处理,并希望能够逐个读取JPEG和PNG图像中的每个像素值。

在我的部署方案中,使用第三方库会比较麻烦(因为我在目标计算机上的访问受限),但我假设没有标准的C或C++库用于读取JPEG/PNG...

所以,如果您知道一种不使用库的方法,则很好,如果没有,则仍然欢迎答案!

9个回答

24

在C语言标准库中没有用于读取文件格式的标准库。

然而,大多数程序尤其是在Linux平台上使用相同的库来解码图像格式:

对于jpeg格式,使用libjpeg库,对于png格式,使用libpng库。

这些库已经被安装的可能性非常

http://www.libpng.org

http://www.ijg.org


20

这是我从10年前的源代码(使用libjpeg)挖掘出来的一个小例程:

#include <jpeglib.h>

int loadJpg(const char* Name) {
  unsigned char a, r, g, b;
  int width, height;
  struct jpeg_decompress_struct cinfo;
  struct jpeg_error_mgr jerr;

  FILE * infile;        /* source file */
  JSAMPARRAY pJpegBuffer;       /* Output row buffer */
  int row_stride;       /* physical row width in output buffer */
  if ((infile = fopen(Name, "rb")) == NULL) {
    fprintf(stderr, "can't open %s\n", Name);
    return 0;
  }
  cinfo.err = jpeg_std_error(&jerr);
  jpeg_create_decompress(&cinfo);
  jpeg_stdio_src(&cinfo, infile);
  (void) jpeg_read_header(&cinfo, TRUE);
  (void) jpeg_start_decompress(&cinfo);
  width = cinfo.output_width;
  height = cinfo.output_height;

  unsigned char * pDummy = new unsigned char [width*height*4];
  unsigned char * pTest = pDummy;
  if (!pDummy) {
    printf("NO MEM FOR JPEG CONVERT!\n");
    return 0;
  }
  row_stride = width * cinfo.output_components;
  pJpegBuffer = (*cinfo.mem->alloc_sarray)
    ((j_common_ptr) &cinfo, JPOOL_IMAGE, row_stride, 1);

  while (cinfo.output_scanline < cinfo.output_height) {
    (void) jpeg_read_scanlines(&cinfo, pJpegBuffer, 1);
    for (int x = 0; x < width; x++) {
      a = 0; // alpha value is not supported on jpg
      r = pJpegBuffer[0][cinfo.output_components * x];
      if (cinfo.output_components > 2) {
        g = pJpegBuffer[0][cinfo.output_components * x + 1];
        b = pJpegBuffer[0][cinfo.output_components * x + 2];
      } else {
        g = r;
        b = r;
      }
      *(pDummy++) = b;
      *(pDummy++) = g;
      *(pDummy++) = r;
      *(pDummy++) = a;
    }
  }
  fclose(infile);
  (void) jpeg_finish_decompress(&cinfo);
  jpeg_destroy_decompress(&cinfo);

  BMap = (int*)pTest; 
  Height = height;
  Width = width;
  Depth = 32;
}

嗨,使用libjpeg相关函数需要添加哪些头文件? - suresh
在程序中调用此函数的示例会很有帮助。输出存储在哪里以及如何存储?实际上,此函数似乎有声明错误,并且没有返回任何内容。 - user3236841

7
对于jpeg格式,已经有一个名为 libjpeg的库,对于png则有 libpng。好消息是它们可以直接编译,因此目标机器不需要dll文件或任何其他东西。坏消息是它们是用C编写的:(
另外,不要试图自己读取 文件。如果您想要一个易于阅读的格式,请使用 PPM

7
他们在C语言中并不是坏消息。在C++中,使用C库比在Perl、Python、Java或C#中使用C库要容易得多。而且比尝试从C++中使用这些库要容易得多。 - Chris Lutz
我曾经为课程作业在Java中编写过一个JPEG解码器。这是一项非常艰巨的任务(而且让我告诉你,Java并没有让它变得更容易),但是它仍然让我对格式和哈夫曼编码有了很多深入的了解。尝试自己做这样的事情肯定是杀鸡焉用牛刀,除非你有非常严格的内存/速度要求,例如在编写受严重限制的嵌入式系统时。 - Daniel Kamil Kozar

4

很遗憾,JPEG格式是经过压缩的,因此在读取单个像素之前,您必须对其进行解压缩。这是一个非常复杂的任务。如果您无法使用库,则可以参考其中一个库以了解它如何解压缩图像。在sourceforge上有一个开源库:CImg on sourceforge。


2
由于它需要曝光,我想提及另一个值得研究的库:IM Toolkit,它托管在Sourceforge上。它是跨平台的,并完全将文件格式抽象化,使图像加载和处理时不必担心大部分细节。它支持PNG和JPEG,并可通过其他导入过滤器进行扩展。
它还带有大量的图像处理运算符...
它还与Lua有良好的质量绑定。

2

正如Nils所指出的,没有C或C++标准库可以用于JPEG压缩和图像处理。

如果您能够使用第三方库,您可以尝试使用支持JPEG、PNG和其他数十种格式、压缩和媒介的GDAL

下面是一个简单的示例,演示了如何使用GDAL C++ API从JPEG文件中读取像素数据:

#include <gdal_priv.h>
#include <cassert>
#include <iostream>
#include <string>
#include <vector>

int main()
{
    GDALAllRegister(); // once per application

    // Assume 3-band image with 8-bit per pixel per channel (24-bit depth)
    std::string const file("/home/mloskot/test.jpg");

    // Open file with image data
    GDALDataset* ds = static_cast<GDALDataset*>(GDALOpen(file.c_str(), GA_ReadOnly));
    assert(0 != ds);

    // Example 1 - Read multiple bands at once, assume 8-bit depth per band
    {
        int const ncols = ds->GetRasterXSize();
        int const nrows = ds->GetRasterYSize();
        int const nbands = ds->GetRasterCount();
        int const nbpp = GDALGetDataTypeSize(GDT_Byte) / 8;
        std::vector<unsigned char> data(ncols * nrows * nbands * nbpp);

        CPLErr err = ds->RasterIO(GF_Read, 0, 0, ncols, nrows, &data[0], ncols, nrows, GDT_Byte, nbands, 0, 0, 0, 0);
        assert(CE_None == err);

        // ... use data
    }

    // Example 2 - Read first scanline by scanline of 1 band only, assume 8-bit depth per band
    {
        GDALRasterBand* band1 = ds->GetRasterBand(1);
        assert(0 != band1);

        int const ncols = band1->GetXSize();
        int const nrows = band1->GetYSize();
        int const nbpp = GDALGetDataTypeSize(GDT_Byte) / 8;
        std::vector<unsigned char> scanline(ncols * nbpp);

        for (int i = 0; i < nrows; ++i)
        {
            CPLErr err = band1->RasterIO(GF_Read, 0, 0, ncols, 1, &scanline[0], ncols, 1, GDT_Byte, 0, 0);
            assert(CE_None == err);

            // ... use scanline
        }
    }

    return 0;
}

有一份更全面的GDAL API教程可供参考。


1
如果速度不是问题,您可以尝试使用LodePNG,它采用非常简约的方法来加载和保存PNG文件。
或者甚至可以选择同一作者的picoPNG,它是一个自包含的PNG加载器函数。

1

我在使用DevIL库方面有着良好的经验。它支持广泛的图像格式,并且遵循与OpenGL非常相似的函数风格。

虽然它是一个库,但绝对值得一试。


1

由于其他答案已经提到您很可能需要使用库,因此请查看ImageMagick,看看是否可以实现您需要的功能。它带有各种不同的接口方式,包括几乎所有可用编程语言的库,以便与ImageMagick的核心功能进行交互。

主页:ImageMagick


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接