如何在Linux上使用C++读取JPEG和PNG像素？

Question

如何在Linux上使用C++读取JPEG和PNG像素？

c++clinuxpngjpeg

22

我正在进行图像处理，并希望能够逐个读取JPEG和PNG图像中的每个像素值。

在我的部署方案中，使用第三方库会比较麻烦（因为我在目标计算机上的访问受限），但我假设没有标准的C或C++库用于读取JPEG/PNG...

所以，如果您知道一种不使用库的方法，则很好，如果没有，则仍然欢迎答案！

- Nick Bolton

9个回答

20

这是我从10年前的源代码（使用libjpeg）挖掘出来的一个小例程：

#include <jpeglib.h>

int loadJpg(const char* Name) {
  unsigned char a, r, g, b;
  int width, height;
  struct jpeg_decompress_struct cinfo;
  struct jpeg_error_mgr jerr;

  FILE * infile;        /* source file */
  JSAMPARRAY pJpegBuffer;       /* Output row buffer */
  int row_stride;       /* physical row width in output buffer */
  if ((infile = fopen(Name, "rb")) == NULL) {
    fprintf(stderr, "can't open %s\n", Name);
    return 0;
  }
  cinfo.err = jpeg_std_error(&jerr);
  jpeg_create_decompress(&cinfo);
  jpeg_stdio_src(&cinfo, infile);
  (void) jpeg_read_header(&cinfo, TRUE);
  (void) jpeg_start_decompress(&cinfo);
  width = cinfo.output_width;
  height = cinfo.output_height;

  unsigned char * pDummy = new unsigned char [width*height*4];
  unsigned char * pTest = pDummy;
  if (!pDummy) {
    printf("NO MEM FOR JPEG CONVERT!\n");
    return 0;
  }
  row_stride = width * cinfo.output_components;
  pJpegBuffer = (*cinfo.mem->alloc_sarray)
    ((j_common_ptr) &cinfo, JPOOL_IMAGE, row_stride, 1);

  while (cinfo.output_scanline < cinfo.output_height) {
    (void) jpeg_read_scanlines(&cinfo, pJpegBuffer, 1);
    for (int x = 0; x < width; x++) {
      a = 0; // alpha value is not supported on jpg
      r = pJpegBuffer[0][cinfo.output_components * x];
      if (cinfo.output_components > 2) {
        g = pJpegBuffer[0][cinfo.output_components * x + 1];
        b = pJpegBuffer[0][cinfo.output_components * x + 2];
      } else {
        g = r;
        b = r;
      }
      *(pDummy++) = b;
      *(pDummy++) = g;
      *(pDummy++) = r;
      *(pDummy++) = a;
    }
  }
  fclose(infile);
  (void) jpeg_finish_decompress(&cinfo);
  jpeg_destroy_decompress(&cinfo);

  BMap = (int*)pTest; 
  Height = height;
  Width = width;
  Depth = 32;
}

- Peter Parker

嗨，使用libjpeg相关函数需要添加哪些头文件？ - suresh

在程序中调用此函数的示例会很有帮助。输出存储在哪里以及如何存储？实际上，此函数似乎有声明错误，并且没有返回任何内容。 - user3236841

7

对于jpeg格式，已经有一个名为 libjpeg的库，对于png则有 libpng。好消息是它们可以直接编译，因此目标机器不需要dll文件或任何其他东西。坏消息是它们是用C编写的:(

另外，不要试图自己读取文件。如果您想要一个易于阅读的格式，请使用 PPM。

- rlbond

7

他们在C语言中并不是坏消息。在C++中，使用C库比在Perl、Python、Java或C#中使用C库要容易得多。而且比尝试从C++中使用这些库要容易得多。 - Chris Lutz

我曾经为课程作业在Java中编写过一个JPEG解码器。这是一项非常艰巨的任务（而且让我告诉你，Java并没有让它变得更容易），但是它仍然让我对格式和哈夫曼编码有了很多深入的了解。尝试自己做这样的事情肯定是杀鸡焉用牛刀，除非你有非常严格的内存/速度要求，例如在编写受严重限制的嵌入式系统时。 - Daniel Kamil Kozar

4

很遗憾，JPEG格式是经过压缩的，因此在读取单个像素之前，您必须对其进行解压缩。这是一个非常复杂的任务。如果您无法使用库，则可以参考其中一个库以了解它如何解压缩图像。在sourceforge上有一个开源库：CImg on sourceforge。

- Colin

2

由于它需要曝光，我想提及另一个值得研究的库：IM Toolkit，它托管在Sourceforge上。它是跨平台的，并完全将文件格式抽象化，使图像加载和处理时不必担心大部分细节。它支持PNG和JPEG，并可通过其他导入过滤器进行扩展。

它还带有大量的图像处理运算符...

它还与Lua有良好的质量绑定。

- RBerteig

2

正如Nils所指出的，没有C或C++标准库可以用于JPEG压缩和图像处理。

如果您能够使用第三方库，您可以尝试使用支持JPEG、PNG和其他数十种格式、压缩和媒介的GDAL。

下面是一个简单的示例，演示了如何使用GDAL C++ API从JPEG文件中读取像素数据：

#include <gdal_priv.h>
#include <cassert>
#include <iostream>
#include <string>
#include <vector>

int main()
{
    GDALAllRegister(); // once per application

    // Assume 3-band image with 8-bit per pixel per channel (24-bit depth)
    std::string const file("/home/mloskot/test.jpg");

    // Open file with image data
    GDALDataset* ds = static_cast<GDALDataset*>(GDALOpen(file.c_str(), GA_ReadOnly));
    assert(0 != ds);

    // Example 1 - Read multiple bands at once, assume 8-bit depth per band
    {
        int const ncols = ds->GetRasterXSize();
        int const nrows = ds->GetRasterYSize();
        int const nbands = ds->GetRasterCount();
        int const nbpp = GDALGetDataTypeSize(GDT_Byte) / 8;
        std::vector<unsigned char> data(ncols * nrows * nbands * nbpp);

        CPLErr err = ds->RasterIO(GF_Read, 0, 0, ncols, nrows, &data[0], ncols, nrows, GDT_Byte, nbands, 0, 0, 0, 0);
        assert(CE_None == err);

        // ... use data
    }

    // Example 2 - Read first scanline by scanline of 1 band only, assume 8-bit depth per band
    {
        GDALRasterBand* band1 = ds->GetRasterBand(1);
        assert(0 != band1);

        int const ncols = band1->GetXSize();
        int const nrows = band1->GetYSize();
        int const nbpp = GDALGetDataTypeSize(GDT_Byte) / 8;
        std::vector<unsigned char> scanline(ncols * nbpp);

        for (int i = 0; i < nrows; ++i)
        {
            CPLErr err = band1->RasterIO(GF_Read, 0, 0, ncols, 1, &scanline[0], ncols, 1, GDT_Byte, 0, 0);
            assert(CE_None == err);

            // ... use scanline
        }
    }

    return 0;
}

有一份更全面的GDAL API教程可供参考。

- mloskot

1

如果速度不是问题，您可以尝试使用LodePNG，它采用非常简约的方法来加载和保存PNG文件。

或者甚至可以选择同一作者的picoPNG，它是一个自包含的PNG加载器函数。

- Gigi

1

我在使用DevIL库方面有着良好的经验。它支持广泛的图像格式，并且遵循与OpenGL非常相似的函数风格。

虽然它是一个库，但绝对值得一试。

- Daniel

1

由于其他答案已经提到您很可能需要使用库，因此请查看ImageMagick，看看是否可以实现您需要的功能。它带有各种不同的接口方式，包括几乎所有可用编程语言的库，以便与ImageMagick的核心功能进行交互。

主页：ImageMagick

- X-Istence

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Nils Pipenbrinck · Accepted Answer

在C语言标准库中没有用于读取文件格式的标准库。

然而，大多数程序尤其是在Linux平台上使用相同的库来解码图像格式：

对于jpeg格式，使用libjpeg库，对于png格式，使用libpng库。

这些库已经被安装的可能性非常高。

http://www.libpng.org

http://www.ijg.org