我正在研究通过OCR从图像中读取文本的技术。它只支持TIFF格式的图像。
因此,我需要将其他格式转换为TIFF格式。这可行吗?请提供一些参考资料来帮助我。
我正在研究通过OCR从图像中读取文本的技术。它只支持TIFF格式的图像。
因此,我需要将其他格式转换为TIFF格式。这可行吗?请提供一些参考资料来帮助我。
Image
对象,您可以将其保存为TIFF格式。这是您可以使用的众多ImageFormat之一。var png = Image.FromFile("some.png");
png.Save("a.tiff", ImageFormat.Tiff);
你需要在项目中包含System.Drawing
程序集。该程序集将为您提供许多图像处理功能。希望这有所帮助。
Image::Save
有多个重载函数,可以让你针对编码器参数进行具体设置。我不是 TIFF 格式的专家,但你可以在这里找到一些有用的细节:https://msdn.microsoft.com/zh-cn/library/system.drawing.imaging.encoderparameter(v=vs.110).aspx - Jacob简介:
- 这篇回答涵盖了一个赏金问题:我们如何将多个文件转换为一个tiff?例如,假设我们有pdf、jpeg和png文件,我想把它们合成一个tiff文件?
- 在本答案中,我使用了.net实现的ImageMagick图像处理工具和Ghostscript,以帮助读取AI/EPS/PDF/PS文件,使其能够转换成图像文件。两者都是可靠的官方来源。
- 在回答这个问题后,我收到了一些额外的电子邮件提问其他合并选项,因此我扩展了我的答案。
我认为您需要以下两个步骤来达到目标:
如果您只打算转换其他图像格式的文件,请跳过第1步。
要将pdf转换为任何图像格式,我们需要一个可以读取pdf文件的库,还需要一个将其转换为图像类型的工具。为此,我们需要安装Ghostscript(GNU Affero通用公共许可证)。
接下来,我们需要安装在Visual Studio中使用的Magick.NET库,可以通过nuget链接进行下载。
到这里已经很好了。
第二步也是最后一步,我们需要从文件夹位置读取文件(png、jpg、bmp、pdf等),并将每个文件添加到MagickImageCollection
中,然后我们有几个选项可以合并使用AppendHorizontally
,AppendVertically
,Montage
或 多页的tiff。ImageMagick有大量的功能,如调整大小,分辨率等,这只是演示合并功能的例子:
public static void MergeImage(string src, string dest, MergeType type = MergeType.MultiplePage)
{
var files = new DirectoryInfo(src).GetFiles();
using (var images = new MagickImageCollection())
{
foreach (var file in files)
{
var image = new MagickImage(file)
{
Format = MagickFormat.Tif,
Depth = 8,
};
images.Add(image);
}
switch (type)
{
case MergeType.Vertical:
using (var result = images.AppendVertically())
{
result.AdaptiveResize(new MagickGeometry(){Height = 600, Width = 800});
result.Write(dest);
}
break;
case MergeType.Horizontal:
using (var result = images.AppendHorizontally())
{
result.AdaptiveResize(new MagickGeometry(){Height = 600, Width = 800});
result.Write(dest);
}
break;
case MergeType.Montage:
var settings = new MontageSettings
{
BackgroundColor = new MagickColor("#FFF"),
Geometry = new MagickGeometry("1x1<")
};
using (var result = images.Montage(settings))
{
result.Write(dest);
}
break;
case MergeType.MultiplePage:
images.Write(dest);
break;
default:
throw new ArgumentOutOfRangeException(nameof(type), type, "Un-support choice");
}
images.Dispose();
}
}
public enum MergeType
{
MultiplePage,
Vertical,
Horizontal,
Montage
}
运行代码
public static void Main(string[] args)
{
var src = @"C:\temp\Images";
var dest1 = @"C:\temp\Output\MultiplePage.tiff";
var dest2 = @"C:\temp\Output\Vertical.tiff";
var dest3 = @"C:\temp\Output\Horizontal.tiff";
var dest4 = @"C:\temp\Output\Montage.tiff";
MergeImage(src, dest1);
MergeImage(src, dest2, MergeType.Vertical);
MergeImage(src, dest3, MergeType.Horizontal);
MergeImage(src, dest4, MergeType.Montage);
}
这里有4个输入文件在C:\temp\Images目录下:
运行代码后,我们在C:\temp\Output下得到了4个新文件,分别如下:
最后说明:
- 使用System.Drawing;和System.Drawing.Imaging;可以将多个图像合并成Tiff,而不需要使用ImageMagick。但将PDF转换为图像需要第三方的转换库或工具,因此我使用C#的Ghostscript和ImageMagick。
- ImageMagick有许多功能,因此您可以更改分辨率、输出文件的大小等。它是一个公认的库。
免责声明:本答案的一部分摘自我的个人网站https://itbackyard.com/how-to-convert-ai-eps-pdf-ps-to-image-file/,并提供了源代码到Github。
private void btn_Convert(object sender, EventArgs e)
{
string newName = System.IO.Path.GetFileNameWithoutExtension(CurrentFile);
newName = newName + ".tif";
try
{
img.Save(newName, ImageFormat.Tiff);
}
catch (Exception ex)
{
string error = ee.Message.ToString();
MessageBox.Show(MessageBoxIcon.Error);
}
textBox2.Text = System.IO.Path.GetFullPath(newName.ToString());
}
我已经测试了jpg、bmp、png和gif格式,可以用于单页和多页tiff文件的创建。请传入完整的文件路径。希望这能帮助到某些人。(摘自MSDN)
public static string[] ConvertJpegToTiff(string[] fileNames, bool isMultipage)
{
EncoderParameters encoderParams = new EncoderParameters(1);
ImageCodecInfo tiffCodecInfo = ImageCodecInfo.GetImageEncoders()
.First(ie => ie.MimeType == "image/tiff");
string[] tiffPaths = null;
if (isMultipage)
{
tiffPaths = new string[1];
System.Drawing.Image tiffImg = null;
try
{
for (int i = 0; i < fileNames.Length; i++)
{
if (i == 0)
{
tiffPaths[i] = String.Format("{0}\\{1}.tif",
Path.GetDirectoryName(fileNames[i]),
Path.GetFileNameWithoutExtension(fileNames[i]));
// Initialize the first frame of multipage tiff.
tiffImg = System.Drawing.Image.FromFile(fileNames[i]);
encoderParams.Param[0] = new EncoderParameter(
System.Drawing.Imaging.Encoder.SaveFlag, (long)EncoderValue.MultiFrame);
tiffImg.Save(tiffPaths[i], tiffCodecInfo, encoderParams);
}
else
{
// Add additional frames.
encoderParams.Param[0] = new EncoderParameter(
System.Drawing.Imaging.Encoder.SaveFlag, (long)EncoderValue.FrameDimensionPage);
using (System.Drawing.Image frame = System.Drawing.Image.FromFile(fileNames[i]))
{
tiffImg.SaveAdd(frame, encoderParams);
}
}
if (i == fileNames.Length - 1)
{
// When it is the last frame, flush the resources and closing.
encoderParams.Param[0] = new EncoderParameter(
System.Drawing.Imaging.Encoder.SaveFlag, (long)EncoderValue.Flush);
tiffImg.SaveAdd(encoderParams);
}
}
}
finally
{
if (tiffImg != null)
{
tiffImg.Dispose();
tiffImg = null;
}
}
}
else
{
tiffPaths = new string[fileNames.Length];
for (int i = 0; i < fileNames.Length; i++)
{
tiffPaths[i] = String.Format("{0}\\{1}.tif",
Path.GetDirectoryName(fileNames[i]),
Path.GetFileNameWithoutExtension(fileNames[i]));
// Save as individual tiff files.
using (System.Drawing.Image tiffImg = System.Drawing.Image.FromFile(fileNames[i]))
{
tiffImg.Save(tiffPaths[i], ImageFormat.Tiff);
}
}
}
return tiffPaths;
}
Stream
会怎样呢? - Alex Gordonconvert image.suffix -compress XXX image.tiff
mogrify -format tiff -path path/to/output_directory *
convert image1.suffix1 image2.suffix2 ... -compress XXX imageN.suffixN output.tiff
您可以选择多种压缩格式或不进行压缩。
请参见
https://imagemagick.org/script/command-line-processing.php
https://imagemagick.org/Usage/basics/
https://imagemagick.org/Usage/basics/#mogrify
https://imagemagick.org/script/command-line-options.php#compress
或者您可以使用Magick.Net进行C#接口。请参见https://github.com/dlemstra/Magick.NET。
主要的ImageMagick页面在https://imagemagick.org。
支持的格式在https://imagemagick.org/script/formats.php中列出。
您可以轻松地处理图像,将它们调整大小,转换为灰度,过滤(锐化),阈值等,都在同一命令行中。
请参见
using System.Drawing;
using System.Drawing.Drawing2D;
using System.Drawing.Imaging;
public byte[] ConvertImageToTiff(byte[] SourceImage)
{
//create a new byte array
byte[] bin = new byte[0];
//check if there is data
if (SourceImage == null || SourceImage.Length == 0)
{
return bin;
}
//convert the byte array to a bitmap
Bitmap NewImage;
using (MemoryStream ms = new MemoryStream(SourceImage))
{
NewImage = new Bitmap(ms);
}
//set some properties
Bitmap TempImage = new Bitmap(NewImage.Width, NewImage.Height);
using (Graphics g = Graphics.FromImage(TempImage))
{
g.CompositingMode = CompositingMode.SourceCopy;
g.CompositingQuality = CompositingQuality.HighQuality;
g.SmoothingMode = SmoothingMode.HighQuality;
g.InterpolationMode = InterpolationMode.HighQualityBicubic;
g.PixelOffsetMode = PixelOffsetMode.HighQuality;
g.DrawImage(NewImage, 0, 0, NewImage.Width, NewImage.Height);
}
NewImage = TempImage;
//save the image to a stream
using (MemoryStream ms = new MemoryStream())
{
EncoderParameters encoderParameters = new EncoderParameters(1);
encoderParameters.Param[0] = new EncoderParameter(Encoder.Quality, 80L);
NewImage.Save(ms, GetEncoderInfo("image/tiff"), encoderParameters);
bin = ms.ToArray();
}
//cleanup
NewImage.Dispose();
TempImage.Dispose();
//return data
return bin;
}
//get the correct encoder info
public ImageCodecInfo GetEncoderInfo(string MimeType)
{
ImageCodecInfo[] encoders = ImageCodecInfo.GetImageEncoders();
for (int j = 0; j < encoders.Length; ++j)
{
if (encoders[j].MimeType.ToLower() == MimeType.ToLower())
return encoders[j];
}
return null;
}
To test
var oldImage = File.ReadAllBytes(Server.MapPath("OldImage.jpg"));
var newImage = ConvertImageToTiff(oldImage);
File.WriteAllBytes(Server.MapPath("NewImage.tiff"), newImage);