我正在使用C#中的IText7解析一个包含日语字符的PDF文件,如下所示:
public static string ExtractTextFromPDF(string filePath)
{
var pdfReader = new PdfReader(filePath);
var pdfDoc = new PdfDocument(pdfReader);
var sb = new StringBuilder();
for (int page = 1; page <= pdfDoc.GetNumberOfPages(); page++)
{
var strategy = new SimpleTextExtractionStrategy();
sb.Append(PdfTextExtractor.GetTextFromPage(pdfDoc.GetPage(page), strategy));
}
pdfDoc.Close();
pdfReader.Close();
return sb.ToString();
}
但我遇到了异常:
iText.IO.IOException:“找不到CMap iText.IO.Font.Cmap.UniJIS-UTF16-H。”
我已经搜索了如何添加此内容的解决方案,但是对于日语字符,我没有找到有效的方法。如果有其他更适合的库也可以。有什么帮助吗?
谢谢。