这个问题似乎很奇怪,但我需要问一下,因为当我比较文本作为图像和图形作为图像时,我看到了非常有趣的输出。
理想情况下,我正在寻找一种工具或算法来比较两个pdf文件,生成突出显示它们之间差异的输出结果。
在pdf中存在将文本转换为图像格式的可能性(将纸张上的传统文本转换为pdf)。
我们正在迁移这些传统的pdf文件,并最终将其与传统和转换后的pdf输出进行比较。
我正在评估几个工具,如Adobe dc pro、i-net pdfc和power pdf等,用于比较两个pdf文件。
在评估过程中,我能够看到图形图像在pdf的两侧得到比较(也不精确)。而文本作为图像完全被忽略,在所有工具中产生一致的结果。
但是我更感兴趣的是文本作为图像,因为我们处理更多的传统文本pdf文件。
下面附上了图形图像比较结果,它能够捕捉到图像之间的差异。 但是当我比较文本和图片时,工具没有突出显示差异。
理想情况下,我正在寻找一种工具或算法来比较两个pdf文件,生成突出显示它们之间差异的输出结果。
在pdf中存在将文本转换为图像格式的可能性(将纸张上的传统文本转换为pdf)。
我们正在迁移这些传统的pdf文件,并最终将其与传统和转换后的pdf输出进行比较。
我正在评估几个工具,如Adobe dc pro、i-net pdfc和power pdf等,用于比较两个pdf文件。
在评估过程中,我能够看到图形图像在pdf的两侧得到比较(也不精确)。而文本作为图像完全被忽略,在所有工具中产生一致的结果。
但是我更感兴趣的是文本作为图像,因为我们处理更多的传统文本pdf文件。
下面附上了图形图像比较结果,它能够捕捉到图像之间的差异。 但是当我比较文本和图片时,工具没有突出显示差异。
我理解的是,该工具没有将文本视为图像图形进行比较,而是完全忽略了比较。我希望能够澄清我的假设是否正确。
其次,我想知道如何比较PDF文件中的文本图像以生成差异?