我正在尝试从PDF中提取一些信息。我正在尝试使用
但是我想将其写入文本文件并在perl中解析所需字段。请问有人能指导我如何做吗?
但是当我尝试在我的perl脚本中调用
CAM::PDF
模块中的getpdftext.pl
。当我运行$~ getpdftext.pl sample.pdf
时,它会将pdf的文本输出到标准输出流。但是我想将其写入文本文件并在perl中解析所需字段。请问有人能指导我如何做吗?
但是当我尝试在我的perl脚本中调用
pdftotext.pl
时,我收到了一个没有这样的文件
错误。
#从pdf中提取文本并将其保存到文本文件的程序
use PDF;
use CAM::PDF;
use CAM::PDF::PageText;
use warnings;
use IPC::System::Simple qw(system capture);
$filein = 'sample.pdf';
$fileout = 'output1.txt';
open OUT, ">$fileout" or die "error: $!";
open IN, "getpdftext.pl $filein" or die "error :$!" ;
while(<IN>)
{
print OUT $fileout;
}
open my $fo ...
为my $docstr = '';
并将print $fo $str;
更改为$docstr .= $str;
来与之一起使用,无需使用close $fo;
。 - AFresh1