我已经花了几天时间在互联网上研究如何从pdf文件中获取特定信息。最终,我使用Python从文本文件中提取了所有信息(通过转换成文本文件的方式,首先打开PDF文件,然后选择“文件”菜单,最后将其另存为文本文件并保存到相同目录下)。
问题是如何让Python完成这些任务。要实现这个目标,需要使用open("file path")打开PDF文件, 点击菜单中的"文件",然后将文件另存为文本文件并保存到相同目录下。
需要注意的是,我不需要pdfminer或pypdf库,因为我已经通过手动将其转换为txt格式来提取了相应信息。
问题是如何让Python完成这些任务。要实现这个目标,需要使用open("file path")打开PDF文件, 点击菜单中的"文件",然后将文件另存为文本文件并保存到相同目录下。
需要注意的是,我不需要pdfminer或pypdf库,因为我已经通过手动将其转换为txt格式来提取了相应信息。