我正在尝试通过一个有趣的项目来学习Python - 一个Facebook消息分析器。我已经从Facebook下载了我的数据,其中包括一组html文件。其中之一 - messages.htm - 包含了我所有的消息记录。我的目标是将这个html文件解析出来,输出一些有趣的数据,比如最常见的词汇、消息数量等。
问题在于,我的messages.htm文件大小为270MB。我可以在vim中检查它,但是文件中有一些有趣的模式,我想将HTML代码与在浏览器上正确呈现的内容进行比较,以便将代码与视觉效果进行比较,更好地了解正在发生的事情。但是当我尝试在Firefox中打开此文件时,Firefox会崩溃。我可以在Chrome中打开它,但它只是开始加载所有的消息记录,并且即使滚动条非常小,10分钟后它仍然没有完全加载一个单独的消息线程。因此,这是不可行的。
这种大型和长时间的HTML文件是否能够完全呈现?
问题在于,我的messages.htm文件大小为270MB。我可以在vim中检查它,但是文件中有一些有趣的模式,我想将HTML代码与在浏览器上正确呈现的内容进行比较,以便将代码与视觉效果进行比较,更好地了解正在发生的事情。但是当我尝试在Firefox中打开此文件时,Firefox会崩溃。我可以在Chrome中打开它,但它只是开始加载所有的消息记录,并且即使滚动条非常小,10分钟后它仍然没有完全加载一个单独的消息线程。因此,这是不可行的。
这种大型和长时间的HTML文件是否能够完全呈现?