我很难想象和构思一种方法来抓取这个页面:http://www.morewords.com/ends-with/aw,并将其中的单词以php数组形式列出。给定一个URL,我希望获取内容,然后生成php数组,其中包含所有单词,这些单词在源代码中看起来像
<a href="/word/word1/">word1</a><br />
<a href="/word/word2/">word2</a><br />
<a href="/word/word3/">word3</a><br />
<a href="/word/word4/">word4</a><br />
我考虑了几种方法来实现这个目标,希望你能帮我决定最有效的方法。同时,我也希望能得到一些关于如何实现它的建议或示例。我知道这不是非常复杂,但我需要你这些高级黑客的帮助。
- 使用某种jquery
$.each()
循环遍历并将它们转换为JS数组,然后转录(可能会很费力) - 使用某种curl (对curl没有太多经验)
- 使用一些复杂的查找和替换正则表达式。
php.ini
中启用allow_url_fopen
。如果它被禁用了,你可以使用cURL库将HTML传递给DOMDocument
。 - alexallow_url_fopen
,请检查phpinfo()
。 - alex