使用PHP,如何从HTML页面中解析标题和元标记?

3

可能是重复的问题:
CodeIgniter:一个帮助从网页获取元标记的类/库?

我需要能够从一个页面中获取标题和描述的元标记。

我一直在尝试这样做,但实际结果比错误还多。(我有一个包含大约10个URL的数组,通常只有其中约2个会给我描述。我还没有得到标题)。

那么,在PHP中,我该如何从远程页面获取Desc和Title,如果没有或出现错误,如何忽略它们?

- Dylan


复制链接:http://stackoverflow.com/questions/2273555/codeigniter-a-class-library-to-help-get-meta-tags-from-a-web-page - webbiedave
+1 如果你不尝试使用正则表达式来解决这个问题,Stack Overflow 会感谢你的 :) - Neil Aitken
1个回答

1
使用类似cURL的工具(检查结果不是false并且HTTP状态为200)获取页面,然后使用Simple HTML DOM解析它并提取所需元素。(记住元素可能不存在)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接