我正在编写一个程序,它会打开一个网页,并且需要检测该页面具有多少个导航(菜单),主导航有多长(有多少元素),以及导航元素的平均文本长度等...
无论如何,我在检测菜单方面遇到了一些问题。我认为 web 导航有两种编码方式:
1. <ul><li><a>Home</a><li><a>Products</a></li>...</ul>
2. <div><a>Home</a><a>Product</a>...</div>
如果我发现这种结构,我就知道(或者说“我认为”)它是导航。但这并不是绝对可靠的。我会得到很多错误结果。
那么有没有更好的方法来检测网页上的导航呢?