我正在尝试创建一个XPath查询,每次获取549个字符的文本。文本应该是关于相关主题的,例如下面的例子中是
oranges
或apples
或pears
。如果页面上不存在包含这些单词的元素,则我希望XPath查询在页面上查找更容易定位/不太具体的文本。
因此,为了澄清,我正在尝试创建一个XPath查询,以查找包含特定类型文本的元素,如果使用以下查询找到549个或更多字符,则完成,如果未找到任何字符或返回的文本少于549个字符,则我希望XPath查询获取页面上任何段落形式的文本(除了按钮、链接、菜单等文本),并返回这个文本的549个字符,如果结果字符串少于549个字符,则我希望将这两个查询用以下内容连接起来:...
。
substring(normalize-space(//*[self::p or self::div][contains(text(),'apples') or contains(text(),'oranges') or contains(text(),'pears')]), 0, 549)
我已经尝试解决这个问题很长一段时间了,如果你有任何建议,我将不胜感激!
非常感谢您提前的帮助!