我正在尝试解析一个HTML片段以检索所需的一些数据。我在SO上尝试查找,但找不到一个可以通过筛选某些内容并获取其他内容的解决方案。
我不需要获取所有HTML标签或清除整个页面。我只想改进我的已经可用的正则表达式。
该页面有200行,我真的想要检索一个隐藏字段(换行只是为了更易读):
我不需要获取所有HTML标签或清除整个页面。我只想改进我的已经可用的正则表达式。
该页面有200行,我真的想要检索一个隐藏字段(换行只是为了更易读):
<!-- ...long list of html tags and hidden fields... -->
<input type="hidden"
name="javax.faces.ViewState"
id="javax.faces.ViewState"
value="valueIwant"
autocomplete="off" />
<!-- ...more html... -->
我需要通过名称或ID从名为javax.faces.ViewState
的元素中检索value
属性。
我最终得到了以下代码:
string value = Regex.Match(html, "<input[^>]*name=\"(javax.faces.ViewState)\"[^>]*>");
这成功地找到了确切的标签,但是将其全部检索出来。我真正想要的是改进这个 Regex
,只返回 value
属性的内容。
我不想通过进行 Substring
调用来解决这个问题,因为我不知道这个内容的确切大小。