使用C#从HTML tbody中提取数据

3
我是使用c# Web.Client来下载一个html字符串。
返回的html样例如下:
 <tbody class='resultBody ' id='Tbody2'>
        <tr id='Tr2' class='firstRow'>
            <td class='cbrow tier_Gold' rowspan='4'>
                <input type='checkbox' name='listingId' value='452' id='Checkbox2' />
            </td>
            <td class='resNum' rowspan='4'>
                <div class='node'>
                    B</div>
            </td>
            <td class='datarow busName' id='Td2'>

            </td>
            <td rowspan='2' class='resLinks'>
            </td>
            <td class="hoops" rowspan='2'>
            </td>
        </tr>
        <tr>
            <td class="datarow">
                <dl class="addrBlock">
                    <dd class="bizAddr">
                        123 ABC St</dd>
                    </dl>
            </td>
        </tr>
    </tbody>
    <tbody class='resultBody ' id='Tbody3'>
        <tr id='Tr3' class='firstRow'>
            <td class='cbrow tier_Gold' rowspan='4'>
                <input type='checkbox' name='listingId' value='99' id='Checkbox3' />
            </td>
            <td class='resNum' rowspan='4'>
                <div class='node'>
                    B</div>
            </td>
            <td class='datarow busName' id='Td3'>

            </td>
            <td rowspan='2' class='resLinks'>
            </td>
            <td class="hoops" rowspan='2'>
            </td>
        </tr>
        <tr>
            <td class="datarow">
                <dl class="addrBlock">
                    <dd class="bizAddr">
                        1111 Some St</dd>
                    </dl>
            </td>
        </tr>
    </tbody>

我对html的两个元素感兴趣,但我不知道最好的方法如何获取它们。请问从<input>中获取值和从元素中获取内部html的最佳方法是什么?

有任何建议都可以!

1个回答

3
  • 下载HTML Agility Pack (免费)
  • 创建一个新的HtmlDocument
  • 加载html
  • 使用DOM导航或xpath查询(SelectSingleNode等)查找元素
  • 访问您想要的元素的InerHtml

该API类似于XmlDocument,但适用于不是xhtml的html。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接