如何通过类名获取元素?

10

我正在尝试使用webBrowser1编写一种方法,通过href获取下载链接,但问题是我必须使用它的类名找到它。

<body>
<iframe scrolling="no" frameborder="0" allowtransparency="true" tabindex="0" name="twttrHubFrame" style="position: absolute; top: -9999em; width: 10px; height: 10px;" src="http://platform.twitter.com/widgets/hub.html">
‌¶
<div id="main">
‌¶‌→
<div id="header">
<div style="float:left;">
‌¶‌→
<div id="content">
‌¶‌→
<h1 style="background-image:url('http://static.mp3skull.com/img/bgmen.JPG'); background-repeat:repeat-x;">Rush‌·Mp3‌·Download</h1>
‌¶‌→
<a id="bitrate" onclick="document.getElementById('ofrm').submit(); return false;" rel="nofollow" href="">
<form id="ofrm" method="POST" action="">
‌¶‌→‌¶‌→‌→
<div id="song_html" class="show1">
‌¶‌→‌→‌→
<div class="left">
‌¶‌→‌→‌→
<div id="right_song">
‌¶‌→‌→‌→‌→
<div style="font-size:15px;">
‌¶‌→‌→‌→‌→
<div style="clear:both;"></div>
‌¶‌→‌→‌→‌→
<div style="float:left;">
‌¶‌→‌→‌→‌→‌→
<div style="float:left; height:27px; font-size:13px; padding-top:2px;">
‌¶‌→‌→‌→‌→‌→‌→
<div style="float:left; width:27px; text-align:center;">
‌¶‌→‌→‌→‌→‌→‌→
<div style="margin-left:8px; float:left;">
<a style="color:green;" target="_blank" rel="nofollow" href="http://dc182.4shared.com/img/1011303409/865387c9/dlink__2Fdownload_2F6QmedN8H_3Ftsid_3D20111211-54337-a79f8d10/preview.mp3">Download</a>
</div>
‌·‌¶‌→‌→‌→‌→‌→‌→
<div style="margin-left:8px; float:left;">
‌¶‌→‌→‌→‌→‌→‌→
<div style="margin-left:8px; float:left;">
‌·‌¶‌→‌→‌→‌→‌→‌→
<div style="clear:both;"></div>
‌¶‌→‌→‌→‌→‌→
</div>
‌¶‌→‌→‌→‌→‌→
<div id="player155580779" class="player" style="float:left; margin-left:10px;"></div>
‌¶‌→‌→‌→‌→
</div>
‌→‌¶‌→‌→‌→‌→
<div style="clear:both;"></div>
‌¶‌→‌→‌→
</div>
‌¶‌→‌→‌→
<div style="clear:both;"></div>
‌¶‌→‌→
</div>

我在谷歌上搜索了很久,但我只找到了PHP的例子?

我明白你应该做这样的事情

HtmlElement downloadlink = webBrowser1.Document.GetElementById("song_html").All[0];
URL = downloadlink.GetAttribute("href");

但我不理解如何使用类“show1”来做到这一点。

请给我指明正确的方向,并提供示例和/或我可以访问以便学习如何做到这一点的网站,因为我已经搜索了但毫无头绪。

编辑:我基本上需要href链接(“http://dc182.4shared.com/img/1011303409/865387c9/dlink__2Fdownload_2F6QmedN8H_3Ftsid_3D20111211-54337-a79f8d10/preview.mp3”),那么我如何获取它?


“show1”和“webBrowser1”是从哪里来的?如果您正在使用示例代码或库,请包括该信息。 - Matthew Read
show1是我上面发布的HTML代码中的类名。webBrowser1只是我通过表单访问网页时使用的工具。 - Andrew
3个回答

17

WebBrowser 控件中没有内置的方法可以通过类名来检索元素。由于您知道该元素将是一个 a 元素,所以您能做的最好的事情就是获取所有的 a 元素并搜索您想要的那个:

var links = webBrowser1.Document.GetElementsByTagName("a");
foreach (HtmlElement link in links)
{
    if (link.GetAttribute("className") == "show1")
    {
        //do something
    }
}

那么你的意思是说,通过这段代码,它会找到类名为“show1”的元素,然后我可以使用href的getattribute来检索URL? - Andrew
是的 - 它将找到所有类名为“show1”的a元素,然后您可以像以前一样使用link.GetAttribute("href")检索链接。 - BrokenGlass
由于某种原因它无法检索URL?会有任何原因吗?查看HTML后,所有内容都在一个名为“content”的id下,所以我需要先搜索它吗? < div id =“content”> 我尝试了类似这样的东西;var链接= webBrowser1.Document.GetElementById("content").Document.GetElementsByTagName("a");但是它给我一个错误。 - Andrew
你能否更新你的问题并提供包含链接的相关HTML代码? - BrokenGlass
@BrokenGlass 应该是_classname_而不是class。https://social.msdn.microsoft.com/Forums/vstudio/en-US/a22cafb7-f93c-4911-91ce-b305a54811fa/how-to-get-element-by-class-in-c - TechGeek

4

HtmlDocument的扩展方法

返回具有特定标签的元素列表,该标签与给定的className相符

它可用于仅捕获标签上的元素或仅通过类名捕获元素

internal static class Utils
{
  internal static List<HtmlElement> getElementsByTagAndClassName(this HtmlDocument doc, string tag = "", string className = "")
  {
      List<HtmlElement> lst = new List<HtmlElement>();
      bool empty_tag = String.IsNullOrEmpty(tag);
      bool empty_cn = String.IsNullOrEmpty(className);
      if (empty_tag && empty_cn) return lst;
      HtmlElementCollection elmts = empty_tag ? doc.All : doc.GetElementsByTagName(tag);
      if (empty_cn)
      {
         lst.AddRange(elmts.Cast<HtmlElement>());
         return lst;
      }
      for (int i = 0; i < elmts.Count; i++)
      {
         if (elmts[i].GetAttribute("className") == className)
         {
            lst.Add(elmts[i]);
         }
      }
      return lst;
   }
}

使用方法:

WebBrowser wb = new WebBrowser();
List<HtmlElement> lst_div = wb.Document.getElementsByTagAndClassName("div");// all div elements
List<HtmlElement> lst_err_elmnts = wb.Document.getElementsByTagAndClassName(String.Empty, "error"); // all elements with "error" class
List<HtmlElement> lst_div_err = wb.Document.getElementsByTagAndClassName("div", "error"); // all div's with "error" class

非常完美,谢谢。 - Fadi Abuzant

1

我跟进了这些答案,并制定了通过类名隐藏div的方法。

我分享给那些关心的人。

public void HideDivByClassName(WebBrowser browser, string classname)
        {
            if (browser.Document != null)
            {
                var byTagName = browser.Document.GetElementsByTagName("div");
                foreach (HtmlElement element in byTagName)
                {
                    if (element.GetAttribute("className") == classname)
                    {
                        element.Style = "display:none";
                    }
                }
            }
        }

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接