如何在C#中从HTML页面提取关键词?

3
基本上我想提取网页中去掉停用词后存在的关键词、单词或标记。 有人知道如何做到这一点吗?C#代码将不胜感激。

也许你应该给它打上 [c#] 的标签。 - brickner
如果您只想从网页中获取数据,可以使用 JQuery,如下所示:$('#testDIV').load('JQueryPage.aspx'); - Amr Badawy
2个回答

0
使用类似于HTML Agility Pack的HTML解析库。
一旦你用它加载了一个HTML文档,你就可以使用XPath语法查询它——它以类似于XmlDocument的方式公开HTML。

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接