我正在开发一款应用程序,它可以显示黄金价格并生成相关的图表。我发现了一个提供黄金价格信息的网站,它会定期更新此信息。我的问题是如何从 HTML 页面中提取特定的数值。
以下是需要提取的链接:http://www.todaysgoldrate.co.in/todays-gold-rate-in-pune/,该网页包含以下标签和内容。
感谢您提前阅读……
以下是需要提取的链接:http://www.todaysgoldrate.co.in/todays-gold-rate-in-pune/,该网页包含以下标签和内容。
<p><em>10 gram gold Rate in pune = Rs.31150.00</em></p>
这是我用于提取信息的代码,但我没有找到提取特定内容的方法。
public class URLExtractor {
private static class HTMLPaserCallBack extends HTMLEditorKit.ParserCallback {
private Set<String> urls;
public HTMLPaserCallBack() {
urls = new LinkedHashSet<String>();
}
public Set<String> getUrls() {
return urls;
}
@Override
public void handleSimpleTag(Tag t, MutableAttributeSet a, int pos) {
handleTag(t, a, pos);
}
@Override
public void handleStartTag(Tag t, MutableAttributeSet a, int pos) {
handleTag(t, a, pos);
}
private void handleTag(Tag t, MutableAttributeSet a, int pos) {
if (t == Tag.A) {
Object href = a.getAttribute(HTML.Attribute.HREF);
if (href != null) {
String url = href.toString();
if (!urls.contains(url)) {
urls.add(url);
}
}
}
}
}
public static void main(String[] args) throws IOException {
InputStream is = null;
try {
String u = "http://www.todaysgoldrate.co.in/todays-gold-rate-in-pune/";
//Here i need to extract this content by tag wise or content wise....
感谢您提前阅读……