我该如何在Flutter中解析HTML?

8

我正在使用Flutter并希望使用parser.dart解析HTML。

<div class="weather-item now"><!-- now  -->
   <span class="time">Now</span>
   
    <div class="temp">19.8<span>℃</span>
        <small>(23℃)</small>
    </div>
   
   <table>
       <tr>
           <th><i class="icon01" aria-label="true"></i></th>
           <td>93%</td>
       </tr>
       <tr>
           <th><i class="icon02" aria-label="true"></i></th>
           <td>south 2.2km/h</td>
       </tr>
       <tr>
           <th><i class="icon03" aria-label="true"></i></th>
           <td>-</td>
       </tr>
   </table>
</div>

使用以下代码导入包:

import 'package:html/parser.dart';

我想获取这些数据:

现在,19.8,23,93%,南面2.2公里/小时

我该如何做?


你熟悉XPath吗?如果是的话,可以尝试使用这个库:https://pub.dev/packages/xpath - dubace
可能最简单的方法是将 .substring().indexOf() 结合使用。 - josxha
2个回答

14

由于您正在使用html包,您可以通过一些HTML解析和字符串处理(如果需要)来获取所需的数据,以下是一个Dart示例,您可以在Flutter应用程序中按原样使用parseData函数 -

main.dart

import 'package:html/parser.dart' show parse;

main(List<String> args) {
  parseData();
}

parseData(){
  var document = parse("""
    <div class="weather-item now"><!-- now  -->
   <span class="time">Now</span>
   
    <div class="temp">19.8<span></span>
        <small>(23℃)</small>
    </div>
   
   <table>
       <tr>
           <th><i class="icon01" aria-label="true"></i></th>
           <td>93%</td>
       </tr>
       <tr>
           <th><i class="icon02" aria-label="true"></i></th>
           <td>south 2.2km/h</td>
       </tr>
       <tr>
           <th><i class="icon03" aria-label="true"></i></th>
           <td>-</td>
       </tr>
   </table>
</div>
  """);

  //declaring a list of String to hold all the data.
  List<String> data = [];

  data.add(document.getElementsByClassName("time")[0].innerHtml);

  //declaring variable for temp since we will be using it multiple places
  var temp  = document.getElementsByClassName("temp")[0];
  data.add(temp.innerHtml.substring(0, temp.innerHtml.indexOf("<span>")));
  data.add(temp.getElementsByTagName("small")[0].innerHtml.replaceAll(RegExp("[(|)|℃]"), ""));

  //We can also do document.getElementsByTagName("td") but I am just being more specific here.
  var rows = document.getElementsByTagName("table")[0].getElementsByTagName("td");

  //Map elememt to its innerHtml,  because we gonna need it. 
  //Iterate over all the table-data and store it in the data list
  rows.map((e) => e.innerHtml).forEach((element) {
    if(element != "-"){
      data.add(element);
    }
  });

  //print the data to console.
  print(data);
  
}

这是样例输出 -

[Now, 19.8, 23, 93%, south 2.2km/h]
希望它有所帮助!

2

这篇文章可能会有所帮助。它特别使用了html包解析器。

按照包的readme中的示例,您可以轻松获得一个Document对象。使用这个对象,您可以使用getElementByIdgetElementsByClassNamegetElementsByTagName等方法获取DOM中特定的Element。从那里,您可以获得返回的每个ElementinnerHtml并组合输出字符串。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接