我正在编写一个从亚马逊提取产品数据的程序,但我不确定如何规范化HTML中的空格。
fn parse_html(html: std::string::String) {
let fragment = Html::parse_fragment(&html);
let product_title = Selector::parse(".s-line-clamp-2").unwrap();
for title in fragment.select(&product_title) {
let title_txt = title.text().collect::<Vec<_>>();
println!("{:?}", title_txt);
}
}
这段代码可以正常运行,但获取到的数据会像这样:["\n \n \n \n\n\n\n\n", "\n \n \n \n ", "男士运动鞋", "\n \n \n \n \n", "\n\n \n"]
我只需要这个:["男士运动鞋"]