我正在尝试将我的爬虫结果存储到CSV文件中。
当前的CSV文件给出了以下输出:
Name of Movie 1
Rating 1
Name of Movie 2
Rating 2
我希望获得以下输出:
Name of Movie 1 Rating 1
Name of Movie 2 Rating 2
这是我的代码,我猜它需要处理行/列分隔符:
require 'open-uri'
require 'nokogiri'
require 'csv'
array = []
for i in 1..10
url = "http://www.allocine.fr/film/meilleurs//?page=#{i}"
html_file = open(url).read
html_doc = Nokogiri::HTML(html_file)
html_doc.search('.img_side_content').each do |element|
array << element.search('.no_underline').inner_text
element.search('.note').each do |data|
array << data.inner_text
end
end
end
puts array
csv_options = { row_sep: ',', force_quotes: true, quote_char: '"' }
filepath = 'allocine.csv'
CSV.open(filepath, 'wb', csv_options) do |csv|
array.each { |item| csv << [item] }
end
Coco,4.1,4.6
? - fongfan999