http://www.example.com/books?_pop=mheader
如何编写正则表达式以匹配此URL和任何具有“books”作为模式匹配之一的URL?此站点具有图书类别和各种其他子类别。如何遍历所有书籍URL进行搜索?
require 'anemone'
Pattern = %r[(\/books)*]
Anemone.crawl("http://www.example.com/") do |anemone|
anemone.on_pages_like(Pattern) do |page|
puts page.url
end
end
%r[...]
,那么你就不需要在斜杠上加反斜杠。另外请注意,像你的模式这样的常量应该是ALL_CAPS
,而类应该是MixedCase
。 - tadman