RUBY Nokogiri CSS HTML解析

5
我在尝试输出以下代码的数据格式时遇到了一些问题。我想要的格式如下:
CCC1-$5.00 CCC1-$10.00 CCC1-$15.00 CCC2-$7.00
其中$7属于CCC2,其他都属于CCC1,但是我只能以以下格式获取数据:
CCC1-$5.00 CCC1-$10.00 CCC1-$15.00 CCC1-$7.00 CCC2-$5.00 CCC2-$10.00 CCC2-$15.00 CCC2-$7.00
如果有任何帮助将不胜感激。
require 'rubygems'  
require 'nokogiri'  
require 'open-uri'

doc = Nokogiri::HTML.parse(<<-eohtml)
<div class="AAA">
    <table cellspacing="0" cellpadding="0" border="0" summary="sum">
        <tbody>
            <tr>
                <td class="BBB">
                    <span class="CCC">CCC1</span>
                </td>
                <td class="DDD">
                    <table cellspacing="0" cellpadding="0" border="0">
                        <tbody>
                            <tr><td class="FFF">$5.00</td></tr>
                            <tr><td class="FFF">$10.00</td></tr>
                            <tr><td class="FFF">$15.00</td></tr>
                        </tbody>
                    </table>
                </td>
            </tr>
        </tbody>
    </table>
    <table cellspacing="0" cellpadding="0" border="0" summary="sum">
        <tbody>
            <tr>
                <td class="BBB">
                    <span class="CCC">CCC2</span>
                </td>
                <td class="DDD">
                    <table cellspacing="0" cellpadding="0" border="0">
                         <tbody>
                             <tr><td class="FFF">$7.00</td></tr>
                         </tbody>
                    </table>
                </td>
            </tr>
        </tbody>
    </table>
</div>
eohtml

doc.css('td.BBB > span.CCC').each do |something|
    doc.css('tr > td.EEE,  tr > td.FFF').each do |something_more|
        puts something.content + '-'+ something_more.content
    end
end
1个回答

4
这个怎么样?
doc.css('td.BBB > span.CCC').each do |something|
    something.parent.parent.css('tr > td.EEE,  tr > td.FFF').each do |something_more|
        puts something.content + '-'+ something_more.content
    end
end

你能说一下 'td.BBB > span.CCC' 的含义吗?文档在哪里? - Arup Rakshit
在CSS语法中,'>'被解释为选择器。详见https://dev59.com/M2855IYBdhLWcg3wPBtx。 - vaichidrewar

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接