Perl:将编辑过的字段保存到同一XML文件中

4
我刚开始使用Perl一周,我是一个编程新手。麻烦帮忙,因为我的公司项目依赖于它。 情况: 我想打开一个XML文件,在这个例子中是Library.xml,并使用特定的“ISBN”号编辑XML文档。当找到ISBN号后,我想根据匹配的“ISBN”号更改特定书籍的页数。 问题: 现在,我可以做到上面那一点,但是我需要以相同的名称“library.xml”保存更新后的XML,同时保持原始XML文档的XML结构。这就是我被卡住的地方。我已经尝试过XML::DUMPER、XML::TWIG和其他许多方法,但都失败了。 原始的XML文档: library.XML看起来像这样:
<library>
  <book>
    <title>Perl Best Practices</title>
    <author>Damian Conway</author>
    <isbn>0596001738</isbn>
    <pages>542</pages>
    <image src="http://www.oreilly.com/catalog/covers/perlbp.s.gif"
           width="145" height="190" />
  </book>
  <book>
    <title>Perl Cookbook, Second Edition</title>
    <author>Tom Christiansen</author>
    <author>Nathan Torkington</author>
    <isbn>0596003137</isbn>
    <pages>964</pages>
    <image src="http://www.oreilly.com/catalog/covers/perlckbk2.s.gif"
           width="145" height="190" />
  </book>
  <book>
    <title>Guitar for Dummies</title>
    <author>Mark Phillips</author>
    <author>John Chappell</author>
    <isbn>076455106X</isbn>
    <pages>392</pages>
    <image src="http://media.wiley.com/product_data/coverImage/6X/07645510/076455106X.jpg"
         width="100" height="125" />
  </book>
</library> 

代码:

以下是我试图操作但没有成功的代码。

#!/usr/bin/perl

use strict;
use warnings;
#use XML::Simple qw(:strict);

use XML::LibXML;
use XML::Dumper;

my $dump = new XML::Dumper;

my $perl = ' ';
my $xml  = $dump->pl2xml( $perl );

my $filename = 'library.xml';

my $isbn   = '0596001738';

my $parser = XML::LibXML->new();
my $doc    = $parser->parse_file($filename);

my $query  = "//book[isbn = '$isbn']/pages/text()";

my($node)  = $doc->findnodes($query);
$node->setData('99999');

$perl = $doc->toString;

$xml = $dump->pl2xml( $perl, "library.xml" ); 

print $doc->toString;

输出结果:

以下是我的输出结果。输出结果与原始的XML文档不相似。

<perldata>
<scalar>&lt;xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;&gt;
&lt;library&gt;
  &lt;book&gt;
    &lt;title&gt;Perl Best Practices&lt;/title&gt;
    &lt;author&gt;Damian Conway&lt;/author&gt;
    &lt;isbn&gt;0596001738&lt;/isbn&gt;
    &lt;pages&gt;99999&lt;/pages&gt;
    &lt;image src=&quot;http://www.oreilly.com/catalog/covers/perlbp.s.gif&quot; width=&quot;145&quot; height=&quot;190&quot;/&gt;
  &lt;/book&gt;
  &lt;book&gt;
    &lt;title&gt;Perl Cookbook, Second Edition&lt;/title&gt;
    &lt;author&gt;Tom Christiansen&lt;/author&gt;
    &lt;author&gt;Nathan Torkington&lt;/author&gt;
    &lt;isbn&gt;0596003137&lt;/isbn&gt;
    &lt;pages&gt;964&lt;/pages&gt;
    &lt;image src=&quot;http://www.oreilly.com/catalog/covers/perlckbk2.s.gif&quot; width=&quot;145&quot; height=&quot;190&quot;/&gt;
  &lt;/book&gt;
  &lt;book&gt;
    &lt;title&gt;Guitar for Dummies&lt;/title&gt;
    &lt;author&gt;Mark Phillips&lt;/author&gt;
    &lt;author&gt;John Chappell&lt;/author&gt;
    &lt;isbn&gt;076455106X&lt;/isbn&gt;
    &lt;pages&gt;392&lt;/pages&gt;
    &lt;image  src=&quot;http://media.wiley.com/product_data/coverImage/6X/07645510/076455106X.jpg&quot;  width=&quot;100&quot; height=&quot;125&quot;/&gt;
  &lt;/book&gt;
&lt;/library&gt;
  </scalar>
</perldata>

这篇文章应该会对你有所帮助:[http://stackoverflow.com/questions/10239920/using-perl-xmlsax-to-modify-xml-documents/10241803#10241803]。 - tuxuday
我很好奇你在做什么工作,需要一份Perl书籍清单。 :) - brian d foy
2个回答

9
你在没有充分理由的情况下混合了XML模块。编程的第一步是理解自己在做什么,你不能只是随意拼凑代码,并期望它能像你想的那样工作。
删除程序中的18行后,代码如下所示,可以正常工作:
#!/usr/bin/perl
use strict;
use warnings;
use XML::LibXML;

my $filename = 'library.xml';
my $isbn   = '0596001738';

my $parser = XML::LibXML->new();
my $doc    = $parser->parse_file($filename);
my $query  = "//book[isbn = '$isbn']/pages/text()";
my($node)  = $doc->findnodes($query);
$node->setData('99999');
print $doc->toString;

唯一缺少的是将更改后的文档写回文件中:
$doc->toFile('library.xml');

感谢您的建议。我成功地完成了任务。我会采纳您的建议,学习Perl。再次感谢。 - Aaron Xavier

7
一个 XML::Twig 的解决方案:
#!/usr/bin/perl

use strict;
use warnings;

use XML::Twig;

# That's probably not how you get the data
my %isbn_to_pages= ( '0596001738' => 999, 
                     '076455106X' => 123,
                   );

XML::Twig->new( twig_handlers => { book => \&book },
                keep_spaces => 1,
              )
            # the second argument creates a backup file book_data.xml.bak
          ->parsefile_inplace( 'book_data.xml', '.bak'); 


sub book
  { my( $t, $book)= @_;
    my $isbn= $book->field( 'isbn');
    if( my $pages= $isbn_to_pages{$isbn})
      { $_->first_child( 'pages')->set_text( $pages); }
    $t->flush;
  }

该解决方案能够保存文件。请问,以上哪个命令实际上打开了原始的XML文件?感谢您的帮助... - Aaron Xavier
从文档中:parsefile_inplace 解析并原地更新文件。它通过创建一个临时文件,将其选为print()语句(和方法)的默认文件,然后解析输入文件来实现这一点。如果解析成功,则将临时文件移动以替换输入文件。 - mirod

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接