使用PHP将XML转换为JSON,同时保留数组

3

我需要将一个XML文档转换为JSON格式,以便在JavaScript中轻松访问数据。目前我正在使用以下方法将XML转换为JSON:

json_encode(new SimpleXMLElement($xml, LIBXML_NOCDATA));

然而,当一个元素只包含一个子元素时,我遇到了一个问题。当使用SimpleXML解析时,它被视为对象而不是数组。我希望它们始终被视为数组,除非该元素仅包含文本。

示例:

$xml = <<<END
<xml>
  <TESTS>
    <TEST>TEXT HERE</TEST>
  </TESTS>
</xml>
END;

echo json_encode(new SimpleXMLElement($xml, LIBXML_NOCDATA));

这会输出:
{"TESTS":{"TEST":"TEXT HERE"}}

如果我在```
```下添加另一个元素,则输出结果就是我想要的:
$xml = <<<END
<xml>
  <TESTS>
    <TEST>TEXT HERE</TEST>
    <TEST>MORE TEXT HERE</TEST>
  </TESTS>
</xml>
END;

echo json_encode(new SimpleXMLElement($xml, LIBXML_NOCDATA));

输出:

{"TESTS":{"TEST":["TEXT HERE","TEXT HERE"]}}

请注意,元素被包含在JSON数组中而不是JSON对象中。是否有一种方法可以强制将元素解析为数组?

看起来您已经有了对象,但在第一种情况下,该元素的值是字符串,而在第二种情况下是数组。 - Andrej
我认为你需要遍历XML并手动转换为数组。即使有一种方法可以强制使用数组而不是对象,但第一个示例最终的JSON格式将是这样的:{"Tests":[{"Test":["Text HERE"]}]}. 我认为这并不是你真正想要的。 - Tim Gautier
你正在传递一个 simplexml 类的对象...当然你会从 json_encode 中得到一个对象。 - Marc B
@Marc B 我认为原帖作者正在寻找类似于JSON_FORCE_OBJECT选项的数组对应项。 - brian_d
似乎你的第二个例子 - SimpleXMLElement 退而使用数组来表示 <TEST> 节点 - 只是因为没有其他选择。在同一个对象中,你不能有两个名为 TEST 的属性。所以 SimpleXML 绝望地使用了一个数组。如果只有一个项目,那就不会发生这种情况。所以你可能需要自己拆分 XML,正如其他评论者已经说过的那样。 - hashchange
一个相关的问答展示了如何使用JsonSerializeable接口和SimpleXMLElement来实现这个功能:“PHP将XML转换为JSON时,当只有一个子元素时进行分组”:http://stackoverflow.com/a/16938322/367456 - hakre
2个回答

2

我曾经也遇到过同样的问题。以下是一个快速的解决方案,适用于你的示例。

class JsonWithArrays
{
    protected $root, $callback;

    public function __construct( SimpleXMLElement $root )
    {
        $this->root = $root;
    }

    /**
     * Set a callback to return if a node should be represented as an array
     * under any circumstances.
     *
     * The callback receives two parameters to react to: the SimpleXMLNode in
     * question, and the nesting level of that node.
     */
    public function use_callback_forcing_array ( $callback )
    {
        $this->callback = $callback;
        return $this;
    }

    public function to_json ()
    {
        $transformed = $this->transform_subnodes( $this->root, new stdClass(), 0 );
        return json_encode( $transformed );
    }

    protected function transform_subnodes ( SimpleXMLElement $parent, stdClass $transformed_parent, $nesting_level )
    {
        $nesting_level++;

        foreach( $parent->children() as $node )
        {
            $name = $node->getName();
            $value = (string) $node;

            if ( count( $node->children() ) > 0 )
            {
                $transformed_parent->$name = new stdClass();
                $this->transform_subnodes( $node, $transformed_parent->$name, $nesting_level );
            }
            elseif ( count( $parent->$name ) > 1 or $this->force_array( $node, $nesting_level ) )
            {
                $transformed_parent->{$name}[] = $value;
            }
            else
            {
                $transformed_parent->$name = $value;
            }
        }

        return $transformed_parent;
    }

    protected function force_array ( $node, $nesting_level )
    {
        if ( is_callable( $this->callback ) )
        {
            return call_user_func( $this->callback, $node, $nesting_level );
        }
        else
        {
            return false;
        }
    }
}

$xml = <<<END
<xml> 
  <TESTS> 
    <TEST>TEXT HERE</TEST> 
  </TESTS> 
</xml> 
END;

$xml2 = <<<END
<xml> 
  <TESTS> 
    <TEST>TEXT HERE</TEST> 
    <TEST>MORE TEXT HERE</TEST> 
  </TESTS> 
</xml> 
END;

// Callback using the node name. Could just as well be done using the nesting
// level.
function cb_testnode_as_array( SimpleXMLElement $node, $nesting_level )
{
    return $node->getName() == 'TEST';
}

$transform = new JsonWithArrays( new SimpleXMLElement($xml, LIBXML_NOCDATA) );
echo $transform
    ->use_callback_forcing_array( 'cb_testnode_as_array' )
    ->to_json();

echo PHP_EOL;

$transform2 = new JsonWithArrays( new SimpleXMLElement($xml2, LIBXML_NOCDATA) );
echo $transform2
    ->use_callback_forcing_array( 'cb_testnode_as_array' )
    ->to_json();

0
echo json_encode(json_decode(json_encode(new SimpleXMLElement($xml, LIBXML_NOCDATA)), true));

其实这很愚蠢,但你首先要将其转换为对象,然后解码成数组,并像数组样式一样转换为JSON。))


尝试过了,但没有成功。返回的结果是 {"TESTS":{"TEST":"这里是文本"}},就像OP发布的代码一样。 - hashchange

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接