我正在尝试使用Python 3.4通过“requests”库从某些网络服务获取数据。我需要获取一个有效的XML字符串,以便使用“lxml”库进行解析。但由于某种原因,XML中的数据未正确编码:
<?xml version="1.0" encoding="utf-8"?>
<soap:Envelope xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<soap:Body>
<xmlData>
<?xml version="1.0" encoding="UTF-8"?><Response><Data& gt;<Company>... etc.
</xmlData>
</soap:Body>
</soap:Envelope>
使用以下代码:
ssession = requests.Session()
session.get(target_url)
exml = session.post(target_url, data=__xml, headers=headers)
print(exml.text)
如何在XML中提取不带符号“>”的数据?是否可以在不手动替换>
符号为其等效项的情况下实现?
<?xml ... ?>
,导致XML格式不规范。请记住,XML不是一个简单的文本文件,而是遵循标记规则的。 - Parfait