我有一个包含富文本的
我不能简单地调用
我该如何提取纯文本?
(我可以接受任何方法,即使是间接的。例如:将html转换为纯文本的预定义函数)
谢谢!
规格:
python 2.7.2
PyQt4
Windows 7
QLabel
,我想从中提取实际(可见)的“文本”,而不包括格式化的代码。我需要类似于其他Qt Widgets
的'.toPlainText'
方法的函数。我不能简单地调用
.text()
并像在Get plain text from QString with HTML tags这个线程中建议的那样操纵html标签的字符串,因为返回的QString
包含所有的<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN" "http://www.w3.org/TR/REC-html40/strict.dtd">
的无意义内容。我该如何提取纯文本?
(我可以接受任何方法,即使是间接的。例如:将html转换为纯文本的预定义函数)
谢谢!
规格:
python 2.7.2
PyQt4
Windows 7
QTextCodec
是你需要的(文档在 http://developer.qt.nokia.com/doc/qt-4.8/qtextcodec.html)。 - TonyK