我正在尝试读取一个文件,并将每个"a ... a"替换为'\footnotemark'。
with open('myfile', 'r') as myfile:
data = myfile.read()
data = re.sub('<a.+?</a>', '\footnotemark', data)
不知道为什么 Python 总是把 '\footnotemark' 转化成 '\x0cootnotemark' ('\f' 转化成 '\x0c')。我尝试了以下方法:
- 转义:'{2 Backslashes}footnotemark'
- 原生字符串:r'\footnotemark' 或 r'"\footnotemark"'
但这些都没有起作用。
示例输入:
foo<a href="anything">asdasd</a> bar
例子输出:
foo\footnotemark bar
\\footnotemark
。 - enzian\footnotemark
是一个 LATEX 命令,因此必须这样写。 - enzianr'\\footnotemark'
是所需的字符串;或者:'\\\\footnotemark'
。这是因为需要两级转义,一级是Python本身,一级是正则表达式语法。另外,\f
是换页符控制字符。 - PM 2Ring