我希望学习一种文本操作语言,我已经确定了Python。除了文本操作外,Python还用于数字应用、机器学习、人工智能等方面。
我的问题是,我如何学习Python语言,以便能够快速编写复杂的文本操作工具?除了在“文本操作”上下文中的“正则表达式”之外,哪些语言特性比其他特性更重要,哪些模块是有用的等等。
除了正则表达式之外,以下是一些重要的功能:
对于工具,我建议看看以下内容:
Ned Batcheldor的各种Python解析工具评论。
Docutils源代码用于在Python中执行更高级的文本处理,包括复杂的状态机。
编辑: 一些特定于Python文本处理的好链接:
a = "test,test,test"
我能用dir(a)做什么?看起来我可以分割a。
vec = a.split (",")
什么是vec?vec.__doc__:
“从序列的项中初始化的新列表”
我可以用vec做什么?dir(vec)。
vec.sort ()
等等...