我正在使用nltk,因此我想创建自己的自定义文本,就像nltk.books上的默认文本一样。但是,我只能到达类似于以下方法的步骤:
我希望找到一种将“文本”作为输入的任何方式:
my_text = ['This', 'is', 'my', 'text']
我希望找到一种将“文本”作为输入的任何方式:
my_text = "This is my text, this is a nice way to input text."
哪种方法,Python的还是nltk的可以让我做到这一点。更重要的是,我如何去除标点符号?