我正在尝试找出用于将文章拆分为不带标点符号的单词的正则表达式。我尝试通过空格进行拆分,但这会导致一些仍带有标点符号的单词。我还尝试了按单词字符拆分,但由于某种原因返回了一系列空字符串的数组: String[] words = line.split("\\w+");
split
的 javadoc。 - Sotirios Delimanolis