我相对较新于Java,需要一些帮助来从字符串中提取多个子字符串。一个示例字符串如下:
String = "How/WRB can/MD I/PRP find/VB a/DT list/NN of/IN celebrities/NNS '/POS real/JJ names/NNS ?/."
期望的结果:
WRB MD PRP VB DT NN IN NNS POS JJ NNS
我有一个文本文件,可能有数千个类似的POS标记行,我需要从中提取POS标记并根据POS标记进行一些计算。我尝试使用分词器,但没有得到我想要的结果。我甚至尝试使用
split()
并保存到数组中,因为我需要将其存储并稍后使用,但仍然不起作用。最后,我尝试使用Pattern Matcher,并且在正则表达式方面遇到了问题,因为它返回带有斜杠的单词。
Regex: [\/](.*?)\s\b
Result: /WRB /MD ....
如果有更好的方法,请告诉我。如果有人能帮我弄清我的正则表达式有什么问题,请告诉我。
split()
函数?你是否已经进行了足够的谷歌搜索? - Amandeep Jiddewar