我想提取一个大字符串的一部分内容。有一个目标词和一个单词数的上限,在目标词前后都要考虑这个上限。所以被提取的子字符串必须包含目标词以及前后的单词上限。如果目标词靠近文本的开头或结尾,则前后一部分可能包含更少的单词。
示例字符串:
"Lorem ipsum dolor sit amet,consectetur adipiscing elit,sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam,quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident,sunt in culpa qui officia deserunt mollit anim id est laborum."
目标词: laboris
前面的单词数: 5
后面的单词数: 2
应当返回:['veniam, quis nostrud exercitation ullamco laboris nisi ut']
我思考了几种可能的模式,但它们都没有起作用。我猜可以通过从目标词的前面和后面遍历字符串来完成。但是,使用正则表达式肯定会使事情变得更加容易。谢谢您的帮助。
应当返回:['veniam, quis nostrud exercitation ullamco laboris nisi ut']
我思考了几种可能的模式,但它们都没有起作用。我猜可以通过从目标词的前面和后面遍历字符串来完成。但是,使用正则表达式肯定会使事情变得更加容易。谢谢您的帮助。