我有一个文本文件,想在 R 中获取 "abstract" 和 "keywords" 之间的文本。以下是我使用的代码:
gsub(".*abstract\\s*|keywords.*", "\\1", string)
然而,这并没有奏效,因为在文本中其他地方出现了单词“abstract”,所以我将其改为非贪婪模式,如下(在“abstract”前面添加了?)。
gsub(".*?abstract\\s*|keywords.*", "\\1", string)
但出于某种原因,现在它获取了“摘要”和“关键词”之间的文本(这是我想要的),但同时也获取了从文本中第二个“摘要”开始的文本,一直到结束。 有什么建议吗?