我有一个包含名称的向量,例如:
names <- "Jansen, A., Karel, A., Jong, A. de, Pietersen, K."
我希望按照姓名来拆分此信息。在这种情况下,我需要按.,
和后面的逗号(该名称将是典型的荷兰名称A. De Jong
)来拆分向量。
目前,我的做法是:
strsplit(names,split="\\.\\,|\\<de\\>,")
但是这也会从名称中移除
de
:[[1]]
[1] "Jansen, A" " Karel, A" " Jong, A. " " Pietersen, K."
我该如何获得以下结果?
[[1]]
[1] "Jansen, A" " Karel, A" " Jong, A. de" " Pietersen, K."
\\.,|(?<= de),
以避免包含de
的名称破坏它。 - Sacha Epskamp