以下是数据样例:
每个字符串要么有大写和小写部分,要么全是大写。我一直在尝试使用正则表达式来提取字符串中仅有的大写部分,但是一直没有成功。目前我只能识别一个字符串以特定数量的大写字符开头或结尾:
我也尝试了下面这个方法,它来自论坛中的另一个问题:
part1
"Cambridge, Maryland TEST MODEL SEADROME"
"L.B. MAYER HONORED"
"A TOWN MOVES"
"U.S. SAVINGS BONDS RALLY"
"N.D. NOSES OUT S.M.U. BY 27 TO 20"
"Philadelphia, Pa. BURN 2,300 SQUEALERS"
"Odd Bits In To-day's News"
"Saratoga Springs, N.Y. DIAVOLO IS STAR AT BRILLIANT SPA OPENING"
"Risk Death in Daring Race"
"Philadelphia, PA. IT'S HIGHER EDUCATION"
"806 DECORATIONS"
"Snow Hauled 20 Miles For Skiers"
"F.D.R. ASKS VICTORY EFFORT"
每个字符串要么有大写和小写部分,要么全是大写。我一直在尝试使用正则表达式来提取字符串中仅有的大写部分,但是一直没有成功。目前我只能识别一个字符串以特定数量的大写字符开头或结尾:
generate title = regexs(0) if regexm(part1, "^[A-Z][A-Z][A-Z].*[A-Z][A-Z][A-Z]$")
我也尝试了下面这个方法,它来自论坛中的另一个问题:
generate title = regexs(0) if(regexm(part1, "\b[A-Z]{2,}\b"))
我希望你能帮我翻译一下,这段内容与it技术有关。它应该是寻找至少连续两个大写字母的单词,但对我来说它只返回缺失值。我使用的是Mac版的Stata 13.1。
^[^a-z]+$
。但是,否定类可能不被支持。如果它不起作用,您将不得不尝试解决方法,例如^[A-Z][0-9A-Z~\
@#$%^&*()_+ '=][{}\|'";:/?,.><-]+$`。 - Wiktor Stribiżew