在Bash中,有没有一种简单的方法可以将驼峰式单词拆分为其组成的单词?
例如,我想将aCertainCamelCasedWord拆分为'a Certain Camel Cased Word',并能够选择我感兴趣的字段。当单词分隔符是下划线时,使用cut(1)可以轻松完成此操作,但是当单词是驼峰式时,该怎么做呢?
在Bash中,有没有一种简单的方法可以将驼峰式单词拆分为其组成的单词?
例如,我想将aCertainCamelCasedWord拆分为'a Certain Camel Cased Word',并能够选择我感兴趣的字段。当单词分隔符是下划线时,使用cut(1)可以轻松完成此操作,但是当单词是驼峰式时,该怎么做呢?
sed 's/\([A-Z]\)/ \1/g'
该命令会捕获每个大写字母,并将前导空格替换为整个流的捕获内容。
$ echo "aCertainCamelCasedWord" | sed 's/\([A-Z]\)/ \1/g'
a Certain Camel Cased Word
如果你不想拆分所有大写的单词,那么这个解决方案非常适用。例如,使用上面的答案会得到以下结果:
$ echo 'FAQPage' | sed 's/\([A-Z]\)/ \1/g'
F A Q Page
$ echo 'FAQPage' | sed 's/\([A-Z][^A-Z]\)/ \1/g'
FAQ Page
$ echo 'FAQPageOneReplacedByFAQPageTwo' | sed 's|\([A-Z][^A-Z]\)| \1|g'
FAQ Page One Replaced ByFAQ Page Two
这个答案在存在多个大写字母的第二个实例时不能正确工作
echo 'FAQPageOneReplacedByFAQPageTwo' | sed 's|\([A-Z][^A-Z]\)| \1|g'
FAQ Page One Replaced ByFAQ Page Two
echo 'FAQPageOneReplacedByFAQPageTwo' | sed -e 's|\([A-Z][^A-Z]\)| \1|g' -e 's|\([a-z]\)\([A-Z]\)|\1 \2|g'
FAQ Page One Replaced By FAQ Page Two
纯 Bash:
name="aCertainCamelCasedWord"
declare -a word # the word array
counter1=0 # count characters
counter2=0 # count words
while [ $counter1 -lt ${#name} ] ; do
nextchar=${name:${counter1}:1}
if [[ $nextchar =~ [[:upper:]] ]] ; then
((counter2++))
word[${counter2}]=$nextchar
else
word[${counter2}]=${word[${counter2}]}$nextchar
fi
((counter1++))
done
echo -e "'${word[@]}'"