我有一个文本文件,具有以下特点:
- 每一行至少有三个由空格分隔的“单词”
- “单词”可以是任何字符或字符串
我已经在一些行后附加了注释,并提出了对原始单词进行更改的暂定建议,现在希望使用sed来为我进行这些更改。因此,为了更清晰地说明,我的文件如下所示:
NO NO O
SIGNS NN O #NNS
GIVEN VBD B-VP #VBN
AT IN O
THIS NN O
TIME NN O ## B-NP
. PER O
...
带有1#的注释是用来替换行中的第二个单词,而带有2个#的注释是用来替换行中的第三个单词。 有没有人能够建议一种使用sed(或awk或其他任何东西)实现这个目标的方法?再次澄清(希望如此),我的目标是获取#或##后面的模式,并将该模式替换为行的第n个单词。
谢谢。
#
后面的注释有预先确定的空格数量?目前您展示了既有零个又有一个空格的注释,这使得代码不必要地更难适应。如果您的注释在#
后面没有空格,那将会更容易些。 - SiegeX