我有两个文件,我想检查每个文件中的每一行是否存在。但是,有时每行第二个单词后面的单词顺序可能会不同,这没关系,因为我只对第一个和第二个单词/列之后缺失或额外的单词感兴趣。
文件A:
foobar A a ab c bd hd
bar B a c jd sm sldkjn
baz C boo abd
文件B:
foobar A a c bd hd ab
baz C abd boo
bar B c a jd sm sldkjn
在上面的例子中,那两个文件根据我的标准都是好的。
起初我尝试了
$ sort -u file_A > outA
$ sort -u file_B > outB
$ diff outA outB
这种方式不考虑行顺序。 但是,它会考虑每行中单词的顺序。
我该如何忽略第二列之后每行单词的顺序?
baz C boo abd
,而文件B只有其中的1行,根据您的标准,这两个文件应该输出什么结果 - 它们是相同的还是不同的? - Ed Morton