我该如何使这个 AWK 命令不区分大小写？

Question

我该如何使这个 AWK 命令不区分大小写？

3

我将尝试使用awk命令仅打印.csv文件中字段的出现次数。例如，在名为test.csv的文件中，如下所示：

layla;rebel;TAT
han_solo;rebel;TAT
darth_vader;empire;DKS
yoda;rebel;TAT

使用以下命令：

cat test.csv | ./how_many_are_we.sh dks

我希望您能提供以下输出:

以下是我在how_many_are_we.sh中的代码（区分大小写可用）：

#! /bin/bash
awk -F ";" -v location=$1 'BEGIN {count=0;} { if ($3 == location) count+=1} END {print count}'

我尝试在不同的位置添加IGNORECASE=1，但似乎找不到使其起作用的正确方法。

请原谅我措辞不太好，并感谢您的帮助。

- Odil

1

"Ignorecase" 是 gawk 特有的，你确定你正在运行 gawk 吗？ - Ed Morton

2个回答

0

通常，如果您有一个可以轻松处理小写输入的脚本，您可以使用 tr 转换输入流，以便它也可以操作混合大小写输入。

$ command | tr '[:upper:]' '[:lower:]' | ./script

然而，如果你想要掩盖 tr，你可以使用以下重定向将其默认嵌入到你的脚本中：

#!/usr/bin/env bash
exec 0< <( tr '[:upper:]' '[:lower:]' )
# the rest of your script comes here:
awk '...'

现在，您可以做这样的事情：

$ command | ./script

- kvantour

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- RavinderSingh13 · Accepted Answer

你可以改变输入值和第三个字段的大小写，然后比较它们的值以确保无论如何输入都不会受到影响。

#!/bin/bash
awk -F ";" -v location="$1" 'BEGIN {location=tolower(location);count=0;} { if (tolower($3) == location) count+=1} END {print count+0}' Input_file

根据 Glenn 先生的评论，使用 shell trick 在变量本身中将其转换为小写。

#!/bin/bash
awk -v location="${1,,}" 'BEGIN{FS=";"} (tolower($3) == location){count+=1} END{print count+0}' Input_file

或者更加简洁易懂地使用awksh方式，将awk命令改为以下形式（上面是原始命令，下面是修改后的awksh命令）:

awk -v location="$1" 'BEGIN{location=tolower(location);FS=";"} (tolower($3) == location){count+=1} END{print count+0}'

注意: 如果要使用 IGNORECASE=1，你可以在 BEGIN 段落中加入 BEGIN{IGNORECASE=1} 或者像一个 awk 变量一样加入 -v IGNORECASE="1"。

另外，顺便提醒，原始命令的 shebang 中 #! 和 /bin/bash 之间有空格，这是不正确的，我已经在这里修复了它。