この版で勉強しました。
勉強したというよりは、例を利用して改良してその後使っているというのが実際です。
wordfreqというスクリプトの例があります。
私は今でも、このスクリプトで単語を計算しています。
必要に応じてTRコマンドと併用したり、除去する記号を変更したりしています。
{
gsub(/[`'&%$-/.,:;!?^*_~=|@\\\#<>(){}0123456789\[\]"]/," ")
for (i=1;i<=NF;i++)
count[$i]++
}
END {for (w in count)
print w,count[w] | "sort -f"
}