awk是個優秀文本處理工具,可以說是一門程序設計語言。下面是awk內置變量。
一、內置變量表
屬性 說明 $0 當前記錄(作為單個變量) $1~$n 當前記錄的第n個字段,字段間由FS分隔 FS 輸入字段分隔符 默認是空格 NF 當前記錄中的字段個數,就是有多少列 NR 已經讀出的記錄數,就是行號,從1開始 RS 輸入的記錄他隔符默 認為換行符 OFS 輸出字段分隔符 默認也是空格 ORS 輸出的記錄分隔符,默認為換行符 ARGC 命令行參數個數 ARGV 命令行參數數組 FILENAME 當前輸入文件的名字 IGNORECASE 如果為真,則進行忽略大小寫的匹配 ARGIND 當前被處理文件的ARGV標志符 CONVFMT 數字轉換格式 %.6g ENVIRON UNIX環境變量 ERRNO UNIX系統錯誤消息 FIELDWIDTHS 輸入字段寬度的空白分隔字符串 FNR 當前記錄數 OFMT 數字的輸出格式 %.6g RSTART 被匹配函數匹配的字符串首 RLENGTH 被匹配函數匹配的字符串長度 SUBSEP \034
2、實例
1、常用操作
[chengmo@localhost ~]$ awk '/^root/{print $0}' /etc/passwd
root:x:0:0:root:/root:/bin/bash
/^root/ 為選擇表達式,$0代表是逐行
2、設置字段分隔符號(FS使用方法)
[chengmo@localhost ~]$ awk 'BEGIN{FS=":"}/^root/{print $1,$NF}' /etc/passwd
root /bin/bash
FS為字段分隔符,可以自己設置,默認是空格,因為passwd裡面是”:”分隔,所以需要修改默認分隔符。NF是字段總數,$0代表當前行記錄,$1-$n是當前行,各個字段對應值。
3、記錄條數(NR,FNR使用方法)
[chengmo@localhost ~]$ awk 'BEGIN{FS=":"}{print NR,$1,$NF}' /etc/passwd
1 root /bin/bash
2 bin /sbin/nologin
3 daemon /sbin/nologin
4 adm /sbin/nologin
5 lp /sbin/nologin
6 sync /bin/sync
7 shutdown /sbin/shutdown
……
NR得到當前記錄所在行
4、設置輸出字段分隔符(OFS使用方法)
[chengmo@localhost ~]$ awk 'BEGIN{FS=":";OFS="^^"}/^root/{print FNR,$1,$NF}' /etc/passwd
1^^root^^/bin/bash
OFS設置默認字段分隔符
5、設置輸出行記錄分隔符(ORS使用方法)
[chengmo@localhost ~]$ awk 'BEGIN{FS=":";ORS="^^"}{print FNR,$1,$NF}' /etc/passwd
1 root /bin/bash^^2 bin /sbin/nologin^^3 daemon /sbin/nologin^^4 adm /sbin/nologin^^5 lp /sbin/nologin
從上面看,ORS默認是換行符,這裡修改為:”^^”,所有行之間用”^^”分隔了。
6、輸入參數獲取(ARGC ,ARGV使用)
[chengmo@localhost ~]$ awk 'BEGIN{FS=":";print "ARGC="ARGC;for(k in ARGV) {print k"="ARGV[k]; }}' /etc/passwd
ARGC=2
0=awk
1=/etc/passwd
ARGC得到所有輸入參數個數,ARGV獲得輸入參數內容,是一個數組。
7、獲得傳入的文件名(FILENAME使用)
[chengmo@localhost ~]$ awk 'BEGIN{FS=":";print FILENAME}{print FILENAME}' /etc/passwd
/etc/passwd
FILENAME,$0-$N,NF 不能使用在BEGIN中,BEGIN中不能獲得任何與文件記錄操作的變量。
8、獲得linux環境變量(ENVIRON使用)
[chengmo@localhost ~]$ awk 'BEGIN{print ENVIRON["PATH"];}' /etc/passwd
/usr/lib/qt-3.3/bin:/usr/kerberos/bin:/usr/lib/ccache:/usr/lib/icecc/bin:/usr/
local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/usr/java/
jdk1.5.0_17/bin:/usr/java/jdk1.5.0_17/jre/bin:/usr/local/mysql/bin:/home/web97/bin
ENVIRON是子典型數組,可以通過對應鍵值獲得它的值。
9、輸出數據格式設置:(OFMT使用)
[chengmo@localhost ~]$ awk 'BEGIN{OFMT="%.3f";print 2/3,123.11111111;}' /etc/passwd
0.667 123.111
OFMT默認輸出格式是:%.6g 保留六位小數,這裡修改OFMT會修改默認數據輸出格式。
10、按寬度指定分隔符(FIELDWIDTHS使用)
[chengmo@localhost ~]$ echo 20100117054932 |
awk 'BEGIN{FIELDWIDTHS="4 2 2 2 2 3"}{print $1"-"$2"-"$3,$4":"$5":"$6}'
2010-01-17 05:49:32
FIELDWIDTHS其格式為空格分隔的一串數字,用以對記錄進行域的分隔,FIELDWIDTHS="4 2 2 2 2 2"就表示$1寬度是4,$2是2,$3是2 .... 。這個時候會忽略:FS分隔符。
11、RSTART RLENGTH使用
[chengmo@localhost ~]$ awk 'BEGIN{start=match
("this is a test",/[a-z]+$/); print start, RSTART, RLENGTH }'
11 11 4
[chengmo@localhost ~]$ awk 'BEGIN
{start=match("this is a test",/^[a-z]+$/); print start, RSTART, RLENGTH }'
0 0 –1
RSTART 被匹配正則表達式首位置,RLENGTH 匹配字符長度,沒有找到為-1.
以上是:awk的一些內置變量使用,希望有什麼問題可以與我交流。