Linux и UNIX: программирование в shell. Руководство разработчика
Шрифт:
4842
Brown-3
12
26
26
L. Tansley
05/99
4712
Brown~2
12
30
28
Club student
total points: 155
Average Club
Student
points: 31
Использование переменной FS в сценариях awk
Если просматривается файл, в котором разделителем полей является символ, отличный от пробела, например '#' или ':',
$ awk -F: '{print $0}' входной_файл
Аналогичную функцию выполняет переменная FS, которую можно установить непосредственно в сценарии. Следующий сценарий обрабатывает файл /etc/passwd, выводя на экран содержимое первого и пятого полей, включающих соответственно имя пользователя и описание роли пользователя в системе. Поля в этом файле разделены символом двоеточия, поэтому в процедурной части шаблона begin устанавливается переменная FS, значение которой заключается в двойные кавычки:
$ cat passwd.awk
#!/bin/awk -f
# Имя файла: student_tot.awk
# Командная строка: passwd.awk /etc/passwd
# Вывод содержимого первого и пятого полей файла паролей.
BEGIN {
FS=":" }
{print $1"\t"$5}
Вот возможные результаты работы этого сценария:
$ passwd.awk /etc/passwd
root Special Admin login
xdm Restart xda Login
sysadm Regular Admin login
daemon Daemon Login for daemons needing permissions
Передача переменных сценариям awk
При передаче переменной сценарию awk формат командной строки таков:
awk файл_сценария переменная=значение входной_файл
Следующий небольшой сценарий сравнивает количество полей в каждой записи входного файла с заданным в командной строке значением. Текущее количество полей хранится в переменной NF. Сравниваемое значение передается сценарию в виде переменной МАХ.
$ cat fieldcheck.awk
#!/bin/awk -f
#Имя файла: fieldcheck.awk
#Командная строка: fieldcheck.awk MAX=n [FS=<разделитель>] имя_файла
#Проверка числа полей в записях файла.
{if(NF != МАХ)
print "line " NR " does not have " MAX " fields"}
При запуске этого сценария вместе с файлом /etc/passwd, содержащим семь полей, необходимо указать следующие параметры:
$ fieldcheck.awk МАХ=7 FS=":" /etc/passwd
Следующий сценарий выводит информацию об учениках, чей возраст ниже значения, заданного в командной строке:
$ cat age.awk
#!/bin/awk -f
# Имя файла: age.awk
# Командная строка: age.awk AGE=n grade.txt
# Вывод информации об учениках, чей возраст ниже заданного,
{if($5 < AGE) print $0}
$ age.awk AGE=10 grade.txt
M. Tansley 05/99 48311 Green В 4 0 4 4 J. Lulu 06/99 18317 green 9 24 26
9.2.15. Массивы
Изучая функцию split, мы говорили о том, каким образом
ее можно использовать для преобразования строки символов в массив. Повторим соответствующий пример:$ awk 'BEGIN {print split("123#456#678", myarray, "#")}'
3
Функция split возвращает число элементов созданного массива myarray. Внутренняя структура массива myarray в этом случае такова:
myarray[1]="123" myаrray[2]="456" myarray[3]="678"
При работе с массивами в awk не требуется заранее их объявлять. Не нужно также указывать количество элементов массива. Для доступа к массиву обычно применяется цикл for, синтаксис которого следующий:
for (элемент in массив) print массив[элемент]
В показанном ниже сценарии функция split разбивает заданную строку на элементы и записывает их в массив myarray, а в цикле for содержимое массива выводится на экран:
$ cat arraytest.awk
#! /bin/awk -f
#Имя файла: arraytest.awk
#Командная строка: arraytest.awk /dev/null
#Вывод элементов массива.
BEGIN {
record="l23#456#789";
split(record, myarray, "#") } END {
for (i in myarray) print myarray[i]
}
Для запуска сценария в качестве входного файла следует указать устройство /dev/null. Если этого не сделать, утилита awk будет ожидать поступления данных с клавиатуры.
$ arraytest.awk /dev/null
123
789
Статические массивы
В предыдущем примере массив формировался динамически. Следующий пример является более сложным и демонстрирует, как создавать в сценарии статические массивы. Ниже показан входной файл grade_student.txt, включающий информацию об учениках нашей секции каратистов. Записи файла содержат два поля: первое — название пояса, которым владеет ученик, второе — категория ученика (взрослый, юниор). Разделителем полей служит символ '#'.
$ cat grade_student.txt
Vellow#Junior
Orange#Senior
Yellow#Junior
Purple#Junior
Brown-2#Junior
White#Senior
Drange#Senior
Red#Junior
Brown-2#Senior
Yellow#Senior
Red#Junior
Blue#Senior
Green#Senior
Purple#Junior
White#Junior .
Наша задача заключается в том, чтобы прочитать файл и получить следующие сведения:
1. Сколько учеников имеют желтый, оранжевый и красный пояса?
2. Сколько взрослых и детей посещают секцию? Рассмотрим такой сценарий:
$ cat belts.awk
#!/bin/awk -f
#Имя файла: belts.awk
#Командная строка: belts.awk grade_student.txt
#Подсчет числа учеников, имеющих желтый, оранжевый и красный пояса,
#а также количества взрослых и юных членов секции.
# Задание разделителя и создание массивов.
BEGIN (
FS="#"
# Создание массива, индексами которого являются
#названия поясов. belt["Yellow"] belt["Orange"] belt["Red"]
#Создание массива, индексами которого являются