указателем. Допускаются следующие символы преобразования:
D - на вводе ожидается десятичное целое; соответствующий ар-
гумент должен быть указателем на целое.
O - На вводе ожидается восьмеричное целое (с лидирующим ну-
лем или без него); соответствующий аргумент должен быть
указателем на целое.
X - На вводе ожидается шестнадцатеричное целое (с лидирующи-
ми 0X или без них); соответствующий аргумент должен быть
указателем на целое.
H - На вводе ожидается целое типа SHORT; соответсвующий ар-
гумент должен быть указателем на целое типа SHORT.
C - Ожидается отдельный символ; соответствующий аргумент
должен быть указателем на символы; следующий вводимый
символ помещается в указанное место. Обычный пропуск сим-
волов пустых промежутков в этом случае подавляется; для
чтения следующего символа, который не является символом
пустого промежутка, пользуйтесь спецификацией преобразо-
вания %1S.
S - Ожидается символьная строка; соответствующий аргумент
должен быть указателем символов, который указывает на
массив символов, который достаточно велик для принятия
строки и добавляемого в конце символа \0.
F - Ожидается число с плавающей точкой; соответствующий ар-
гумент должен быть указателем на переменную типа FLOAT.
Е - символ преобразования E является синонимом для F. Формат
ввода переменной типа FLOAT включает необязательный знак,
строку цифр, возможно содержащую десятичную точку и нео-
бязательное поле экспоненты, состоящее из буквы E, за ко-
торой следует целое, возможно имеющее знак.



Перед символами преобразования D, O и X может стоять L,
которая означает , что в списке аргументов должен находиться
указатель на переменную типа LONG, а не типа INT. Аналогич-
но, буква L может стоять перед символами преобразования E
или F, говоря о том, что в списке аргументов должен нахо-
диться указатель на переменную типа DOUBLE, а не типа FLOAT.
Например, обращение
INT I;
FLOAT X;
CHAR NAME[50];
SCANF("&D %F %S", &I, &X, NAME);

со строкой на вводе

25 54.32E-1 THOMPSON

приводит к присваиванию I значения 25,X - значения 5.432 и
NAME - строки "THOMPSON", надлежащим образом законченной
символом \ 0. эти три поля ввода можно разделить столькими
пробелами, табуляциями и символами новых строк, сколько вы
пожелаете. Обращение

INT I;
FLOAT X;
CHAR NAME[50];
SCANF("%2D %F %*D %2S", &I, &X, NAME);

с вводом

56789 0123 45A72

присвоит I значение 56, X - 789.0, пропустит 0123 и поместит
в NAME строку "45". при следующем обращении к любой процеду-
ре ввода рассмотрение начнется с буквы A. В этих двух приме-
рах NAME является указателем и, следовательно, перед ним не
нужно помещать знак &.
В качестве другого примера перепишем теперь элементарный
калькулятор из главы 4, используя для преобразования ввода
функцию SCANF:

#INCLUDE <STDIO.H>
MAIN() /* RUDIMENTARY DESK CALCULATOR */
\(
DOUBLE SUM, V;
SUM =0;
WHILE (SCANF("%LF", &V) !=EOF)
PRINTF("\T%.2F\N", SUM += V);
\)

выполнение функции SCANF заканчивается либо тогда, когда она
исчерпывает свою управляющую строку, либо когда некоторый
элемент ввода не совпадает с управляющей спецификацией. В
качестве своего значения она возвращает число правильно сов-
падающих и присвоенных элементов ввода. Это число может быть



использовано для определения количества найденных элементов
ввода. при выходе на конец файла возвращается EOF; подчерк-
нем, что это значение отлично от 0, что следующий вводимый
символ не удовлетворяет первой спецификации в управляющей
строке. При следующем обращении к SCANF поиск возобновляется
непосредственно за последним введенным символом.
Заключительное предостережение: аргументы функции SCANF
должны быть указателями. Несомненно наиболее распространен-
ная ошибка состоит в написании

SCANF("%D", N);

вместо

SCANF("%D", &N);


    7.5. Форматное преобразование в памяти






От функции SCANF и PRINTF происходят функции SSCANF и
SPRINTF, которые осуществляют аналогичные преобразования, но
оперируют со строкой, а не с файлом. Обращения к этим функ-
циям имеют вид:

SPRINTF(STRING, CONTROL, ARG1, ARG2, ...)
SSCANF(STRING, CONTROL, ARG1, ARG2, ...)

Как и раньше , функция SPRINTF преобразует свои аргументы
ARG1, ARG2 и т.д. В соответствии с форматом, указанным в
CONTROL, но помещает результаты в STRING, а не в стандартный
вывод. KОнечно, строка STRING должна быть достаточно велика,
чтобы принять результат. Например, если NAME - это символь-
ный массив, а N - целое, то

SPRINTF(NAME, "TEMP%D", N);

создает в NAME строку вида TEMPNNN, где NNN - значение N.
Функция SSCANF выполняет обратные преобразования - она
просматривает строку STRING в соответствии с форматом в ар-
гументе CONTROL и помещает результирующие значения в аргу-
менты ARG1, ARG2 и т.д.эти аргументы должны быть указателя-
ми. В результате обращения

SSCANF(NAME, "TEMP%D", &N);

переменная N получает значение строки цифр, следующих за
TEMP в NAME.

Упражнение 7-2
--------------
Перепишите настольный калькулятор из главы 4, используя
для ввода и преобразования чисел SCANF и/или SSCANF.




    7.6. Доступ к файлам



Все до сих пор написанные программы читали из стандарт-
ного ввода и писали в стандартный вывод, относительно кото-
рых мы предполагали, что они магическим образом предоставле-
ны программе местной операционной системой.
Следующим шагом в вопросе ввода-вывода является написа-
ние программы, работающей с файлом, который не связан зара-
нее с программой. одной из программ, которая явно демонстри-
рует потребность в таких операциях, является CAT, которая
объединяет набор из нескольких именованных файлов в стандар-
тный вывод. Программа CAT используется для вывода файлов на
терминал и в качестве универсального сборщика ввода для
программ, которые не имеют возможности обращаться к файлам
по имени. Например, команда

CAT X.C.Y.C

печатает содержимое файлов X.C и Y.C в стандартный вывод.
Вопрос состоит в том, как организовать чтение из имено-
ванных файлов, т.е., как связать внешние имена, которыми
мыслит пользователь, с фактически читающими данные операто-
рами.

Эти правила просты. Прежде чем можно считывать из неко-
торого файла или записывать в него, этот файл должен быть
открыт с помощью функции FOPEN из стандартной библиотеки.
функция FOPEN берет внешнее имя (подобное X.C или Y.C), про-
водит некоторые обслуживающие действия и переговоры с опера-
ционной системой (детали которых не должны нас касаться) и
возвращает внутреннее имя, которое должно использоваться при
последующих чтениях из файла или записях в него.
Это внутреннее имя, называемое "указателем файла", фак-
тически является указателем структуры, которая содержит ин-
формацию о файле, такую как место размещения буфера, текущая
позиция символа в буфере, происходит ли чтение из файла или
запись в него и тому подобное. Пользователи не обязаны знать
эти детали, потому что среди определений для стандартного
ввода-вывода, получаемых из файла STDIO.H, содержится опре-
деление структуры с именем FILE. Единственное необходимое
для указателя файла описание демонстрируется примером:

FILE *FOPEN(), *FP;

Здесь говорится, что FP является указателем на FILE и
FOPEN возвращает указатель на FILE. Oбратите внимание, что
FILE является именем типа, подобным INT, а не ярлыку струк-
туры; это реализовано как TYPEDEF. (Подробности того, как
все это работает на системе UNIX, приведены в главе 8).
Фактическое обращение к функции FOPEN в программе имеет
вид:
FP=FOPEN(NAME,MODE);



Первым аргументом функции FOPEN является "имя" файла, кото-
рое задается в виде символьной строки. Второй аргумент MODE
("режим") также является символьной строкой, которая указы-
вает, как этот файл будет использоваться. Допустимыми режи-
мами являются: чтение ("R"), запись ("W") и добавление
("A").
Если вы откроете файл, который еще не сущетвует, для за-
писи или добавления, то такой файл будет создан (если это
возможно). Открытие существующего файла на запись приводит к
отбрасыванию его старого содержимого. Попытка чтения несу-
ществующего файла является ощибкой. Ошибки могут быть обус-
ловлены и другими причинами (например, попыткой чтения из
файла, не имея на то разрешения). При наличии какой-либо
ошибки функция возвращает нулевое значение указателя NULL
(которое для удобства также определяется в файле STDIO.H).
Другой необходимой вещью является способ чтения или за-
писи, если файл уже открыт. Здесь имеется несколько возмож-
ностей, из которых GETC и PUTC являются простейшими.функция
GETC возвращает следующий символ из файла; ей необходим ука-
затель файла, чтобы знать, из какого файла читать. Таким об-
разом,

C=GETC(FP)

помещает в "C" следующий символ из файла, указанного посред-
ством FP, и EOF, если достигнут конец файла.
Функция PUTC, являющаяся обращением к функции GETC,

PUTC(C,FP)

помещает символ "C" в файл FP и возвращает "C". Подобно фун-
кциям GETCHAR и PUTCHAR, GETC и PUTC могут быть макросами, а
не функциями.
При запуске программы автоматически открываются три фай-
ла, которые снабжены определенными указателями файлов. Этими
файлами являются стандартный ввод, стандартный вывод и стан-
дартный вывод ошибок; соответствующие указатели файлов назы-
ваются STDIN, STDOUT и STDERR. Обычно все эти указатели свя-
заны с терминалом, но STDIN и STDOUT могут быть перенаправ-
лены на файлы или в поток (PIPE), как описывалось в разделе
7.2.
Функции GETCHAR и PUTCHAR могут быть определены в терми-
налах GETC, PUTC, STDIN и STDOUT следующим образом:
#DEFINE GETCHAR() GETC(STDIN) #DEFINE PUTCHAR(C) PUTC(C,
STDOUT)
При работе с файлами для форматного ввода и вывода можно ис-
пользовать функции FSCANF и FPRINTF. Они идентичны функциям
SCANF и PRINTF, за исключением того, что первым аргументом
является указатель файла, определяющий тот файл, который бу-
дет читаться или куда будет вестись запись; управляющая
строка будет вторым аргументом.



Покончив с предварительными замечаниями, мы теперь в
состоянии написать программу CAT для конкатенации файлов.
Используемая здесь основная схема оказывается удобной во
многих программах: если имеются аргументы в командной стро-
ке, то они обрабатываются последовательно. Если такие аргу-
менты отсутствуют, то обрабатывается стандартный ввод. Это
позволяет использовать программу как самостоятельно, так и
как часть большей задачи.

#INCLUDE <STDIO.H>
MAIN(ARGC, ARGV) /*CAT: CONCATENATE FILES*/
INT ARGC;
CHAR *ARGV[];
\(
FILE *FP, *FOPEN();
IF(ARGC==1) /*NO ARGS; COPY STANDARD INPUT*/
FILECOPY(STDIN);
ELSE
WHILE (--ARGC > 0)
IF ((FP=FOPEN(*++ARGV,"R"))==NULL) \(
PRINTF("CAT:CAN'T OPEN %\N",*ARGV);
BREAK;
\) ELSE \(
FILECOPY(FP);
FCLOSE(FP);
\)
\)
FILECOPY(FP) /*COPY FILE FP TO STANDARD OUTPUT*/
FILE *FP;
\(
INT C;
WHILE ((C=GETC(FP)) !=EOF)
PUTC(C, STDOUT);
\)

Указатели файлов STDIN и STDOUT заранее определены в библио-
теке ввода-вывода как стандартный ввод и стандартный вывод;
они могут быть использованы в любом месте, где можно исполь-
зовать объект типа FILE*.они однако являются константами, а
не переменными, так что не пытайтесь им что-либо присваи-
вать.
Функция FCLOSE является обратной по отношению к FOPEN;
она разрывает связь между указателем файла и внешним именем,
установленную функцией FOPEN, и высвобождает указатель файла
для другого файла.большинство операционных систем имеют не-
которые ограничения на число одновременно открытых файлов,
которыми может распоряжаться программа. Поэтому, то как мы
поступили в CAT, освободив не нужные нам более объекты, яв-
ляется хорошей идеей. Имеется и другая причина для примене-
ния функции FCLOSE к выходному файлу - она вызывает выдачу
информации из буфера, в котором PUTC собирает вывод. (При
нормальном завершении работы программы функция FCLOSE вызы-
вается автоматически для каждого открытого файла).




    7.7. Обработка ошибок - STDERR и EXIT



Обработка ошибок в CAT неидеальна. Неудобство заключает-
ся в том, что если один из файлов по некоторой причине ока-
зывается недоступным, диагностическое сообщение об этом пе-
чатается в конце объединенного вывода. Это приемлемо, если
вывод поступает на терминал, но не годится, если вывод пос-
тупает в некоторый файл или через поточный (PIPELINE) меха-
низм в другую программу.
Чтобы лучше обрабатывать такую ситуацию, к программе
точно таким же образом, как STDIN и STDOUT, присоединяется
второй выходной файл, называемый STDERR. Если это вообще
возможно, вывод, записанный в файле STDERR, появляется на
терминале пользователя, даже если стандартный вывод направ-
ляется в другое место.
Давайте переделаем программу CAT таким образом, чтобы
сообщения об ошибках писались в стандартный файл ошибок.

"INCLUDE <STDIO.H>
MAIN(ARGC,ARGV) /*CAT: CONCATENATE FILES*/
INT ARGC;
CHAR *ARGV[];
\(
FILE *FP, *FOPEN();
IF(ARGC==1) /*NO ARGS; COPY STANDARD INPUT*/
FILECOPY(STDIN);
ELSE
WHILE (--ARGC > 0)
IF((FP=FOPEN(*++ARGV,"R#))==NULL) \(
PRINTF(STDERR,
"CAT: CAN'T OPEN,%S\N", ARGV);
EXIT(1);
\) ELSE \(
FILECOPY(FP);
\)
EXIT(0);
\)

Программа сообщает об ошибках двумя способами. Диагностичес-
кое сообщение, выдаваемое функцией FPRINTF, поступает в
STDERR и, таким образом, оказывается на терминале пользова-
теля, а не исчезает в потоке (PIPELINE) или в выходном фай-
ле.
Программа также использует функцию EXIT из стандартной
библиотеки, обращение к которой вызывает завершение выполне-
ния программы. Аргумент функции EXIT доступен любой програм-
ме, обращающейся к данной функции, так что успешное или неу-
дачное завершение данной программы может быть проверено дру-
гой программой, использующей эту в качестве подзадачи. По
соглашению величина 0 в качетсве возвращаемого значения сви-
детельствует о том, что все в порядке, а различные ненулевые
значения являются признаками нормальных ситуаций.



Функция EXIT вызывает функцию FCLOSE для каждого откры-
того выходного файла, с тем чтобы вывести всю помещенную в
буферы выходную информацию, а затем вызывает функцию _EXIT.
Функция _EXIT приводит к немедленному завершению без очистки
каких-либо буферов; конечно, при желании к этой функции мож-
но обратиться непосредственно.


    7.8. Ввод и вывод строк



Стандартная библиотека содержит функцию FGETS, совершен-
но аналогичную функции GETLINE, которую мы использовали на
всем протяжении книги. В результате обращения

FGETS(LINE, MAXLINE, FP)

следующая строка ввода (включая символ новой строки) считы-
вается из файла FP в символьный массив LINE; самое большое
MAXLINE_1 символ будет прочитан. Результирующая строка за-
канчивается символом \ 0. Нормально функция FGETS возвращает
LINE; в конце файла она возвращает NULL. (Наша функция
GETLINE возвращает длину строки, а при выходе на конец файла
- нуль).
Предназначенная для вывода функция FPUTS записывает
строку (которая не обязана содержать символ новой строки) в
файл:

FPUTS(LINE, FP)

Чтобы показать, что в функциях типа FGETS и FPUTS нет
ничего таинственного, мы приводим их ниже, скопированными
непосредственно из стандартной библиотеки ввода-вывода:

#INCLUDE <STDIO.H>
CHAR *FGETS(S,N,IOP) /*GET AT MOST N CHARS FROM IOP*/
CHAR *S;
INT N;
REGISTER FILE *IOP;
\(
REGISTER INT C;
REGISTER CHAR *CS;
CS = S;
WHILE(--N>0&&(C=GETC(IOP)) !=EOF)
IF ((*CS++ = C)=='\N')
BREAK;
*CS = '\0';
RETURN((C==EOF && CS==S) 7 NULL : S);
\)
FPUTS(S,IOP) /*PUT STRING S ON FILS IOP*/
REGISTER CHAR *S;
REGISTER FILE *IOP;
\(
REGISTER INT C;
WHILE (C = *S++)
PUTC(C,IOP);
\)




Упражнение 7-3
---------------
Напишите программу сравнения двух файлов, которая будет
печатать первую строку и позицию символа, где они различают-
ся.

Упражнение 7-4
---------------
Переделайте программу поиска заданной комбинации симво-
лов из главы 5 таким образом, чтобы в качестве ввода исполь-
зовался набор именованных файлов или, если никакие файлы не
указаны как аргументы, стандартный ввод. Следует ли печатать
имя файла при нахождении подходящей строки?

Упражнение 7-5
--------------
Напишите программу печати набора файлов, которая начина-
ет каждый новый файл с новой страницы и печатает для каждого
файла заголовок и счетчик текущих страниц.


    7.9. Несколько разнообразных функций



Стандартная библиотека предоставляет множество разнооб-
разных функций, некоторые из которых оказываются особенно
полезными. Мы уже упоминали функции для работы со строками:
STRLEN, STRCPY, STRCAT и STRCMP. Вот некоторые другие.


    7.9.1. Проверка вида символов и преобразования



Некоторые макросы выполняют проверку символов и преобра-
зования:


SALPHA(C) не 0, если "C" алфавитный символ,
0 - если нет.
SUPPER(C) Не 0, если "C" буква верхнего регистра,
0 - если нет.
SLOWER(C) Не 0, если "C" буква нижнего регистра,
0 - если нет.
SDIGIT(C) Не 0, если "C" цифра,
0 - если нет.
SSPACL(C) Не 0, если "C" пробел, табуляция
или новая строка, 0 - если нет.
OUPPER(C) Преобразует "C" в букву верхнего регистра.
OLOWER(C) Преобразует "C" в букву нижнего регистра.


    7.9.2. Функция UNGETC



Стандартная библиотека содержит довольно ограниченную
версию функции UNGETCH, написанной нами в главе 4; она назы-
вается UNGETC. В результате обращения

UNGETC(C,FP)

символ "C" возвращается в файл FP. Позволяется возвращать в
каждый файл только один символ. Функция UNGETC может быть
использована в любой из функций ввода и с макросами типа
SCANF, GETC или GETCHAR.




    7.9.3. Обращение к системе



Функция SYSTEM(S) выполняет команду, содержащуюся в сим-
вольной строке S, и затем возобновляет выполнение текущей
программы. Содержимое S сильно зависит от используемой опе-
рационной системы. В качестве тривиального примера, укажем,
что на системе UNIX строка

SYSTEM("DATE");

приводит к выполнению программы DATE, которая печатает дату
и время дня.


    7.9.4. Управление памятью



Функция CALLOC весьма сходна с функцией ALLOC, использо-
ванной нами в предыдущих главах. В результате обращения

CALLOC(N, SIZEOF(OBJCCT))

возвращается либо указатель пространства, достаточного для
размещения N объектов указанного размера, либо NULL, если
запрос не может быть удволетворен. Отводимая память инициа-
лизируется нулевыми значениями.
Указатель обладает нужным для рассматриваемых объектов
выравниванием, но ему следует приписывать соответствующий
тип, как в

CHAR *CALLOC();
INT *IP;
IP=(INT*) CALLOC(N,SIZEOF(INT));

Функция CFREE(P) освобождает пространство, на которое
указывает "P", причем указатель "P" певоначально должен быть
получен в результате обращения к CALLOC. Здесь нет никаких
ограничений на порядок освобождения пространства, но будет
неприятнейшей ошибкой освободить что-нибудь, что не было по-
лучено обращением к CALLOC.
Реализация программы распределения памяти, подобной
CALLOC, в которой размещенные блоки могут освобождаться в
произвольном порядке, продемонстрирована в главе 8.


    * 8. Интерфейс системы UNIX *




Материал этой главы относится к интерфейсу между с-прог-
раммами и операционной системой UNIX. Так как большинство
пользователей языка "C" работают на системе UNIX, эта глава
окажется полезной для большинства читателей. даже если вы
используете с-компилятор на другой машине, изучение приводи-
мых здесь примеров должно помочь вам глубже проникнуть в ме-
тоды программирования на языке "C".
Эта глава делится на три основные части: ввод/вывод,
система файлов и распределение памяти. Первые две части
предполагают небольшое знакомство с внешними характеристика-
ми системы UNIX.
В главе 7 мы имели дело с системным интерфейсом, который
одинаков для всего многообразия операционных систем. На каж-
дой конкретной системе функции стандартной библиотеки должны
быть написаны в терминах ввода-вывода, доступных на данной
машине. В следующих нескольких разделах мы опишем основную
систему связанных с вводом и выводом точек входа операцион-
ной системы UNIX и проиллюстрируем, как с их помощью могут
быть реализованы различные части стандартной библиотеки.


    8.1. Дескрипторы файлов



В операционной системе UNIX весь ввод и вывод осуществ-
ляется посредством чтения файлов или их записи, потому что
все периферийные устройства, включая даже терминал пользова-
теля, являются файлами определенной файловой системы. Это
означает, что один однородный интерфейс управляет всеми свя-
зями между программой и периферийными устройствами.
В наиболее общем случае перед чтением из файла или за-
писью в файл необходимо сообщить системе о вашем намерении;
этот процесс называется "открытием" файла. Система выясня-
ет,имеете ли вы право поступать таким образом (существует ли
этот файл? имеется ли у вас разрешение на обращение к не-
му?), и если все в порядке, возвращает в программу небольшое
положительное целое число, называемое дескриптором файла.
всякий раз, когда этот файл используется для ввода или выво-
да, для идентификации файла употребляется дескриптор файла,
а не его имя. (Здесь существует примерная аналогия с исполь-
зованием READ (5,...) и WRITE (6,...) в фортране). Вся ин-
формация об открытом файле содержится в системе; программа
пользователя обращается к файлу только через дескриптор фай-
ла.
Для удобства выполнения обычных операций ввода и вывода
с помощью терминала пользователя существуют специальные сог-
лашения. Когда интерпретатор команд ("SHELL") прогоняет
программу, он открывает три файла, называемые стандартным
вводом, стандартным выводом и стандартным выводом ошибок,
которые имеют соответственно числа 0, 1 и 2 в качестве деск-
рипторов этих файлов. В нормальном состоянии все они связаны
с терминалом, так что если программа читает с дескриптором
файла 0 и пишет с дескрипторами файлов 1 и 2, то она может
осуществлять ввод и вывод с помощью терминала, не заботясь
об открытии соответствующих файлов.



Пользователь программы может перенаправлять ввод и вывод
на файлы, используя операции командного интерпретатора SHELL
"<" и ">" :

PROG <INFILE>OUTFILE

В этом случае интерпретатор команд SHELL изменит присваива-
ние по умолчанию дескрипторов файлов 0 и 1 с терминала на
указанные файлы. Нормально дескриптор файла 2 остается свя-
занным с терминалом, так что сообщения об ошибках могут пос-
тупать туда. Подобные замечания справедливы и тогда, когда
ввод и вывод связан с каналом. Следует отметить, что во всех
случаях прикрепления файлов изменяются интерпретатором
SHELL, а не программой. Сама программа, пока она использует
файл 0 для ввода и файлы 1 и 2 для вывода, не знает ни отку-
да приходит ее ввод, ни куда поступает ее выдача.


    8.2. Низкоуровневый ввод/вывод - операторы READ и WRITE



Самый низкий уровень ввода/вывода в системе UNIX не пре-
дусматривает ни какой-либо буферизации, ни какого-либо дру-
гого сервиса; он по существу является непосредственным вхо-
дом в операционную систему. Весь ввод и вывод осуществляется
двумя функциями: READ и WRITE. Первым аргументом обеих функ-
ций является дескриптор файла. Вторым аргументом является
буфер в вашей программе, откуда или куда должны поступать
данные. Третий аргумент - это число подлежащих пересылке
байтов. Обращения к этим функциям имеют вид:

N_READ=READ(FD,BUF,N);
N_WRITTEN=WRITE(FD,BUF,N);

При каждом обращении возвращается счетчик байтов, указываю-
щий фактическое число переданных байтов. При чтении возвра-
щенное число байтов может оказаться меньше, чем запрошенное
число. Возвращенное нулевое число байтов означает конец фай-
ла, а "-1" указывает на наличие какой-либо ошибки. При запи-
си возвращенное значение равно числу фактически записанных
байтов; несовпадение этого числа с числом байтов, которое
предполагалось записать, обычно свидетельствует об ошибке.
Количество байтов, подлежащих чтению или записи, может
быть совершенно произвольным. Двумя самыми распространенными
величинами являются "1", которая означает передачу одного
символа за обращение (т.е. Без использования буфера), и
"512", которая соответствует физическому размеру блока на
многих периферийных устройствах. Этот последний размер будет
наиболее эффективным, но даже ввод или вывод по одному сим-
волу за обращение не будет необыкновенно дорогим.
Объединив все эти факты, мы написали простую программу
для копирования ввода на вывод, эквивалентную программе ко-
пировки файлов, написанной в главе 1. На системе UNIX эта
программа будет копировать что угодно куда угодно, потому
что ввод и вывод могут быть перенаправлены на любой файл или
устройство.
#DEFINE BUFSIZE 512 /*BEST SIZE FOR PDP-11 UNIX*/
MAIN() /*COPY INPUT TO OUTPUT*/
\(
CHAR BUF[BUFSIZE];
INT N;
WHILE((N=READ(0,BUF,BUFSIZE))>0)
WRITE(1,BUF,N);
\)

Если размер файла не будет кратен BUFSIZE, то при некотором
обращении к READ будет возвращено меньшее число байтов, ко-
торые затем записываются с помощью WRITE; при следующем пос-
ле этого обращении к READ будет возвращен нуль.
Поучительно разобраться, как можно использовать функции
READ и WRITE для построения процедур более высокого уровня,
таких как GETCHAR, PUTCHAR и т.д. Вот, например, вариант
функции GETCHAR, осуществляющий ввод без использования буфе-
ра.

#DEFINE CMASK 0377 /*FOR MAKING CHAR'S > 0*/
GETCHAR() /*UNBUFFERED SINGLE CHARACTER INPUT*/
\(
CHAR C;
RETURN((READ(0,&C,1)>0 7 & CMASK : EOF);
\)

Переменная "C" должна быть описана как CHAR, потому что фун-
кция READ принимает указатель на символы. Возвращаемый сим-
вол должен быть маскирован числом 0377 для гарантии его по-
ложительности; в противном случае знаковый разряд может сде-
лать его значение отрицательным. (Константа 0377 подходит
для эвм PDP-11, но не обязательно для других машин).
Второй вариант функции GETCHAR осуществляет ввод больши-
ми порциями, а выдает символы по одному за обращение.

#DEFINE CMASK 0377 /*FOR MAKING CHAR'S>0*/
#DEFINE BUFSIZE 512
GETCHAR() /*BUFFERED VERSION*/
\(
STATIC CHAR BUF[BUFSIZE];
STATIC CHAR *BUFP = BUF;
STATIC INT N = 0;
IF (N==0) \( /*BUFFER IS EMPTY*/
N=READ(0,BUF,BUFSIZE);
BUFP = BUF;
\)
RETURN((--N>=0) ? *BUFP++ & CMASK : EOF);
\)


    8.3. Открытие, создание, закрытие и расцепление (UNLINK)



Кроме случая, когда по умолчанию определены стандартные
файлы ввода, вывода и ошибок, вы должны явно открывать фай-
лы, чтобы затем читать из них или писать в них. Для этой це-
ли существуют две точки входа: OPEN и CREAT.



Функция OPEN весьма сходна с функцией FOPEN, рассмотрен-
ной в главе 7, за исключением того, что вместо возвращения
указателя файла она возвращает дескриптор файла, который яв-
ляется просто целым типа INT.

INT FD;
FD=OPEN(NAME,RWMODE);

Как и в случае FOPEN, аргумент NAME является символьной
строкой, соответствующей внешнему имени файла. Однако аргу-
мент, определяющий режим доступа, отличен: RWMODE равно: 0 -
для чтения, 1 - для записи, 2 - для чтения и записи. Если
происходит какая-то ошибка, функция OPEN возвращает "-1"; в
противном случае она возвращает действительный дескриптор
файла.
Попытка открыть файл, который не существует, является
ошибкой. Точка входа CREAT предоставляет возможность созда-
ния новых файлов или перезаписи старых. В результате обраще-
ния

FD=CREAT(NAME,PMODE);