той. Если одна из вариантных констант оказывается равной
значению этого выражения, то управление передается опера-
тору, который следует за совпадающим вариантным префиксом.
Если ни одна из вариантных констант не совпадает со


-36-


значением выражения и если при этом присутствует префикс
default, то управление передается оператору, помеченному
этим префиксом. Если ни один из вариантов не подходит и пре-
фикс default отсутствует, то ни один из операторов в перек-
лючателе не выполняется.

Сами по себе префиксы case и default не изменяют выпол-
нения программы, программа выполняется последовательно, пока
не встретится явная передача управления. Для выхода из
переключателя имеется оператор break (п.0.8).

Обычно оператор, который входит в переключатель, явля-
ется составным. Описания могут появляться в начале этого
оператора, но инициализации автоматических и регистровых
переменных будут неэффективными.

Пример:

switch (regim) {
case 'x': regx++;
case 'X': case 'Y': regY++; break;
case '-': regx = 0; break;
default: err("Ошибка"); goto next;
}


    6.8. Оператор break



Оператор

break;

вызывает завершение выполнения наименьшего охватывающего
этот оператор оператора while, do, for или switch; управле-
ние передается оператору, следующему за завершенным операто-
ром.

    6.9. Оператор continue



Оператор

continue;

приводит к передаче управления на продолжающую цикл часть
наименьшего охватывающего этот оператор оператора while, do
или for; то есть на конец цикла. Более точно, в каждом из
операторов

while(...) { | do { | for(...) {
... | ... | ...
contin: ; | contin: ; | contin: ;
} | } while(...); | }

-37-


оператор continue эквивалентен оператору goto contin. (За
contin: следует пустой оператор; см. п. 0.13.).

    6.10. Оператор возврата



Возвращение из функции в вызывающую программу осуществ-
ляется с помощью оператора return, который имеет одну из
следующих форм

return;
return выражение;

В первом случае возвращаемое значение неопределено. Во вто-
ром случае в вызывающую функцию возвращается значение выра-
жения. Если требуется, выражение преобразуется к типу функ-
ции, в которой оно появляется, как в случае присваивания.
Попадание на конец функции эквивалентно возврату без возвра-
щаемого значения.

Возвращать можно значение арифметического типа, а также
структуру (но не массив).

    6.11. Оператор goto



Управление можно передавать безусловно с помощью опера-
тора

goto идентификатор1

Идентификатор должен быть меткой (п. 0.12), локализованной в
данной функции.

    6.12. Помеченный оператор



Перед любым оператором может стоять метка, имеющая вид:

идентификатор:

Метки используются только для указания места, куда переда-
ется управление оператором goto. Областью действия метки
является данная функция, за исключением тех подблоков, в
которых тот же идентификатор описан снова.

    6.13. Пустой оператор



Пустой оператор имеет форму:

;

Пустой оператор оказывается полезным, так как он позволяет
поставить метку перед закрывающей скобкой } составного опе-
ратора или указать пустое тело в операторах цикла, таких как
while.


-38-


    * 7. ВНЕШНИЕ ОПРЕДЕЛЕНИЯ



Си-программа представляет собой последовательность
внешних определений. Внешнее определение описывает идентифи-
катор как имеющий класс памяти extern (по умолчанию), или,
возможно, static, и специфицированный тип. Спецификатор типа
также может быть пустым; в этом случае считается, что тип
является типом int. Область действия внешних определений
распространяется до конца файла, в котором они приведены,
точно так же, как влияние описаний простирается до конца
блока. Синтаксис внешних определений не отличается от син-
таксиса описаний, за исключением того, что только на этом
уровне можно приводить текст функций.

    7.1. Внешнее определение функции



Определение функции имеет форму

определение_функции:
спецификаторы_описания описа-
необ
тель_функции тело_функции

Единственными спецификаторами класса памяти, допускаемыми в
качестве спецификаторов-описания, являются extern или
static; о различии между ними смотри в следующем разделе.
Описатель функции подобен описателю для функции, возвращаю-
щей ..., за исключением того, что он перечисляет формальные
параметры определяемой функции.

описатель_функции:
описатель (список_параметров)
необ
список параметров:
идентификатор
идентификатор, список_параметров

Тело_функции имеет форму

тело_функции:
список_описаний составной_оператор

Идентификаторы из списка параметров могут быть описаны в
списке описаний. Любой идентификатор из этого списка, тип
которого не указан, считается имеющим тип int. Единственным
допустимым здесь спецификатором класса памяти является
register; если такой класс памяти специфицирован, то в
начале выполнения функции соответствующий фактический пара-
метр копируется, если это возможно, в регистр.

Вот простой пример полного определения функции:

-39-


int max(a, b, c)
int a, b, c;
{
int m;
m = (a>b) ? a:b;
return((m>c) ? m:c);
}

Здесь int - спецификатор-типа, maх(a,b,c) -
описатель_функции, int a,b,c; - список-описаний формальных
параметров, { ... } - блок, содержащий текст оператора.

В языке Си все фактические параметры типа float преоб-
разуются к типу double, так что описания формальных парамет-
ров, объявленных как float, могут работать с параметрами
типа double. Аналогично, поскольку ссылка на массив в любом
контексте (в частности в фактическом параметре) рассматрива-
ется как указатель на первый элемент массива, описания фор-
мальных параметров вида массив ... могут работать с факти-
ческими параметрами типа указатель на ... И наконец, пос-
кольку функции не могут быть переданы функции, бессмысленно
описывать формальный параметр как функцию (указатели на
такие объекты, конечно, допускаются).

ПРИМЕЧАНИЕ

В некоторых версиях языка Си, в частности, в версиях
для микропроцессоров, может быть запрещена передача
структур и объединений через параметры функции.

    7.2. Внешние определения данных



Внешнее определение данных имеет форму:

определение_данных:
описание

Классом памяти таких данных может быть extern (в частности,
по умолчанию) или static, но не auto или register.

    * 8. ОБЛАСТЬ ДЕЙСТВИЯ ИДЕНТИФИКАТОРОВ



Вся Си-программа не обязательно компилируется одновре-
менно; исходный текст программы может храниться в нескольких
файлах и ранее скомпилированные процедуры могут загружаться
из библиотек. Связь между функциями может осуществляться как
через явные обращения, так и в результате работы редактора
связей.

Поэтому следует рассмотреть два вида областей действия:
во первых, ту, которая может быть названа лексической
областью действия идентификатора и которая по существу
является той областью в программе, где этот идентификатор


-40-


можно использовать, не вызывая диагностического сообщения
"неопределенный идентификатор"; и во-вторых, область дейст-
вия, которая связана с внешними идентификаторами и которая
характеризуется правилом, что ссылки на один и тот же внеш-
ний идентификатор являются ссылками на один и тот же объект.

    8.1. Лексическая область действия



Лексическая область действия идентификаторов, описанных
во внешних определениях, простирается от определения до
конца исходного файла, в котором он находится. Лексическая
область действия идентификаторов, являющихся формальными
параметрами, распространяется на ту функцию, к которой они
относятся. Лексическая область действия идентификаторов,
описанных в начале блока, простирается до конца этого блока.
Лексической областью действия меток является та функция, в
которой они находятся.

Поскольку все ссылки на один и тот же внешний идентифи-
катор относятся к одному и тому же объекту, компилятор про-
веряет все описания одного и того же внешнего идентификатора
на совместимость; в действительности их область действия
распространяется на весь файл, в котором они находятся.

Во всех случаях, однако, если некоторый идентификатор
явным образом описан в начале блока, включая и блок, который
образует функцию, то действие любого описания этого иденти-
фикатора вне блока приостанавливается до конца этого блока.

Напомним также, что идентификаторы, соответствующие
обычным переменным, с одной стороны, и идентификаторы, соот-
ветствующие членам и ярлыкам структур и объединений, с дру-
гой стороны, формируют два непересекающихся класса, которые
не вступают в противоречие. Члены и ярлыки структур подчиня-
ются тем же самым правилам определения областей действия,
как и другие идентификаторы. Имена, специфицируемые с
помощью typedef, входят в тот же класс, что и обычные иден-
тификаторы. Они могут быть переопределены во внутренних
блоках, но во внутреннем описании тип должен быть указан
явно:

typedef float distance;
...
{
auto int distance;
...

Во втором описании спецификатор типа int должен присутство-
вать, так как в противном случае это описание будет принято
за описание без описателей с типом distance.


-41-


    8.2. Область действия внешних идентификаторов



Если функция ссылается на идентификатор, описанный как
extern, то где-то среди файлов или библиотек, образующих
полную программу, должно содержаться внешнее определение
этого идентификатора. Все функции данной программы, которые
ссылаются на один и тот же внешний идентификатор, ссылаются
на один и тот же объект, так что следует позаботиться, чтобы
специфицированные в этом определении тип и размер были сов-
местимы с типом и размером, указываемыми в каждой функции,
которая ссылается на эти данные.

Появление ключевого слова extern во внешнем определении
указывает на то, что память для описанных в нем идентифика-
торов будет выделена в другом файле. Следовательно, в состо-
ящей из многих файлов программе внешнее определение иденти-
фикатора, не содержащее спецификатора extern, должно появ-
ляться только в одном из этих файлов. Любые другие файлы,
которые желают дать внешнее определение этого идентифика-
тора, должны включать в это определение слово extern. Иден-
тификатор может быть инициализирован только в том описании,
которое приводит к выделению памяти.

Из этого правила в ОС ДЕМОС имеется исключение. Внешний
объект может присутствовать в нескольких описаниях без
extern. При этом длина объекта в разных описаниях должна
совпадать, а инициализация, если она есть, должна прово-
диться ровно в одном из описаний. При нарушении этих правил
будет выдана ошибка на этапе редактировании связей прог-
раммы.

Идентификаторы, внешнее определение которых начинается
со слова static, недоступны из других файлов. Функции могут
быть описаны как static.

    8.3. Неявные описания



Не всегда необходимо специфицировать и класс памяти и
тип идентификатора в описании. Во внешних определениях и
описаниях формальных параметров и членов структур класс
памяти определяется по контексту. Если в находящемся внутри
функции описании не указан тип, а только класс памяти, то
предполагается, что идентификатор имеет тип int; если не
указан класс памяти, а только тип, то идентификатор предпо-
лагается описанным как auto. Исключение из последнего пра-
вила дается для функций, потому что спецификатор auto для
функций является бессмысленным (язык Си не в состоянии ком-
пилировать программу в стек); если идентификатор имеет тип
функция, возвращающая ..., то он предполагается неявно опи-
санным как extern.

Входящий в выражение и неописанный ранее идентификатор,
за которым следует скобка (, считается описанным по


-42-


контексту как функция, возвращающая int.

/* extern */ int tab[100];
static /* int */ t1;
/* int */ func(i) /* int i; */
{ register /* int */ k;
/* auto */ char buf[512];
/* extern int f1(); */
... f1(a,b) ...


    * 9. ПРЕПРОЦЕССОР ЯЗЫКА 'СИ'



Компилятор языка Си содержит препроцессор, который поз-
воляет осуществлять макроподстановки, условную компиляцию и
включение именованных файлов. Строки, начинающиеся с #,
являются командами этого препроцессорa. Синтаксис этих строк
не связан с остальным языком; они могут появляться в любом
месте и их влияние распространяется (независимо от области
действия) до конца исходного программного файла. Фактически
препроцессор расширяет возможности языка Си, реализуя такие
функции, которые в других языках входят в состав самого
языка (например, параметрические константы в Фортране-77).

    9.1. Замена лексем



Команда

#define идентификатор строка_лексем

(обратите внимание на отсутствие в конце точки с запятой)
приводит к тому, что препроцессор заменяет последующие вхож-
дения этого идентификатора на указанную строку лексем.
Строка вида

#define идентификатор(идентифика-
тор,...,идентификатор) строка_лексем

где между первым идентификатором и открывающейся скобкой "("
нет пробела, представляет собой макроопределение с аргумен-
тами. В дальнейшем первый идентификатор, за которым следует
открывающая скобка "(", последовательность разделенных запя-
тыми лексем и закрывающая скобка ")", заменяются строкой
лексем из определения. Каждое вхождение идентификатора, упо-
мянутого в списке формальных параметров в определении, заме-
няется соответствующей строкой лексем из обращения. Факти-
ческими аргументами в обращении являются строки лексем, раз-
деленные запятыми; однако запятые, входящие в закавыченные
строки или заключенные в круглые скобки, не разделяют аргу-
ментов. Количество формальных и фактических параметров
должно совпадать. Текст внутри строки или символьной конс-
танты не подлежит замене.

-43-


В обоих случаях замененная строка просматривается снова
с целью обнаружения других идентификаторов, известных преп-
роцессору. В обоих случаях слишком длинная строка определе-
ния может быть продолжена на другой строке, если поместить в
конце продолжаемой строки обратную косую черту "\".

Описываемая возможность особенно полезна для определе-
ния "объявляемых констант", как, например,

#define TABSIZE 100
int table[TABSIZE];

или для замены некоторых функций с помощью макроподстановки:

#define max(a,b) ((a)>(b)?(a):(b))
x = max(y,20)

(в последнем определении a и b взяты в скобки, для того,
чтобы фактическими параметрами макро могли бы быть произ-
вольные выражения.

Команда

#undef идентификатор

приводит к отмене препроцессорного определения данного иден-
тификатора.

Определить идентификатор можно не только с помощью
команды #define, но также и при вызове компилятора, с
помощью параметров команды cc.

    9.2. Включение файлов



Команда

#include "filename"


приводит к замене этой строки на все содержимое файла с име-
нем filename. Файл с этим именем сначала ищется в текущем
справочнике, а затем в других "стандартных" местах, опреде-
ляемых пользователем при вызове компилятора. В отличие от
этого команда

#include <filename>

ищет файл только в стандартном справочнике системы.

В ОС ДЕМОС файл ищется в справочнике /usr/include.

Команды #include могут быть вложенными.

-44-


    9.3. Условная компиляция



Команда препроцессора

#if константное выражение

проверяет, отлично ли от нуля значение константного выраже-
ния. Команда:

#ifdef идентификатор

проверяет, определен ли этот идентификатор в настоящий
момент в препроцессоре, т.е. определен ли этот идентификатор
с помощью команды #define. Команда:

#ifndef идентификатор

проверяет, является ли этот идентификатор в данный момент не
определенным для препроцессора.

За каждым из трех перечисленных видов строк может сле-
довать произвольное число строк, возможно содержащих команду
препроцессора

#else

а затем должна следовать команда:

#endif

Если проверяемое условие истинно, то любые строки между
#else и #endif игнорируются. Если проверяемое условие ложно,
то любые строки между проверяемой строкой и #else или, при
отсутствии #else, #endif игнорируются.

Эти конструкции могут быть вложенными.

Например:

#ifdef DEBUG
fprintf(stderr,"i=%o j=%d\n",i,j);
#endif

Переменная препроцессора может быть определена не только в
самой программе, но и при вызове транслятора.

    9.4. Команда #line



Для других препроцессоров, генерирующих Си-программы,
полезна следующая команда:

#line константа "имя_файла"

-45-


которая сообщает компилятору (для диагностических сообще-
ний), что следующая строка исходного файла имеет номер,
задаваемый константой, и что текущий входной файл именуется
именем_файла. Если имя_файла отсутствует, то запоминаемое
имя файла не изменяется. Пример:

#line 250 "gram.y"


    * 10. ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ О ТИПАХ



В этом разделе обобщаются сведения об операциях, кото-
рые можно применять только к объектам определенных типов.

    10.1. Структуры и объединения



Со структурами и объединениями могут производиться сле-
дующие операции: ссылка на один из членов структуры или
объединения (с помощью операции .), получение адреса (с
помощью унарной операции &), присваивание структуры струк-
туре, передача структуры в качестве формального параметра,
возврат структуры функцией. Все остальные операции запре-
щены.

В реализации возвращения структур функциями на CM-ЭВМ
имеется коварный дефект: если во время возврата происходит
прерывание и та же самая функция реентерабельно вызывается
во время этого прерывания, то значение, возвращаемое из пер-
вого вызова, может быть испорчено. Эта трудность может воз-
никнуть только при наличии истинного прерывания, как из опе-
рационной системы, так и из программы пользователя; прерыва-
ния, которое действительно асинхронно; обычные рекурсивные
вызовы совершенно безопасны.

В разделе "Выражения" говорится, что при прямой или
косвенной ссылке на структуру (с помощью . или ->) имя
справа должно быть членом конструкции, названной или указан-
ной выражением слева. Это ограничение не навязывается строго
компилятором, чтобы дать возможность обойти правила соот-
ветствия типов. В действительности перед . допускается
любое l_значение и затем предполагается, что это l_значение
имеет форму структуры, для которой стоящее справа имя явля-
ется членом. Таким же образом, от выражения, стоящего перед
->, требуется только быть указателем или целым. В случае
указателя предполагается, что он указывает на структуру, для
которой стоящее справа имя является членом. В случае целого
оно рассматривается как абсолютный адрес соответствующей
структуры, заданный в единицах машинной памяти.

Такие структуры не являются переносимыми.


-46-


    10.2. Функции



Только две операции можно применять к функции: вызвать
ее или извлечь ее адрес. Если имя функции входит в выражение
не в позиции имени функции, соответствующей обращению к ней,
то генерируется указатель на эту функцию. Следовательно,
чтобы передать одну функцию другой, можно написать

int f();
...
g(f);

тогда определение функции g могло бы выглядеть так:

g(funcp)
int (*funcp)();
{
...
(*funcp)();
...
}

Обратите внимание, что в вызывающей процедуре функция f
должна быть описана явно, потому что за ее появлением в g(f)
не следует скобка "(".

    10.3. Массивы, указатели и индексация



Каждый раз, когда идентификатор, имеющий тип массива,
появляется в выражении, он преобразуется в указатель на пер-
вый член этого массива. Из-за этого преобразования массивы
не являются l_значениями. По определению операция индексации
"[]" интерпретируется таким образом, что e1[e2] считается
идентичным выражению *((e1)+(e2)). Согласно правилам преоб-
разований, применяемым при операции +, если e1 - массив, а
e2 - целое, то e1[e2] ссылается на e2-й член массива e1.
Поэтому, несмотря на несимметричный вид, операция индексации
является коммутативной.

В случае многомерных массивов применяется аналогичное
правило. Если e является n-мерным массивом размера
i*j*...*k, то при появлении в выражении e преобразуется в
указатель на (n-1)-мерный массив размера j*...*k. Если опе-
рация * либо явно, либо неявно, как результат индексации,
применяется к этому указателю, то результатом операции будет
указанный (n-1)-мерный массив, который сам немедленно преоб-
разуется в указатель.

Рассмотрим, например, описание:

int u[3][5];

Здесь u - массив целых размера 3*5. При появлении в


-47-


выражении u преобразуется в указатель на первый из трех мас-
сивов из 5 целых. В выражении u[i], которое эквивалентно
*(u+i), сначала u преобразуется в указатель так, как описано
выше; затем i преобразуется к типу u, что вызывает умножение
i на длину объекта, на который указывает указатель, а именно
на 5 целых объектов. Результаты складываются, и применение
косвенной адресации дает массив (из 5 целых), который в свою
очередь преобразуется в указатель на первое из этих целых.
Если в выражение входит и другой индекс, то та же самая
аргументация применяется снова; результатом на этот раз
будет целое.

Из всего этого следует, что массивы в языке Си хранятся
построчно (последний индекс изменяется быстрее всего) и что
первый индекс в описании помогает определить общее коли-
чество памяти, требуемое для хранения массива, но не играет
никакой другой роли в вычислениях, связанных с индексацией.

    10.4. Явные преобразования указателей



Разрешаются определенные преобразования с использова-
нием указателей. Они имеют некоторые зависящие от конкрет-
ной реализации аспекты. Все эти преобразования задаются с
помощью операции явного преобразования типа.

Указатель может быть преобразован в любой из целочис-
ленных типов, достаточно большой для его хранения. Требуется
ли при этом int или long, зависит от конкретной машины (в ОС
ДЕМОС для СМ ЭВМ требуется int). Преобразующая функция
также является машинно-зависимой, но она будет вполне
естественной для тех, кто знает структуру адресации в
машине. Детали для некоторых конкретных машин приводятся
ниже.

Объект целочисленного типа может быть явным образом
преобразован в указатель. Такое преобразование всегда пере-
водит преобразованное из указателя целое в тот же самый ука-
затель, но в других случаях оно будет машинно-зависимым.

Указатель на один тип может быть преобразован в указа-
тель на другой тип. Если преобразуемый указатель не указы-
вает на объекты, которые подходящим образом выравнены в
памяти, то результирующий указатель может при использовании
вызывать ошибки адресации. Гарантируется, что указатель на
объект заданного размера может быть преобразован в указатель
на объект меньшего размера и снова обратно, не претерпев при
этом изменения.

Например, процедура распределения памяти alloc могла бы
принимать запрос на размер выделяемого объекта в байтах, а
возвращать указатель на символы; это можно было бы использо-
вать следующим образом.

-48-


extern char *alloc();
double *dp;
dp=(double*) alloc(sizeof(double));
*dp=22.0/7.0;

Функция alloc должна обеспечивать (машинно-зависимым спосо-
бом), что возвращаемое ею значение будет подходящим для пре-
образования в указатель на double; в таком случае использо-
вание этой функции будет переносимым.

Представление указателя на CM-ЭВМ соответствует 16-
битовому целому и измеряется в байтах. Объекты типа char не
имеют никаких ограничений на выравнивание; все остальные
объекты должны иметь четные адреса.

    * 11. КОНСТАНТНЫЕ ВЫРАЖЕНИЯ



В нескольких местах в языке Си требуются выражения,
которые после вычисления становятся константами: после вари-
антного префикса case, в качестве границ массивов и в иници-
ализаторах. В первых двух случаях выражение может содержать
только целые константы, символьные константы и выражения
sizeof, возможно связанные либо бинарными операциями