- •Предисловие
- •Предисловие к первому изданию
- •Введение
- •1. Обзор языка
- •1.1. Начнем, пожалуй
- •1.2. Переменные и арифметические выражения
- •1.3. Инструкция for
- •1.4. Именованные константы
- •1.5. Ввод-вывод символов
- •1.5.1. Копирование файла
- •1.5.2. Подсчет символов
- •1.5.3. Подсчет строк
- •1.5.4. Подсчет слов
- •1.6. Массивы
- •1.7. Функции
- •1.8. Аргументы. Вызов по значению
- •1.9. Символьные массивы
- •1.10. Внешние переменные и область видимости
- •2. Типы, операторы и выражения
- •2.1. Имена переменных
- •2.2. Типы и размеры данных
- •2.3. Константы
- •2.4. Объявления
- •2.5. Арифметические операторы
- •2.6. Операторы отношения и логические операторы
- •2.7. Преобразования типов
- •2.8. Операторы инкремента и декремента
- •2.9. Побитовые операторы
- •2.10. Операторы и выражения присваивания
- •2.11. Условные выражения
- •2.12. Приоритет и очередность вычислений
- •3. Управление
- •3.1. Инструкции и блоки
- •3.2. Конструкция if-else
- •3.3. Конструкция else-if
- •3.4. Переключатель switch
- •3.5. Циклы while и for
- •3.6. Цикл do-while
- •3.7. Инструкции break и continue
- •3.8. Инструкция goto и метки
- •4. Функции и структура программы
- •4.1. Основные сведения о функциях
- •4.2. Функции, возвращающие нецелые значения
- •4.3. Внешние переменные
- •4.4. Области видимости
- •4.5. Заголовочные файлы
- •4.6. Статические переменные
- •4.7. Регистровые переменные
- •4.8. Блочная структура
- •4.9. Инициализация
- •4.10. Рекурсия
- •4.11. Препроцессор языка Си
- •4.11.1. Включение файла
- •4.11.2. Макроподстановка
- •4.11.3. Условная компиляция
- •5. Указатели и массивы
- •5.1. Указатели и адреса
- •5.2. Указатели и аргументы функций
- •5.3. Указатели и массивы
- •5.4. Адресная арифметика
- •5.5. Символьные указатели функции
- •5.6. Массивы указателей, указатели на указатели
- •5.7. Многомерные массивы
- •5.8. Инициализация массивов указателей
- •5.9. Указатели против многомерных массивов
- •5.10. Аргументы командной строки
- •5.11. Указатели на функции
- •5.12. Сложные объявления
- •6. Структуры
- •6.1. Основные сведения о структурах
- •6.2. Структуры и функции
- •6.3. Массивы структур
- •6.4. Указатели на структуры
- •6.5. Структуры со ссылками на себя
- •6.6. Просмотр таблиц
- •6.7. Средство typedef
- •6.8. Объединения
- •6.9. Битовые поля
- •7. Ввод и вывод
- •7.1. Стандартный ввод-вывод
- •7.2. Форматный вывод (printf)
- •7.3. Списки аргументов переменной длины
- •7.4. Форматный ввод (scanf)
- •7.5. Доступ к файлам
- •7.6. Управление ошибками (stderr и exit)
- •7.7. Ввод-вывод строк
- •7.8. Другие библиотечные функции
- •7.8.1. Операции со строками
- •7.8.2. Анализ класса символов и преобразование символов
- •7.8.3. Функция ungetc
- •7.8.4. Исполнение команд операционной системы
- •7.8.5. Управление памятью
- •7.8.6. Математические функции
- •7.8.7. Генератор случайных чисел
- •8. Интерфейс с системой UNIX
- •8.1. Дескрипторы файлов
- •8.2. Нижний уровень ввода-вывода (read и write)
- •8.3. Системные вызовы open, creat, close, unlink
- •8.4. Произвольный доступ (lseek)
- •8.5. Пример. Реализация функций fopen и getc
- •8.6. Пример. Печать каталогов
- •8.7. Пример. Распределитель памяти
- •А. Справочное руководство
- •А 1. Введение
- •А 2. Соглашения о лексике
- •А 2.1. Лексемы (tokens)
- •А 2.2. Комментарий
- •А 2.3. Идентификаторы
- •А 2.4. Ключевые слова
- •А 2.5. Константы
- •А 2.5.1. Целые константы
- •А 2.5.2. Символьные константы
- •А 2.5.3. Константы с плавающей точкой
- •А 2.5.4. Константы-перечисления
- •А 2.6. Строковые литералы
- •A 3. Нотация синтаксиса
- •А 4. Что обозначают идентификаторы
- •А 4.1. Класс памяти
- •А 4.2. Базовые типы
- •А 4.3. Производные типы
- •А 4.4. Квалификаторы типов
- •А 5. Объекты и Lvalues
- •А 6. Преобразования
- •А 6.1. Целочисленное повышение
- •А 6.2. Целочисленные преобразования
- •А 6.3. Целые и числа с плавающей точкой
- •А 6.4. Типы с плавающей точкой
- •А 6.5. Арифметические преобразования
- •А 6.6. Указатели и целые
- •А 6.7. Тип void
- •А 6.8. Указатели на void
- •А 7. Выражения
- •А 7.1. Генерация указателя
- •А 7.2. Первичные выражения
- •А 7.3. Постфиксные выражения
- •А 7.3.1. Обращение к элементам массива
- •А 7.3.2. Вызов функции
- •А 7.3.3. Обращение к структурам
- •А 7.3.4. Постфиксные операторы инкремента и декремента
- •А 7.4. Унарные операторы
- •А 7.4.1. Префиксные операторы инкремента и декремента
- •А 7.4.2. Оператор получения адреса
- •А 7.4.3. Оператор косвенного доступа
- •А 7.4.4. Оператор унарный плюс
- •А 7.4.5. Оператор унарный минус
- •А 7.4.6. Оператор побитового отрицания
- •А 7.4.7. Оператор логического отрицания
- •А 7.4.8. Оператор определения размера sizeof
- •А 7.5. Оператор приведения типа
- •А 7.6. Мультипликативные операторы
- •А 7.7. Аддитивные операторы
- •А 7.8. Операторы сдвига
- •А 7.9. Операторы отношения
- •А 7.10. Операторы равенства
- •А 7.11. Оператор побитового И
- •А 7.12. Оператор побитового исключающего ИЛИ
- •А 7.13. Оператор побитового ИЛИ
- •А 7.14. Оператор логического И
- •А 7.15. Оператор логического ИЛИ
- •А 7.16. Условный оператор
- •А 7.17. Выражения присваивания
- •А 7.18. Оператор запятая
- •А 7.19. Константные выражения
- •А 8. Объявления
- •А 8.1. Спецификаторы класса памяти
- •А 8.2. Спецификаторы типа
- •А 8.3. Объявления структур и объединений
- •A 8.4. Перечисления
- •А 8.6. Что означают объявители
- •А 8.6.1. Объявители указателей
- •А 8.6.2. Объявители массивов
- •А 8.6.3. Объявители функций
- •А 8.7. Инициализация
- •А 8.8. Имена типов
- •А 8.9. Объявление typedef
- •А 8.10. Эквивалентность типов
- •А 9. Инструкции
- •А 9.1. Помеченные инструкции
- •А 9.2. Инструкция-выражение
- •А 9.3. Составная инструкция
- •А 9.4. Инструкции выбора
- •А 9.5. Циклические инструкции
- •А 9.6. Инструкции перехода
- •А 10. Внешние объявления
- •А 10.1. Определение функции
- •А 10.2. Внешние объявления
- •А 11. Область видимости и связи
- •А 11.1. Лексическая область видимости
- •А 11.2. Связи
- •А 12. Препроцессирование
- •А 12.2. Склеивание строк
- •А 12.3. Макроопределение и макрорасширение
- •А 12.4. Включение файла
- •А 12.5. Условная компиляция
- •А 12.6. Нумерация строк
- •А 12.7. Генерация сообщения об ошибке
- •А 12.8. Прагма
- •А 12.9. Пустая директива
- •А 12.10. Заранее определенные имена
- •А 13. Грамматика
- •B. Стандартная библиотека
- •В 1. Ввод-вывод: <stdio.h>
- •В 1.1. Операции над файлами
- •В 1.2. Форматный вывод
- •В 1.3. Форматный ввод
- •В 1.4. Функции ввода-вывода символов
- •В 1.5. Функции прямого ввода-вывода
- •В 1.6. Функции позиционирования файла
- •В 1.7. Функции обработки ошибок
- •В 2. Проверки класса символа: <ctype.h>
- •В 3. Функции, оперирующие со строками: <string. h>
- •В 5. Функции общего назначения: <stdlib. h>
- •В 6. Диагностика: <assert. h>
- •В 7. Списки аргументов переменной длины: <stdarg.h>
- •В 8. Дальние переходы: <setjmp. h>
- •В 9. Сигналы: <signal. h>
- •В 10. Функции даты и времени: <time.h>
- •В 11. Зависящие от реализации пределы: <limits.h> и <float.h>
- •C. Перечень изменений
изменении программы. За исключением случая с несколькими метками для одного вычисления, старайтесь по возможности реже пользоваться сквозным проходом, но если уж вы его применяете, обязательно комментируйте эти особые места.
Добрый вам совет: даже в конце последней ветви (после default в нашем примере) помещайте инструкцию break, хотя с точки зрения логики в ней нет никакой необходимости. Но эта маленькая предосторожность спасет вас, когда однажды вам потребуется добавить в конец еще одну ветвь case.
Упражнение 3.2. Напишите функцию escape(s, t), которая при копировании текста из t в s преобразует такие символы, как новая строка и табуляция в "видимые последовательности символов" (вроде \n и \t). Используйте инструкцию switch. Напишите функцию, выполняющую обратное преобразование эскейппоследовательностей в настоящие символы.
3.5. Циклы while и for
Мы уже встречались с циклами while и for. В цикле
while (выражение) инструкция
вычисляется выражение. Если его значение отлично от нуля, то выполняется инструкция, и вычисление выражения повторяется. Этот цикл продолжается до тех пор, пока выражение не станет равным нулю, после чего вычисления продолжатся с точки, расположенной сразу за инструкцией.
Инструкция for
for (выр1; выр2; выр3) инструкция
эквивалентна конструкции
выр1;
while (выр2) {
инструкция выр3;
}
если не считать отличий в поведении инструкции continue, речь о которой пойдет в параграфе 3. 7.
С точки зрения грамматики три компоненты цикла for представляют собой произвольные выражения, но чаще выр1 и выр3 — это присваивания или вызовы функций, а выр2 — выражение отношения. Любое из этих трех выражений может отсутствовать, но точку с запятой опускать нельзя. При отсутствии выр1 или выр3 считается, что их просто нет в конструкции цикла; при отсутствии выр2 предполагается, что его значение как бы всегда истинно. Например,
for (;;) {
…
}
есть "бесконечный" цикл, выполнение которого, вероятно, прерывается каким-то другим способом, например с помощью инструкций break или return.
Какой цикл выбрать: while или for — это дело вкуса. Так, в
while ((с = getchar()) == ' ' || с == '\n' || с == '\t')
; /* обойти символы-разделители */
нет ни инициализации, ни пересчета параметра, поэтому здесь больше подходит while.
Там, где есть простая инициализация и пошаговое увеличение значения некоторой переменной, больше подходит цикл for, так как в этом цикле организующая его часть сосредоточена в начале записи. Например, начало цикла, обрабатывающего первые n элементов массива, имеет следующий вид:
for (i = 0; i < n; i++)
…
Это похоже на DO-циклы в Фортране и for-циклы в Паскале. Сходство, однако, не вполне точное, так как в Си индекс и его предельное значение могут изменяться внутри цикла, и значение индекса i после выхода из цикла всегда определено. Поскольку три компоненты цикла могут быть произвольными выражениями, организация fоr-циклов не ограничивается только случаем арифметической прогрессии. Однако включать в заголовок цикла вычисления, не имеющие отношения к инициализации и инкрементированию, считается плохим стилем. Заголовок лучше оставить только для операций управления циклом.
В качестве более внушительного примера приведем другую версию программы atoi, выполняющей преобразование строки в ее числовой эквивалент. Это более общая версия по сравнению с рассмотренной в главе 2, в том смысле, что она игнорирует левые символы-разделители (если они есть) и должным образом реагирует на знаки + и -, которые могут стоять перед цифрами. (В главе 4 будет рассмотрен вариант atof, который осуществляет подобное преобразование для чисел с плавающей точкой.)
Структура программы отражает вид вводимой информации:
игнорировать символы-разделители, если они есть получить знак, если он есть взять целую часть и преобразовать ее
На каждом шаге выполняется определенная часть работы и четко фиксируется ее результат, который затем используется на следующем шаге. Обработка данных заканчивается на первом же символе, который не может быть частью числа.
#include <ctype.h>
/* atoi: преобразование s в целое число; версия 2 */ int atoi(char s[])
{
int i, n, sign;
/* игнорировать символы-разделители */ for (i = 0; isspace(s[i]); i++)
;
sign = (s[i] == '-') ? -1: 1;
if (s[i] == '+' || s[i] == '-') /* пропуск знака */ i++;
for (n = 0; isdigit(s[i]); i++) n = 10 * n + (s[i] - '0' );
return sign * n;
}
Заметим, что в стандартной библиотеке имеется более совершенная функция преобразования строки в длинное целое (long int) — функция strtol (см. параграф 5 приложения В).
Преимущества, которые дает централизация управления циклом, становятся еще более очевидными, когда несколько циклов вложены друг в друга. Проиллюстрируем их на примере сортировки массива целых чисел методом Шелла, предложенным им в 1959 г. Основная идея этого алгоритма в том, что на ранних стадиях сравниваются далеко отстоящие друг от друга, а не соседние элементы, как в обычных перестановочных сортировках. Это приводит к быстрому устранению массовой неупорядоченности, благодаря чему на более поздней стадии остается меньше работы. Интервал между сравниваемыми элементами постепенно уменьшается до единицы, и в этот момент сортировка сводится к обычным перестановкам соседних элементов. Программа shellsort имеет следующий вид:
/* shellsort: сортируются v[0] ... v[n-1] в возрастающем порядке */ void shellsort (int v[], int n)
{
int gap, i, j, temp;
for (gap = n/2; gap > 0; gap /= 2) for (i = gap; i < n; i++)
for (j = i - gap; j >= 0 && v[j] > v[j + gap]; j -= gap) { temp = v[j];
v[j] = v[j + gap]; v[j + gap] = temp;
}
}
Здесь использованы три вложенных друг в друга цикла. Внешний управляет интервалом gap между сравниваемыми элементами, сокращая его путем деления пополам от n/2 до нуля. Средний цикл перебирает элементы. Внутренний — сравнивает каждую пару элементов, отстоящих друг от друга на расстоянии gap, и переставляет элементы в неупорядоченных парах. Так как gap обязательно сведется к единице, все элементы в конечном счете будут упорядочены. Обратите внимание на то, что универсальность цикла for позволяет сделать внешний цикл по форме похожим на другие, хотя он и не является арифметической прогрессией.
Последний оператор Си — это "," (запятая), которую чаще всего используют в инструкции for. Пара выражений, разделенных запятой, вычисляется слева направо. Типом и значением результата являются тип и значение правого выражения, что позволяет в инструкции for в каждой из трех компонент иметь по нескольку выражений, например вести два индекса параллельно. Продемонстрируем это на примере функции reverse(s), которая "переворачивает" строку s, оставляя результат в той же строке s:
#include <string.h>
/* reverse: переворачивает строку s (результат в s) */ void reverse(char s[])
{
int c, i, j;
for (i = 0, j = strlen(s)-1; i < j; i++, j--) {
с = s[i]; s[i] = s[j]; s[j] = c;
}
}
Запятые, разделяющие аргументы функции, переменные в объявлениях и пр. не являются операторамизапятыми и не обеспечивают вычислений слева направо.
Запятыми как операторами следует пользоваться умеренно. Более всего они уместны в конструкциях, которые тесно связаны друг с другом (как в for-цикле программы reverse), а также в макросах, в которых
многоступенчатые вычисления должны быть выражены одним выражением. Запятой-оператором в программе reverse можно было бы воспользоваться и при обмене символами в проверяемых парах элементов строки, мысля этот обмен как одну отдельную операцию:
for (i = 0, j = strlen(s)-1; i < j; i++, j--)
с = s[i], s[i] = s[j], s[j] = c;
Упражнение 3.3. Напишите функцию expand(s1, s2), заменяющую сокращенную запись наподобие a-z в строке s1 эквивалентной полной записью abc. . . xyz в s2. В s1 допускаются буквы (прописные и строчные) и цифры. Следует уметь справляться с такими случаями, как a-b-c, a-z0-9 и -а-b. Считайте знак - в начале или в конце s1 обычным символом минус.
3.6. Цикл do-while
Как мы говорили в главе 1, в циклах while и for проверка условия окончания цикла выполняется наверху. В Си имеется еще один вид цикла, do-while, в котором эта проверка в отличие от while и for делается внизу после каждого прохождения тела цикла, т. е. после того, как тело выполнится хотя бы один раз. Цикл do- while имеет следующий синтаксис:
do
инструкция while (выражение);
Сначала выполняется инструкция, затем вычисляется выражение. Если оно истинно, то инструкция выполняется снова и т. д. Когда выражение становится ложным, цикл заканчивает работу. Цикл do-while эквивалентен циклу repeat-until в Паскале с той лишь разницей, что в первом случае указывается условие продолжения цикла, а во втором — условие его окончания.
Опыт показывает, что цикл do-while используется гораздо реже, чем while и for . Тем не менее, потребность в нем время от времени возникает, как, например, в функции itoa (обратной по отношению к atoi), преобразующей число в строку символов. Выполнить такое преобразование оказалось несколько более сложным делом, чем ожидалось, поскольку простые алгоритмы генерируют цифры в обратном порядке. Мы остановились на варианте, в котором сначала формируется обратная последовательность цифр, а затем она реверсируется.
/* itoa: преобразование n в строку s */ void itoa (int n, char s[])
{
int i, sign;
if ((sign = n) < 0) /* сохраняем знак */ n = -n; /* делаем n положительным */
i = 0;
do { /* генерируем цифры в обратном порядке */ s[i++] = n % 10 + '0'; /* следующая цифра */
} while ((n /= 10) > 0); /* исключить ее */ if (sign < 0)
s[i++] = '-'; s[i] = '\0'; reverse(s);
}
Конструкция do-while здесь необходима или по крайней мере удобна, поскольку в s посылается хотя бы один символ, даже если n равно нулю. В теле цикла одну инструкцию мы выделили фигурными скобками