Как на самом деле работает gcc
Примечание. Для работы была использована ОС FreeBSD и весь машинный вывод соответствует именно ей.
В этом примере будет использована следующая простая программа. Она называется "myprogram.c". Отладочный вывод gcc и других программ бывает довольно длинным. Для повышения удобочитаемости были вставлены переводы строк предваренные символом '\'.
#include <math.h>
#include <stdio.h>
#define PI 3.1415926543
int main() {
printf("sin(pi) = %f\n", sin(PI));
printf("sin(pi/2) = %f\n", sin(PI/2));
exit(0);
}
Для того чтобы скомпилировать программу необходимо скомпоновать (слинковать) ее с библиотекой математических функций libm. Это делается с помощью флага -l.
%gcc -o myprogram myprogram.c –lm
Сам по себе gcc не делает много работы, за исключением вызова различных утилит. Этот процесс можно наблюдать если дать gcc ключ -v.
%gcc -save-temps -v -o myprogram myprogram.c –lm
Отладочный вывод можно увидеть ниже.
Using builtin specs.
gcc version 2.95.3 20010315 (release) [FreeBSD]
Предыдущие две строки не интересуют нас в данный момент.
Первая программа которую вызывает gcc -- это cpp, препроцессор языка С. Он обрабатывает строки содержащие #define, #ifdef, #include и тд. и приводит их к необходимому компилятору виду.
/usr/libexec/cpp0 -lang-c -v -D__GNUC__=2 -D__GNUC_MINOR__=95 -Di386 -D__FreeBSD__=4 \
-D__FreeBSD_cc_version=440000 -Dunix -D__i386__ -D__FreeBSD__=4 -D__FreeBSD_cc_version=440000 \
-D__unix__ -D__i386 -D__unix -Acpu(i386) -Amachine(i386) -Asystem(unix) -Asystem(FreeBSD) \
-Acpu(i386) -Amachine(i386) -Di386 -D__i386 -D__i386__ -D__ELF__ myprogram.c myprogram.i
Эти строки -- отладочный вывод препроцессора С, который получил ключ -v, который в свою очередь ранее был передан программе gcc. Первая строка содержащая #include говорит о том, что производится поиск файлов соответствующих строкам вида #include "something.h", такой поиск производится только в текущей директории. Строка следующая за ней, говорит что производится поиск файлов соответствующих строкам вида #include <something.h>, и производится он в директориях указанных ниже.
GNU CPP version 2.95.3 20010315 (release) [FreeBSD] (i386 FreeBSD/ELF)
#include "..." search starts here:
#include <...> search starts here:
/usr/include
/usr/include
End of search list.
The following default directories have been omitted from the search path:
/usr/include/g++
End of omitted list.
На этом месте все строки начинающиеся с #ifdef, #if, #include, #define и тд. уходят. Добавляется содержимое всех #include-файлов. Все макросы (#define) расширяются. Строки стоящие между директивами #if (или #ifdef, или #ifndef) и #endif (или #else) будут удалены если утверждения в них оказались ложными. Для того чтобы увидеть вывод препроцессора просмотрите файл myprogram.i, который сохранился благодаря ранее переданному ключу -save-temps.
Теперь за дело принимается собственно компилятор, который и превращает препроцессированый код в программу на ассемблере (как видим gcc это оболочка).
/usr/libexec/cc1 myprogram.i -quiet -dumpbase myprogram.c -version -o myprogram.s
GNU C version 2.95.3 20010315 (release) [FreeBSD] (i386-unknown-freebsd) compiled
by GNU C version 2.95.3 20010315 (release) [FreeBSD].
В данном месте будет создан файл myprogramm.s. Вы можете просмотреть его если любите читать ассемблерные листинги.
/usr/libexec/elf/as -v -o myprogram.o myprogram.s
GNU assembler version 2.11.2 20010719 [FreeBSD] (i386-unknown-freebsd4) using
BFD version 2.11.2 20010719 [FreeBSD]
Далее для создания файла с машинными кодами вызывается ассемблер. Машинный код помещается в объектный файл (.o).
Теперь все готово к линковке. На этой стадии берутся различные объектные (.о) и архивные (.а) (они так же называются статические библиотеки) файлы, разделяемые библиотеки (.sl или .so, в зависимости от системы) и их содержимое вставляется в исполняемый файл.
/usr/libexec/elf/ld -m elf_i386 -dynamic-linker
/usr/libexec/ld-elf.so.1 -o myprogram
/usr/lib/crt1.o /usr/lib/crti.o /usr/lib/crtbegin.o
-L/usr/libexec/elf
-L/usr/libexec
-L/usr/lib myprogram.o
-lm -lgcc -lc -lgcc /usr/lib/crtend.o /usr/lib/crtn.o
Каждый флаг -L указывает на директорию, в которой следует искать необходимые библиотеки. Сами библиотеки указываются с помощью ключа -l. Следует обратить внимание что последняя команда содержит в себе ключи "-lm, -lgcc, -lc". Этот шаг завершится успешно только если все символы во всех обьектных (.о) файлах будут найдены или в объектных файлах или в библиотеках libm.a, libgcc.a и libc.a.
Для того, чтобы увидеть, какие символы нужны файлу myprogram.o вы можете запустить утилиту nm.
%nm myprogram.o
U exit
00000000 t gcc2_compiled.
00000000 T main
U printf
U sin
Символы содержащие перед собой символ 'U' (undef) следует искать в других файлах. Если есть необходимость самостоятельно найти какой либо символ, то можно вновь использовать программу nm.