天天看点

GNU Binutils之nm

 GNU Binutils之nm

 作者:makethyme

nm用于列出目标文件的符号清单,如果没有指定目标文件,则默认为“a.out”。nm的格式如下:

nm [‘-a’|‘--debug-syms’] [‘-g’|‘--extern-only’]          [‘-B’] [‘-C’|‘--demangle’[=style]] [‘-D’|‘--dynamic’]          [‘-S’|‘--print-size’] [‘-s’|‘--print-armap’]          [‘-A’|‘-o’|‘--print-file-name’][‘--special-syms’]          [‘-n’|‘-v’|‘--numeric-sort’] [‘-p’|‘--no-sort’]          [‘-r’|‘--reverse-sort’] [‘--size-sort’] [‘-u’|‘--undefined-only’]          [‘-t’ radix|‘--radix=’radix] [‘-P’|‘--portability’]          [‘--target=’bfdname] [‘-f’format|‘--format=’format]          [‘--defined-only’] [‘-l’|‘--line-numbers’] [‘--no-demangle’]         [‘-V’|‘--version’] [‘-X 32_64’] [‘--help’] [objfile...]   对于每一个符号,nm列出其值(the symbol value),类型(the symbol type)和其名字(the symbol name)。 如下例:         00000024 T cleanup_before_linux      00000018 T cpu_init      00000060 T dcache_disable      00000054 T dcache_enable      0000006c T dcache_status      00000000 T do_reset      0000003c T icache_disable      00000030 T icache_enable      00000048 T icache_status   上面的显示是使用nm cpu.o的输出,对于cleanup_before_linux这个符号来说,00000024是以16进制显示的其值,T为其类型,而cleanup_before_linux是其名字。可以看出,上面显示的 cleanup_before_linux 这个 symbol 的值实际上是该函数在 text section 中的偏移。但是,每个符号的值的具体含义依其类型而异。当然,对于每个符号的值,其类型、其值以及它们所属的section是密切相关的。 下面说明符号类型: 对于每一个符号来说,其类型如果是小写的,则表明该符号是local的;大写则表明该符号是global(external)的。

符号 类型 说明
A 该符号的值是绝对的,在以后的链接过程中,不允许进行改变。这样的符号值,常常出现在中断向量表中,例如用符号来表示各个中断向量函数在中断向量表中的位置。
B 该符号的值出现在非初始化数据段 (bss) 中。例如,在一个文件中定义全局 static int test 。则该符号 test 的类型为 b ,位于 bss section 中。其值表示该符号在 bss 段中的偏移。一般而言, bss 段分配于 RAM 中
C 该符号为 common 。 common symbol 是未初始话数据段。该符号没有包含于一个普通 section 中。只有在链接过程中才进行分配。符号的值表示该符号需要的字节数。例如在一个 c 文件中,定义 int test ,并且该符号在别的地方会被引用,则该符号类型即为 C 。否则其类型为 B 。
D 该符号位于初始话数据段中。一般来说,分配到 data section 中。例如定义全局 int baud_table[5] = {9600, 19200, 38400, 57600, 115200} ,则会分配于初始化数据段中 。
G 该符号也位于初始化数据段中。主要用于 small object 提高访问 small data object 的一种方式。
I 该符号是对另一个符号的间接引用。
N 该符号是一个 debugging 符号。
R 该符号位于只读数据区。例如定义全局 const int test[] = {123, 123}; 则 test 就是一个只读数据区的符号。注意在 cygwin 下如果使用 gcc 直接编译成 MZ 格式时,源文件中的 test 对应 _test ,并且其符号类型为 D ,即初始化数据段中。但是如果使用 m6812-elf-gcc 这样的交叉编译工具,源文件中的 test 对应目标文件的 test, 即没有添加下划线,并且其符号类型为 R 。一般而言,位于 rodata section 。值得注意的是,如果在一个函数中定义 const char *test = “abc”, const char test_int = 3 。使用 nm 都不会得到符号信息,但是字符串“ abc ”分配于只读存储器中, test 在 rodata section 中,大小为 4 。
S 符号位于非初始化数据区,用于 small object 。
T 该符号位于代码区 text section 。
U 该符号在当前文件中是未定义的,即该符号的定义在别的文件中。例如,当前文件调用另一个文件中定义的函数,在这个被调用的函数在当前就是未定义的;但是在定义它的文件中类型是 T 。但是对于全局变量来说,在定义它的文件中,其符号类型为 C ,在使用它的文件中,其类型为 U 。
V 该符号是一个 weak object 。
W The symbol is a weak symbol that has not been specifically tagged as a weak object symbol.
- 该符号是 a.out 格式文件中的 stabs symbol 。
? 该符号类型没有定义

下面是关于命令选项的一些说明。 

命令选项                 说明
-A      -o --print-file-name 在每个符号前,指明其所属的 archieve 或者是 file 。如 libtest.a:interrupt.o:00000024 T cleanup_before_linux
-a     --debug-syms 显示所有的符号,包含 debugging-only symbols.
-B 等同于 —format=bsd ,用于兼容 MIPS 的 nm 。
-C --demangle[=style] 将低级符号名解析成用户级符号名。这样可以使 C++ 函数具有可读性。例如 00000000 T _ZN6MyTest3sumEii 被解析成 00000000 T MyTest::sum(int, int) 。这样一来这样的符号便具有可读性。
--no-demangle 默认的选项。不需要将低级符号名解析成用户级符号名。
-f format --format=format 使用 format 格式输出, format 可以选取为 bsd, sysv 或 posix 。默认为 bsd 。区别如下例: 00000000 T _ZN6MyTest3sumEii _ZN6MyTest3sumEii   |00000000|   T |              FUNC|00000021|     |.text _ZN6MyTest3sumEii T 00000000 00000021
-g    --extern-only 仅显示外部符号
-l     --line-numbers 对于每一个行号,使用调试信息来找到文件名和行号。对于定义的符号,显示该符号定义的文件和行号。对于未定义的符号,给出符号重定位入口的文件和行号。
-n     -v --numberic-sort 将符号按对应的地址进行排序,而不是采用默认的按符号名进行排序。
-p    --no-sort 显示符号时,不进行排序,按其在目标文件出现的顺序进行显示。
-P    --portability 等同于 -f posix 。
-S    --print-size 使用 BSD 格式输出时,显示符号的大小。
-s     --print-armap 当列出库中的符号名时,包含索引。索引的内容指那一个符号定义在那一个模块 ( 文件 ) 中。
-r     --reverse-sort 反序输出
--size-sort 按符号的大小排序输出。
-t radix --radix=radix 使用指定的进制来打印符号值
--target=bfdname 指定目标代码的格式,而不是使用系统的默认格式。
-u    --undefined-only 显示没有定义的符号
--defined-only 显示定义的符号
-V --version 显示 nm 的版本号
--help 帮助

继续阅读