GNU Binutils之nm
作者:makethyme
nm用于列出目标文件的符号清单,如果没有指定目标文件,则默认为“a.out”。nm的格式如下:
nm [‘-a’|‘--debug-syms’] [‘-g’|‘--extern-only’] [‘-B’] [‘-C’|‘--demangle’[=style]] [‘-D’|‘--dynamic’] [‘-S’|‘--print-size’] [‘-s’|‘--print-armap’] [‘-A’|‘-o’|‘--print-file-name’][‘--special-syms’] [‘-n’|‘-v’|‘--numeric-sort’] [‘-p’|‘--no-sort’] [‘-r’|‘--reverse-sort’] [‘--size-sort’] [‘-u’|‘--undefined-only’] [‘-t’ radix|‘--radix=’radix] [‘-P’|‘--portability’] [‘--target=’bfdname] [‘-f’format|‘--format=’format] [‘--defined-only’] [‘-l’|‘--line-numbers’] [‘--no-demangle’] [‘-V’|‘--version’] [‘-X 32_64’] [‘--help’] [objfile...] 对于每一个符号,nm列出其值(the symbol value),类型(the symbol type)和其名字(the symbol name)。 如下例: 00000024 T cleanup_before_linux 00000018 T cpu_init 00000060 T dcache_disable 00000054 T dcache_enable 0000006c T dcache_status 00000000 T do_reset 0000003c T icache_disable 00000030 T icache_enable 00000048 T icache_status 上面的显示是使用nm cpu.o的输出,对于cleanup_before_linux这个符号来说,00000024是以16进制显示的其值,T为其类型,而cleanup_before_linux是其名字。可以看出,上面显示的 cleanup_before_linux 这个 symbol 的值实际上是该函数在 text section 中的偏移。但是,每个符号的值的具体含义依其类型而异。当然,对于每个符号的值,其类型、其值以及它们所属的section是密切相关的。 下面说明符号类型: 对于每一个符号来说,其类型如果是小写的,则表明该符号是local的;大写则表明该符号是global(external)的。
符号 类型 | 说明 |
A | 该符号的值是绝对的,在以后的链接过程中,不允许进行改变。这样的符号值,常常出现在中断向量表中,例如用符号来表示各个中断向量函数在中断向量表中的位置。 |
B | 该符号的值出现在非初始化数据段 (bss) 中。例如,在一个文件中定义全局 static int test 。则该符号 test 的类型为 b ,位于 bss section 中。其值表示该符号在 bss 段中的偏移。一般而言, bss 段分配于 RAM 中 |
C | 该符号为 common 。 common symbol 是未初始话数据段。该符号没有包含于一个普通 section 中。只有在链接过程中才进行分配。符号的值表示该符号需要的字节数。例如在一个 c 文件中,定义 int test ,并且该符号在别的地方会被引用,则该符号类型即为 C 。否则其类型为 B 。 |
D | 该符号位于初始话数据段中。一般来说,分配到 data section 中。例如定义全局 int baud_table[5] = {9600, 19200, 38400, 57600, 115200} ,则会分配于初始化数据段中 。 |
G | 该符号也位于初始化数据段中。主要用于 small object 提高访问 small data object 的一种方式。 |
I | 该符号是对另一个符号的间接引用。 |
N | 该符号是一个 debugging 符号。 |
R | 该符号位于只读数据区。例如定义全局 const int test[] = {123, 123}; 则 test 就是一个只读数据区的符号。注意在 cygwin 下如果使用 gcc 直接编译成 MZ 格式时,源文件中的 test 对应 _test ,并且其符号类型为 D ,即初始化数据段中。但是如果使用 m6812-elf-gcc 这样的交叉编译工具,源文件中的 test 对应目标文件的 test, 即没有添加下划线,并且其符号类型为 R 。一般而言,位于 rodata section 。值得注意的是,如果在一个函数中定义 const char *test = “abc”, const char test_int = 3 。使用 nm 都不会得到符号信息,但是字符串“ abc ”分配于只读存储器中, test 在 rodata section 中,大小为 4 。 |
S | 符号位于非初始化数据区,用于 small object 。 |
T | 该符号位于代码区 text section 。 |
U | 该符号在当前文件中是未定义的,即该符号的定义在别的文件中。例如,当前文件调用另一个文件中定义的函数,在这个被调用的函数在当前就是未定义的;但是在定义它的文件中类型是 T 。但是对于全局变量来说,在定义它的文件中,其符号类型为 C ,在使用它的文件中,其类型为 U 。 |
V | 该符号是一个 weak object 。 |
W | The symbol is a weak symbol that has not been specifically tagged as a weak object symbol. |
- | 该符号是 a.out 格式文件中的 stabs symbol 。 |
? | 该符号类型没有定义 |
下面是关于命令选项的一些说明。
命令选项 | 说明 |
-A -o --print-file-name | 在每个符号前,指明其所属的 archieve 或者是 file 。如 libtest.a:interrupt.o:00000024 T cleanup_before_linux |
-a --debug-syms | 显示所有的符号,包含 debugging-only symbols. |
-B | 等同于 —format=bsd ,用于兼容 MIPS 的 nm 。 |
-C --demangle[=style] | 将低级符号名解析成用户级符号名。这样可以使 C++ 函数具有可读性。例如 00000000 T _ZN6MyTest3sumEii 被解析成 00000000 T MyTest::sum(int, int) 。这样一来这样的符号便具有可读性。 |
--no-demangle | 默认的选项。不需要将低级符号名解析成用户级符号名。 |
-f format --format=format | 使用 format 格式输出, format 可以选取为 bsd, sysv 或 posix 。默认为 bsd 。区别如下例: 00000000 T _ZN6MyTest3sumEii _ZN6MyTest3sumEii |00000000| T | FUNC|00000021| |.text _ZN6MyTest3sumEii T 00000000 00000021 |
-g --extern-only | 仅显示外部符号 |
-l --line-numbers | 对于每一个行号,使用调试信息来找到文件名和行号。对于定义的符号,显示该符号定义的文件和行号。对于未定义的符号,给出符号重定位入口的文件和行号。 |
-n -v --numberic-sort | 将符号按对应的地址进行排序,而不是采用默认的按符号名进行排序。 |
-p --no-sort | 显示符号时,不进行排序,按其在目标文件出现的顺序进行显示。 |
-P --portability | 等同于 -f posix 。 |
-S --print-size | 使用 BSD 格式输出时,显示符号的大小。 |
-s --print-armap | 当列出库中的符号名时,包含索引。索引的内容指那一个符号定义在那一个模块 ( 文件 ) 中。 |
-r --reverse-sort | 反序输出 |
--size-sort | 按符号的大小排序输出。 |
-t radix --radix=radix | 使用指定的进制来打印符号值 |
--target=bfdname | 指定目标代码的格式,而不是使用系统的默认格式。 |
-u --undefined-only | 显示没有定义的符号 |
--defined-only | 显示定义的符号 |
-V --version | 显示 nm 的版本号 |
--help | 帮助 |