天天看点

数据库内核月报 - 2015 / 09-PgSQL · 答疑解惑 · 诡异的函数返回值

修改pg源码时,在elog.c文件中准备调用timestamp.c中的<code>timestamptz getcurrenttimestamp(void)</code>,以获取当前时间,<code>timestamptz</code>是个int64类型,但是返回值类型不是期望的(是个int32值),但是在另外一个文件postgres.c调用返回的是正常的,如下:

也就是说,同一个函数在不同文件返回值的长度完全不同!

首先查看具体函数定义<code>getcurrenttimestamp()</code>,怀疑是elog.c没有宏定义<code>have_int64_timestamp</code>,随后gdb调试查看,最终计算的结果result确实是int64的值,当这个函数返回之后得到的值却变成了int32的值。

难道elog.c调用的不是timestamp.c中这个函数?继续在源码中查找这个<code>getcurrenttimestamp</code>函数定义,看是否有多个定义。但是查找的结果是除了这个文件有定义,其他文件都没有这个函数定义,并且在timestamp.c这个函数中添加debug信息也都打印出来了,现在可以确定是函数返回的时候将int64转成int32了。百思不得其解之际,最后在编译日志中发现一个warning:

在网上搜了一下,这种警告是由于函数未声明引起的,但是<code>getcurrenttimestamp()</code>在timestamp.h中声明了,通过对比postgres.c和elog.c include的头文件发现区别:postgres.c包含<code>#include "utils/timestamp.h"</code>,也就是在postgres.c 中含有<code>getcurrenttimestamp</code>的函数声明,而在elog.c中却没有。在通过测试发现,c程序如果在函数调用前,没有对函数作声明,则编译系统会把第一次遇到的该函数形式(函数定义或函数调用)作为函数的声明,并将函数类型默认为int 型!

在elog.c中添加<code>#include "utils/timestamp.h"</code>头文件,并查看编译日志看是否有其他这样的warning。重新配置编译选项,加上-werror-implicit-function-declaration,将这种warning改成error,提前报错。

对于这个warning需要重视,通过修改编译选项将其变成error,便于我们发现问题,错误发现的越早越好,避免在编译时忽略或者掩盖错误。如果不是这个函数返回值错误特别明显,它将有可能成为一个隐形的bug。