天天看点

Linux gettid和pthread_self区别1 线程ID获取方法2  为什么需要两个ID描述线程?3 内部实现4 总结

1 线程ID获取方法

linux下获取线程有两种方法:

1)gettid或者类似gettid的方法  

2)直接调用pthread_self()

gettid 获取的是内核中线程ID,而pthread_self 是posix描述的线程ID。

通过执行man手册,我们也能发现他们的区别:

SYNOPSIS

       #include <sys/types.h>

       pid_t gettid(void);

       Note: There is no glibc wrapper for this system call; see NOTES.

DESCRIPTION

       gettid()  returns the caller's thread ID (TID).  In a single-threaded process, the thread ID is equal to the process ID (PID, as returned by getpid(2)).  In

       a multithreaded process, all threads have the same PID, but each one has a unique TID.  For further details, see the discussion of CLONE_THREAD in clone(2).

对于单线程的进程,内核中tid==pid,对于多线程进程,他们有相同的pid,不同的tid。tid用于描述内核真实的pid和tid信息。

DESCRIPTION

       The  pthread_self()  function  returns  the ID of the calling thread.  This is the same value that is returned in *thread in the pthread_create(3) call that

       created this thread.

RETURN VALUE

       This function always succeeds, returning the calling thread's ID.

he thread ID returned by pthread_self() is not the same thing as the kernel thread ID returned by a call to gettid(2).

pthread_self返回的是posix定义的线程ID,man手册明确说明了和内核线程tid不同。它只是用来区分某个进程中不同的线程,当一个线程退出后,新创建的线程可以复用原来的id。

2  为什么需要两个ID描述线程?

通过执行如下代码, 我们也能发现他们的区别:

  1. #include <stdio.h>
  2. #include <unistd.h>
  3. #include <stdlib.h>
  4. #include <pthread.h>
  5. #include <sys/types.h>
  6. #include <sys/wait.h>
  7. //#include <sys/syscall.h>
  8. #define __NR_gettid 186
  9. void *f()
  10. {
  11. int status;
  12. printf( "begin: pid: %d, tid:%ld, self: %ld\n", getpid(), ( long int)syscall(__NR_gettid), pthread_self());
  13. int ret = fork();
  14. if(ret == ){
  15. printf( "[child] pid: %d, tid:%ld, self: %ld\n", getpid(), ( long int)syscall(__NR_gettid), pthread_self());
  16. } else if(ret > ){
  17. printf( "[parent] pid: %d, tid:%ld, self: %ld\n", getpid(), ( long int)syscall(__NR_gettid), pthread_self());
  18. waitpid( , &status, );
  19. }
  20. }
  21. int main()
  22. {
  23. int i = ;
  24. pthread_t pth[ ];
  25. while(i++< ){
  26. pthread_create(&pth[i], NULL, f, NULL);
  27. sleep( );
  28. }
  29. pause();
  30. }
Linux gettid和pthread_self区别1 线程ID获取方法2  为什么需要两个ID描述线程?3 内部实现4 总结

描述线程的id,为什么需要两个不同的ID呢?这是因为线程库实际上由两部分组成:内核的线程支持+用户态的库支持(glibc),Linux在早期内核不支持线程的时候glibc就在库中(用户态)以纤程(就是用户态线程)的方式支持多线程了,POSIX thread只要求了用户编程的调用接口对内核接口没有要求。

linux上的线程实现就是在内核支持的基础上以POSIX thread的方式对外封装了接口,所以才会有两个ID的问题。

3 内部实现

glibc中并没有直接提供gettid函数,与之类似的方法是执行系统调用。

在头文件 /usr/include/x86_64-linux-gnu/asm/unistd_64.h 中找到__NR_gettid 的定义:

#define __NR_gettid 186

gettid的包裹实现: syscall(__NR_gettid)           

glibc中有如下调用:

  1. #define CHECK_TPP_PRIORITY(normal, boosted) \
  2. do \
  3. { \
  4. pid_t tid = syscall (__NR_gettid); \
  5. \
  6. struct sched_param cep_sp; \
  7. int cep_policy; \
  8. if (pthread_getschedparam (pthread_self (), &cep_policy, \
  9. &cep_sp) != 0) \
  10. { \
  11. puts ("getschedparam failed"); \
  12. ret = 1; \
  13. } \
  14. else if (cep_sp.sched_priority != (normal)) \
  15. { \
  16. printf ("unexpected priority %d != %d\n", \
  17. cep_sp.sched_priority, (normal)); \
  18. } \
  19. if (syscall (__NR_sched_getparam, tid, &cep_sp) == 0 \
  20. && cep_sp.sched_priority != (boosted)) \
  21. { \
  22. printf ("unexpected boosted priority %d != %d\n", \
  23. cep_sp.sched_priority, (boosted)); \
  24. ret = 1; \
  25. } \
  26. } \
  27. while (0)

tid在内核中就是一个普通进程。

在glibc源码中,发现posix中pthread_self的实现如下:

  1. pthread_t
  2. __pthread_self ( void)
  3. {
  4. return ( pthread_t) THREAD_SELF;
  5. }
  6. strong_alias (__pthread_self, pthread_self)
  1. # define THREAD_SELF \
  2. ({ struct pthread *__self; \
  3. asm ("mov %%fs:%c1,%0" : "=r" (__self) \
  4. : "i" (offsetof (struct pthread, header.self))); \
  5. __self;})
  1. struct pthread
  2. {
  3. union
  4. {
  5. #if !TLS_DTV_AT_TP
  6. /* This overlaps the TCB as used for TLS without threads (see tls.h). */
  7. tcbhead_t header;
  8. #else
  9. struct
  10. {
  11. int multiple_threads;
  12. int gscope_flag;
  13. # ifndef __ASSUME_PRIVATE_FUTEX
  14. int private_futex;
  15. # endif
  16. } header;
  17. #endif
  1. typedef struct
  2. {
  3. void *tcb; /* Pointer to the TCB. Not necessarily the
  4. thread descriptor used by libpthread. */
  5. dtv_t *dtv;
  6. void *self; /* Pointer to the thread descriptor. */
  7. int multiple_threads;
  8. int gscope_flag;
  9. uintptr_t sysinfo;
  10. uintptr_t stack_guard;
  11. uintptr_t pointer_guard;
  12. unsigned long int vgetcpu_cache[2];
  13. # ifndef __ASSUME_PRIVATE_FUTEX
  14. int private_futex;
  15. # else
  16. int __glibc_reserved1;
  17. # endif
  18. int rtld_must_xmm_save;
  19. /* Reservation of some values for the TM ABI. */
  20. void *__private_tm[4];
  21. /* GCC split stack support. */
  22. void *__private_ss;
  23. long int __glibc_reserved2;
  24. /* Have space for the post-AVX register size. */
  25. __128bits rtld_savespace_sse[8][4] __attribute__ ((aligned (32)));
  26. void *__padding[8];
  27. } tcbhead_t;
#define offsetof(Type, Member) ((size_t) &((Type *) NULL)->Member)
           

pthread_self 即是获取线程控制块tcb首地址 相对于进程数据的段的偏移, 注:pthread_create也是返回该值。

4 总结

gettid 获取的是内核中真实线程ID,  对于多线程进程来说,每个tid实际是不一样的。

而pthread_self获取的是相对于进程的线程控制块的首地址, 只是用来描述统一进程中的不同线程,

例子中,在线程中调用fork,只会将当前活动线程设置为活动(其他线程终止),且进程使用的都是虚拟地址,所以产生的pthread_self() 是相同的。

上述不匹配,对程序的实际运行,并没有影响,因为他们的tid是不同的。

本文中有关线程模型的基础知识,请参见:

http://www.ibm.com/developerworks/cn/linux/l-threading.html

1 线程ID获取方法

linux下获取线程有两种方法:

1)gettid或者类似gettid的方法  

2)直接调用pthread_self()

gettid 获取的是内核中线程ID,而pthread_self 是posix描述的线程ID。

通过执行man手册,我们也能发现他们的区别:

SYNOPSIS

       #include <sys/types.h>

       pid_t gettid(void);

       Note: There is no glibc wrapper for this system call; see NOTES.

DESCRIPTION

       gettid()  returns the caller's thread ID (TID).  In a single-threaded process, the thread ID is equal to the process ID (PID, as returned by getpid(2)).  In

       a multithreaded process, all threads have the same PID, but each one has a unique TID.  For further details, see the discussion of CLONE_THREAD in clone(2).

对于单线程的进程,内核中tid==pid,对于多线程进程,他们有相同的pid,不同的tid。tid用于描述内核真实的pid和tid信息。

DESCRIPTION

       The  pthread_self()  function  returns  the ID of the calling thread.  This is the same value that is returned in *thread in the pthread_create(3) call that

       created this thread.

RETURN VALUE

       This function always succeeds, returning the calling thread's ID.

he thread ID returned by pthread_self() is not the same thing as the kernel thread ID returned by a call to gettid(2).

pthread_self返回的是posix定义的线程ID,man手册明确说明了和内核线程tid不同。它只是用来区分某个进程中不同的线程,当一个线程退出后,新创建的线程可以复用原来的id。

2  为什么需要两个ID描述线程?

通过执行如下代码, 我们也能发现他们的区别:

  1. #include <stdio.h>
  2. #include <unistd.h>
  3. #include <stdlib.h>
  4. #include <pthread.h>
  5. #include <sys/types.h>
  6. #include <sys/wait.h>
  7. //#include <sys/syscall.h>
  8. #define __NR_gettid 186
  9. void *f()
  10. {
  11. int status;
  12. printf( "begin: pid: %d, tid:%ld, self: %ld\n", getpid(), ( long int)syscall(__NR_gettid), pthread_self());
  13. int ret = fork();
  14. if(ret == ){
  15. printf( "[child] pid: %d, tid:%ld, self: %ld\n", getpid(), ( long int)syscall(__NR_gettid), pthread_self());
  16. } else if(ret > ){
  17. printf( "[parent] pid: %d, tid:%ld, self: %ld\n", getpid(), ( long int)syscall(__NR_gettid), pthread_self());
  18. waitpid( , &status, );
  19. }
  20. }
  21. int main()
  22. {
  23. int i = ;
  24. pthread_t pth[ ];
  25. while(i++< ){
  26. pthread_create(&pth[i], NULL, f, NULL);
  27. sleep( );
  28. }
  29. pause();
  30. }
Linux gettid和pthread_self区别1 线程ID获取方法2  为什么需要两个ID描述线程?3 内部实现4 总结

描述线程的id,为什么需要两个不同的ID呢?这是因为线程库实际上由两部分组成:内核的线程支持+用户态的库支持(glibc),Linux在早期内核不支持线程的时候glibc就在库中(用户态)以纤程(就是用户态线程)的方式支持多线程了,POSIX thread只要求了用户编程的调用接口对内核接口没有要求。

linux上的线程实现就是在内核支持的基础上以POSIX thread的方式对外封装了接口,所以才会有两个ID的问题。

3 内部实现

glibc中并没有直接提供gettid函数,与之类似的方法是执行系统调用。

在头文件 /usr/include/x86_64-linux-gnu/asm/unistd_64.h 中找到__NR_gettid 的定义:

#define __NR_gettid 186

gettid的包裹实现: syscall(__NR_gettid)           

glibc中有如下调用:

  1. #define CHECK_TPP_PRIORITY(normal, boosted) \
  2. do \
  3. { \
  4. pid_t tid = syscall (__NR_gettid); \
  5. \
  6. struct sched_param cep_sp; \
  7. int cep_policy; \
  8. if (pthread_getschedparam (pthread_self (), &cep_policy, \
  9. &cep_sp) != 0) \
  10. { \
  11. puts ("getschedparam failed"); \
  12. ret = 1; \
  13. } \
  14. else if (cep_sp.sched_priority != (normal)) \
  15. { \
  16. printf ("unexpected priority %d != %d\n", \
  17. cep_sp.sched_priority, (normal)); \
  18. } \
  19. if (syscall (__NR_sched_getparam, tid, &cep_sp) == 0 \
  20. && cep_sp.sched_priority != (boosted)) \
  21. { \
  22. printf ("unexpected boosted priority %d != %d\n", \
  23. cep_sp.sched_priority, (boosted)); \
  24. ret = 1; \
  25. } \
  26. } \
  27. while (0)

tid在内核中就是一个普通进程。

在glibc源码中,发现posix中pthread_self的实现如下:

  1. pthread_t
  2. __pthread_self ( void)
  3. {
  4. return ( pthread_t) THREAD_SELF;
  5. }
  6. strong_alias (__pthread_self, pthread_self)
  1. # define THREAD_SELF \
  2. ({ struct pthread *__self; \
  3. asm ("mov %%fs:%c1,%0" : "=r" (__self) \
  4. : "i" (offsetof (struct pthread, header.self))); \
  5. __self;})
  1. struct pthread
  2. {
  3. union
  4. {
  5. #if !TLS_DTV_AT_TP
  6. /* This overlaps the TCB as used for TLS without threads (see tls.h). */
  7. tcbhead_t header;
  8. #else
  9. struct
  10. {
  11. int multiple_threads;
  12. int gscope_flag;
  13. # ifndef __ASSUME_PRIVATE_FUTEX
  14. int private_futex;
  15. # endif
  16. } header;
  17. #endif
  1. typedef struct
  2. {
  3. void *tcb; /* Pointer to the TCB. Not necessarily the
  4. thread descriptor used by libpthread. */
  5. dtv_t *dtv;
  6. void *self; /* Pointer to the thread descriptor. */
  7. int multiple_threads;
  8. int gscope_flag;
  9. uintptr_t sysinfo;
  10. uintptr_t stack_guard;
  11. uintptr_t pointer_guard;
  12. unsigned long int vgetcpu_cache[2];
  13. # ifndef __ASSUME_PRIVATE_FUTEX
  14. int private_futex;
  15. # else
  16. int __glibc_reserved1;
  17. # endif
  18. int rtld_must_xmm_save;
  19. /* Reservation of some values for the TM ABI. */
  20. void *__private_tm[4];
  21. /* GCC split stack support. */
  22. void *__private_ss;
  23. long int __glibc_reserved2;
  24. /* Have space for the post-AVX register size. */
  25. __128bits rtld_savespace_sse[8][4] __attribute__ ((aligned (32)));
  26. void *__padding[8];
  27. } tcbhead_t;
#define offsetof(Type, Member) ((size_t) &((Type *) NULL)->Member)
           

pthread_self 即是获取线程控制块tcb首地址 相对于进程数据的段的偏移, 注:pthread_create也是返回该值。

4 总结

gettid 获取的是内核中真实线程ID,  对于多线程进程来说,每个tid实际是不一样的。

而pthread_self获取的是相对于进程的线程控制块的首地址, 只是用来描述统一进程中的不同线程,

例子中,在线程中调用fork,只会将当前活动线程设置为活动(其他线程终止),且进程使用的都是虚拟地址,所以产生的pthread_self() 是相同的。

上述不匹配,对程序的实际运行,并没有影响,因为他们的tid是不同的。

本文中有关线程模型的基础知识,请参见:

http://www.ibm.com/developerworks/cn/linux/l-threading.html

继续阅读