向高手学习:Glib如何来封装跨平台的线程库,


  • 一、前言
  • 二、glib 简介
  • 三、线程库的设计
  • 四、总结

一、前言

这篇文章,按照下面这 2 张图,来描述 glib 在 Linux 和 Windows 平台上,是如何来进行线程库的设计的。

Linux 平台:

Windows 平台:

最近写了几篇关于跨平台的应用程序设计思路,有些小伙伴在后台留言询问关于一些通用的跨平台库,看来这方面的需求还是很多的。

所谓的跨平台,无非就是希望用同一份应用程序的代码,可以编译出在多个平台上运行的可执行程序。

那么如何才能做到应用程序代码的平台无关呢?很明显需要中间的一个桥接层,把自己不想处理的、那些与平台相关的、烦人的代码丢给这个中间层去处理。

简单的说:就是那些需要处理与平台相关的脏活、累活,都由这个中间层帮你做好了,我们在写应用程序时,只需要关心自己的业务层事务就可以了。

如果没有这个中间层的话,你的代码中可能会充斥着大量的#if...#else代码。

而 glib 就是这样的一个中间层跨平台库,它提供了很多常用的封装,线程库只是其中的封装之一,这篇文章我们主要来学习一下 glib 是如何来设计跨平台的线程库。

二、glib 简介

第一眼看上去的时候,很容易把 glib 与 glibc 混淆,它俩都是基于 GPL 的开源软件,但是却属于完全不同的概念。

glibc是GNU实现的一套标准C的函数库,而glib是gtk+的一套函数库。

那么 gtk+ 是什么呢?使用 Linux 的小伙伴一定知道 gnome 这个桌面环境,gnome 就是基于 gtk+ 开发的一套桌面系统,而 glib 就是位于 gtk 后面的那位无名英雄。

glib可以在多个平台下使用,比如Linux、Unix、Windows等。glib为许多标准的、常用的 C 语言结构提供了相应的替代物。

作为一名 C 语言开发者,有时候我们会非常的羡慕 C++ 开发者,标准库(SDL)有辣么多的工具可用:链表、向量、字符串处理。。。

可是 C 语言里呢?哪哪都要自己去实现这些轮子。

不过反过来说,如果我们在日常的开发过程中,把自己编写的、从别处借鉴的那些好用的轮子都积累起来,形成自己的“宝库”,这也是一种经验的体现、也是一种竞争力。

如今,在 github 上也有很多雷锋实现了高质量的 C 库:有专注于跨平台的、有专注于某个领域的(比如:网络处理、格式化文本解析)。

glib 在解决跨平台的同时,也提供了其他很多有用的工具箱,例如:事件循环、线程池、同步队列、内存管理等等。

既然它提供的功能多,那么必然会导致体积比较大。这也是很多开发者面对不同的选择时,放弃 glib 的原因。

不管如何,既然 glib 这么厉害,我们可以来学习它的设计思想,这可是比盲目的敲几千行代码更能提升一个人的元技能!

三、线程库的设计

1. 线程相关的文件

在 Linux 系统中,创建线程一般都是通过 POSIX 接口(可移植操作系统接口),例如:创建线程 API 函数是 pthread_create(...)。

在 Windows 系统中,创建线程有好几种方式:

  • CreateThread()
  • _beginthread()

既然 glib 库时专门用来解决跨平台问题的,那么它向上面对应用层程序时,一定是提供一个统一的接口;而向下面对不同的操作系统时,调用不同系统中的线程函数。

glib 把这些线程相关的操作分别封装在了平台相关的代码中,具体来说如下图:

  • Linux 系统:gthread.c, gthread_posix.c 参与编译,生成 glib 库;
  • Windows 系统:gthread.c, gthread_win32.c 参与编译,生成 glib 库;

关于这种跨平台的文件构建方式(也就是编译啦),建议您看一下这篇小短文:跨平台代码的3种组织方式

2. 数据结构

你一定听说过这个公式:程序 = 数据结构 + 算法,对于一个 C 语言项目,明白了数据结构的设计,对于理解整个程序的思路是非常重要的,在 glib 中也是如此。

glib 在设计线程库的时候,分成 2 个层次:平台无关部分,平台相关部分。

平台无关的数据结构有(一些不影响理解的代码就删掉了):

  1. struct  _GThread 
  2.   GThreadFunc func; 
  3.   gpointer data; 
  4.   gboolean joinable; 
  5. }; 
  6.  
  7. typedef struct _GThread GThread; 
  8. struct  _GRealThread 
  9.   GThread thread; 
  10.  
  11.   gint ref_count; 
  12.   gchar *name; 
  13. }; 
  14.  
  15. typedef struct _GRealThread GRealThread; 

平台相关的数据结构有:

Linux 系统:

  1. typedef struct 
  2.   GRealThread thread; 
  3.  
  4.   pthread_t system_thread; 
  5.   gboolean  joined; 
  6.   GMutex    lock; 
  7.  
  8.   void *(*proxy) (void *); 
  9.   const GThreadSchedulerSettings *scheduler_settings; 
  10. } GThreadPosix; 

Windows 系统:

  1. typedef struct 
  2.   GRealThread thread; 
  3.  
  4.   GThreadFunc proxy; 
  5.   HANDLE      handle; 
  6. } GThreadWin32; 

仔细看一下每个结构体的第一个成员变量,是不是发现点什么?

从层次关系上看,这几个结构体的关系为:

Linux 平台:

Windows 平台:

结构体在内存模型中意味着什么?占据一块内存空间。

而这几个数据结构都把"子"结构体,放在"父"结构体的第一个位置,就可以方便的进行强制类型转换。

在以上内存模型中,GRealThread 结构体的第一部分是 GThread,那么就完全可以把 GRealThread 所处内存的开始部分,当做一个 GThread 结构体变量来操作。

用 C++ 中面向对象的术语来描述更准确:基类指针可以指向派生类对象。

在下面的代码中,可以看到这样的操作。

3. 线程的创建

(1) 函数原型

平台无关函数(gthread.c 中实现)

  1. GThread *g_thread_new (const gchar *name, 
  2.               GThreadFunc  func, 
  3.               gpointer     data); 
  1. GThread * 
  2. g_thread_new_internal (const gchar *name, 
  3.                        GThreadFunc proxy, 
  4.                        GThreadFunc func, 
  5.                        gpointer data, 
  6.                        gsize stack_size, 
  7.                        const GThreadSchedulerSettings *scheduler_settings, 
  8.                        GError **error); 

平台相关函数(gthread_posix.c or ghread_win32.c 中实现)

  1. GRealThread * 
  2. g_system_thread_new (GThreadFunc proxy, 
  3.                      gulong stack_size, 
  4.                      const GThreadSchedulerSettings *scheduler_settings, 
  5.                      const char *name, 
  6.                      GThreadFunc func, 
  7.                      gpointer data, 
  8.                      GError **error); 

(2) Linux 平台函数调用链

先来看一下 Linux 平台上的函数调用关系:

如果你的手边有源代码,请关注 g_thread_new() 这个函数中的 func 和 data 这2个参数。

func 是最开始用户层传入的线程执行函数,也就是用户创建这个线程,最终想执行的函数。data 是 func 函数所接收的函数参数。

如果直接面对 Linux 操作系统编程,在调用 POSIX 接口函数 pthread_create() 时,一般是直接传入用户想要执行的函数以及参数。

但是 glib 层并没有直接把用户层的函数直接交给 Linux 操作系统,而是自己提供了 2 个线程代理函数,在调用 pthread_create() 时,根据不同的情况,把这2个代理函数之一传递给操作系统:

第一个线程代理函数:g_thread_proxy();

第二个线程代理函数:linux_pthread_proxy();

至于传递哪一个代理函数,取决于宏定义 HAVE_SYS_SCHED_GETATTR 是否有效。

下面是 g_system_thread_new() 函数简化后的代码:

  1. g_system_thread_new (proxy, stack_size, scheduler_settings, 
  2.                                           name, func, data, error); 
  3.     GThreadPosix *thread; 
  4.     GRealThread *base_thread;   
  5.      
  6.     // 填充 base_thread 字段,重点关注下面2句 
  7.     base_thread->thread.func = func; 
  8.     base_thread->thread.data = data; 
  9.  
  10.     thread->scheduler_settings = scheduler_settings; 
  11.     thread->proxy = proxy;    
  12.      
  13.     #if defined(HAVE_SYS_SCHED_GETATTR) 
  14.       ret = pthread_create (&thread->system_thread, &attr, linux_pthread_proxy, thread); 
  15.     #else 
  16.       ret = pthread_create (&thread->system_thread, &attr, (void* (*)(void*))proxy, thread); 
  17.     #endif 

4. 线程的执行

我们就假设这个宏定义 HAVE_SYS_SCHED_GETATTR 被定义了、是有效的,Linux 系统中的 pthread_create() 接收到 linux_pthread_proxy() 函数。

当这个新建的线程被调度执行时,linux_pthread_proxy() 函数被调用执行:

简化后的 linux_pthread_proxy() 函数:

  1. static void *
  2. linux_pthread_proxy (void *data) 
  3.   // data 就是 g_system_thread_new 中 GThreadPosix 类型指针,这是平台相关的。 
  4.   GThreadPosix *thread = data; 
  5.   
  6.   if (thread->scheduler_settings) 
  7.    { 
  8.       // 设置线程属性 
  9.       tid = (pid_t) syscall (SYS_gettid); 
  10.       res = syscall (SYS_sched_setattr, tid, thread->scheduler_settings->attr, flags); 
  11.    } 
  12.  
  13.   // 调用 glib 中的线程代理函数,其实就是 g_thread_proxy()  
  14.   return thread->proxy (data); 

这个函数关注 3 点:

继续贴一下这个函数的简化后代码:

  1. gpointer 
  2. g_thread_proxy (gpointer data) 
  3.   // data 就是 g_system_thread_new 中 GThreadPosix 类型指针,这是平台相关的。 
  4.   // 这里把它强转成平台无关的 GRealThread 类型。 
  5.   GRealThread* thread = data; 
  6.  
  7.   if (thread->name) 
  8.   { 
  9.       // 设置线程属性:名称 
  10.       g_system_thread_set_name (thread->name); 
  11.   } 
  12.  
  13.   // 调用应用层的线程入口函数 
  14.   thread->retval = thread->thread.func (thread->thread.data); 
  15.  
  16.   return NULL; 

这个函数也只要关注 3 点:

至此,用户层定义的线程函数 user_thread_func(data) 就得以执行了。

那么,如果 glib 层没有定义宏 HAVE_SYS_SCHED_GETATTR,那么 Linux 系统中 pthread_create() 接收到的就是 glib 中的第一个线程代理函数 g_thread_proxy。

线程执行的调用关系为:

5. Windows平台函数调用链

先来看一下 Windows 平台上创建线程时函数调用关系:

在 Windows 平台上,glib 的线程代理函数是 g_thread_win32_proxy()。

当这个新建的线程被调度执行时,函数调用关系是:

四、总结

实现这样的线程函数代理设计,关键是利用了 C 语言中的结构体类型中,把“父”结构体类型变量强制转换成“子”结构体类型变量来使用,因为它俩在内存模型中,刚开始部分的空间中,内容是完全一样的。

最后,我把文中的这些图合并起来,绘制成下面这 2 张图,完整的体现了 glib 中的线程设计思路:

Linux 平台:

Windows 平台:

本文转载自微信公众号「IOT物联网小镇」,可以通过以下二维码关注。转载本文请联系IOT物联网小镇公众号。

相关内容