Linux中为什么要随机函数栈的起始地址


1. 如前文()所述,为了执行一个程序,首先do_execve建立数据结构,并将一些数据从用户空间拷贝到内核空间,然后调用search_binary_handler加载可执行文件映像。

  1. int do_execve(char * filename,  
  2.         char __user *__user *argv,  
  3.         char __user *__user *envp,  
  4.         struct pt_regs * regs)  
2. search_binary_handler()寻找对应的handler。对于elf 文件,即是load_elf_binary。
  1. int search_binary_handler(struct linux_binprm *bprm,struct pt_regs *regs)  

3. load_elf_binary()读取可执行文件头文件信息,进行简单的一致性检测,分配用户模式的页表,设置栈的起始地址,加载可执行文件映像到内存;然后调用create_elf_tables(); 最后调用start_thread(),执行_start函数开始的代码。
  1. static int load_elf_binary(struct linux_binprm *bprm, struct pt_regs *regs)  

4. create_elf_tables()将参数指针,环境变量数组指针压入用户模式的栈。

  1. static int  
  2. create_elf_tables(struct linux_binprm *bprm, struct elfhdr *exec,  
  3.                 unsigned long load_addr, unsigned long interp_load_addr)  
值得注意的是,create_elf_tables()很可能会在压栈前调整栈指针。比如,在支持超线程的体系结构里面,通过随机化初始栈指针,可以减少进程间在L1上的竞争。如下所示,随机化初始栈指针的页内偏移量,并使得栈指针保持16字节对齐。
  1. unsigned long arch_align_stack(unsigned long sp)  
  2. {  
  3.        if (!(current->personality & ADDR_NO_RANDOMIZE) && randomize_va_space)  
  4.                 sp -= get_random_int() % 8192;  
  5.         return sp & ~0xf;  
  6. }  
为什么针对页内偏移呢?

在某些体系结构中,首先要完成从逻辑地址到物理地址的转换,然后才能去cache中查找该物理地址是否已经在cache当中。这样,cache命中的代价较高。一种常用的技巧是,在L1中,逻辑地址索引-物理地址比较(virtually indexed, physically tagged)[1]。思路是,利用逻辑地址与物理地址的页内偏移一样的特点,用页内偏移进行索引,页号通过TLB转换成物理页号进行tag比较。这样,可以不经转换,就先索引,从而加快速度。这样,如果两个逻辑地址的块内偏移一样,它们索引的cache行也就一样,所以需要随机化页内偏移来减少L1的竞争。其缺点是,L1的set大小,不能超过页的大小。换言之:

    L1的大小 <= 相联度 * 块的大小 * 页的大小

5. start_thread(),执行_start函数开始的代码
  1. void  
  2. start_thread(struct pt_regs *regs, unsigned long new_ip, unsigned long new_sp)  
  3. {  
  4.         set_user_gs(regs, 0);  
  5.         regs->fs                = 0;  
  6.         set_fs(USER_DS);  
  7.         regs->ds                = __USER_DS;  
  8.         regs->es                = __USER_DS;  
  9.         regs->ss                = __USER_DS;  
  10.         regs->cs                = __USER_CS;  
  11.         regs->ip                = new_ip;  
  12.         regs->sp                = new_sp;  
  13.         /* 
  14.          * Free the old FP and other extended state 
  15.          */  
  16.         free_thread_xstate(current);  
  17. }  
参考:[1] Computer Architecture: A Quantitative Approach, Fourth Edition. Page 291-292.

相关内容