感谢支持
我们一直在努力

Linux中代码段和数据段的加载

Linux中代码段和数据段的加载


load_aout_binary中关于数据段代码段的加载片段如下:


/*加载代码段*/


error = do_mmap(bprm->file, N_TXTADDR(ex), ex.a_text,


PROT_READ | PROT_EXEC,


MAP_FIXED | MAP_PRIVATE | MAP_DENYWRITE | MAP_EXECUTABLE,


fd_offset);


 


/*加载数据段*/


error = do_mmap(bprm->file, N_DATADDR(ex), ex.a_data,


PROT_READ | PROT_WRITE | PROT_EXEC,


MAP_FIXED | MAP_PRIVATE | MAP_DENYWRITE | MAP_EXECUTABLE,


fd_offset + ex.a_text);


 
 


 


elf文件的处理比较特殊:


if (elf_ppnt->p_flags & PF_R)  


·              elf_prot |= PROT_READ;  


·          if (elf_ppnt->p_flags & PF_W)  


·              elf_prot |= PROT_WRITE;  


·          if (elf_ppnt->p_flags & PF_X)  


·              elf_prot |= PROT_EXEC;  


·          elf_flags = MAP_PRIVATE | MAP_DENYWRITE | MAP_EXECUTABLE; 


           ……


error = elf_map(bprm->file, load_bias + vaddr, elf_ppnt,  


·                  elf_prot, elf_flags, 0); 
 


 


这里面关键的问题是,无论代码段还是数据段,一定是MAP_PRIVATE 的映射。


 


关于do_mmap的处理:


 


do_mmap做两件事情:1)对要映射的虚存区域建立vma    2)设置vma的vm_ops ,重点是其中的缺页处理的函数filemap_nopage(do_mmap的基本思路就是:只有在程序具体访问到该页时才建立真正的物理page)


 


在do_mmap_pgoff 中,有如下片段处理vma的读写属性:


 


if (file) {


     VM_ClearReadHint(vma);


     vma->vm_raend = 0;


     if (file->f_mode & FMODE_READ)


            vma->vm_flags |= VM_MAYREAD | VM_MAYWRITE | VM_MAYEXEC;


     if (flags & MAP_SHARED) {


            vma->vm_flags |= VM_SHARED | VM_MAYSHARE;


    ………..


}


 


vma->vm_page_prot = protection_map[vma->vm_flags & 0x0f]; /*pte中的页属性位就来自该变量*/


 
 


 


vma属性的定义如下:


* vm_flags..


 */


#define VM_READ           0x00000001 /* currently active flags */


#define VM_WRITE         0x00000002


#define VM_EXEC           0x00000004


#define VM_SHARED        0x00000008
 


 


以数据段为例:它是r/w、private的,所以它在执行到属性处理语句的时候:


 


vma->vm_page_prot = protection_map[vma->vm_flags & 0x0f];数组里面的索引值要么是3.要么是7.


 


pgprot_t protection_map[16] = {


__P000, __P001, __P010, __P011, __P100, __P101, __P110, __P111,


__S000, __S001, __S010, __S011, __S100, __S101, __S110, __S111


};
 


 


由上述图可以知道,3对应的是__P011, 7对应的是__P111


#define __P000 PAGE_NONE


#define __P001 PAGE_READONLY


#define __P010 PAGE_COPY


#define __P011 PAGE_COPY


#define __P100 PAGE_READONLY


#define __P101 PAGE_READONLY


#define __P110 PAGE_COPY


#define __P111 PAGE_COPY


 


#define PAGE_COPY __pgprot(_PAGE_PRESENT | _PAGE_USER | _PAGE_ACCESSED)


所以,不管是3还是7,这个页的属性都是PAGE_COPY。 至此代码段、数据段的vma已经建立成功,等到程序要访问相关页的时候,会触发do_page_fault对相应的虚存页进行物理页框的分配。


do_page_fault的处理:


 


do_page_fault -> handle_mm_fault -> handle_pte_fault


 


if (!pte_present(entry)) {


/*


 * If it truly wasn’t present, we know that kswapd


 * and the PTE updates will not touch it later. So


 * drop the lock.


 */


   spin_unlock(&mm->page_table_lock);


   if (pte_none(entry))


         return do_no_page(mm, vma, address, write_access, pte);


   return do_swap_page(mm, vma, address, pte, pte_to_swp_entry(entry), write_access);


}


第一次处理数据段缺页的时候,显然是pte表项为空的场景。但此时触发page_fault的操作是读还是写?(write_access正是标志本次触发标志是读还是写的操作)


 


假设现在的操作是写,那么write_access就是1.


 


do_no_page是这么处理的:


……..


new_page = vma->vm_ops->nopage(vma, address & PAGE_MASK, (vma->vm_flags & VM_SHARED)?0:write_access);


 


entry = mk_pte(new_page, vma->vm_page_prot);  /*这里是PAGE_COPY*/


if (write_access) 


    entry = pte_mkwrite(pte_mkdirty(entry));


set_pte(page_table, entry);
 


 


vma中的vm_ops是filemap_nopage函数:


 


filemap_nopage(struct vm_area_struct * area,unsigned long address, int no_share)/* no_share =   write_access*/


 


page = __find_get_page(mapping, pgoff, hash);  /*首先在page_cache中找到elf中的data页*/


…………


old_page = page;


     if (no_share) {


          struct page *new_page = page_cache_alloc();


      if (new_page) {


          copy_user_highpage(new_page, old_page, address);


      flush_page_to_ram(new_page);


} else


new_page = NOPAGE_OOM;


page_cache_release(page);


return new_page;


}


由此可见: 数据段的页只是一份用户态本地的拷贝,它没有任何mapping,他可以被换出到swap中。它和bss、堆区、栈区的页没有任何本质上的区别。


假设现在的操作是读:


     write_access就是0,所以filemap_nopage中返回的就是old_page。 old_page是page_cache中的页,他一定会mapping到elf_inode->address_mapping。似乎这样接下去推会得到一个相反的结论。


     请注意: 


entry = mk_pte(new_page, vma->vm_page_prot);  /*这里是PAGE_COPY,_PAGE_PRESENT | _PAGE_USER | _PAGE_ACCESSED */


当我们对这样的页进行写操作的时候,mmu当然会触发page_fault.


 


if (write_access) {


     if (!pte_write(entry))


     return do_wp_page(mm, vma, address, pte, entry);


     entry = pte_mkdirty(entry);


}


当一个vma是可写的,而vma中对应的pte又是不可写的,这就触发了copy_on_write机制:do_wp_page会进行相应的copy_on_write处理过程。


所以,不存在是否第一份不能被换出的情况。如果对数据段都是只读的操作,那么你可以把数据段的页想象成一个软链接。一旦有了写操作,那么数据段就变成了一份本地的page。

赞(0) 打赏
转载请注明出处:服务器评测 » Linux中代码段和数据段的加载
分享到: 更多 (0)

听说打赏我的人,都进福布斯排行榜啦!

支付宝扫一扫打赏

微信扫一扫打赏