最近常常用到PLT hook,接下来几篇文章,给大家介绍一下PLT hook的原理、使用、事例、以及一些注意事项。
今天是第一篇,先来介绍一下PLT Hook的基本原理。
ELF文件格局
ELF:Executable and Linkable Format
动态链接库便是ELF格局的文件,要搞清楚PLT Hook的原理,首先要了解ELF文件格局。
ELF分为衔接视图和履行视图。
- 衔接视图:ELF未被加载到内存履行前,以section为单位的数据组织形式
- 履行视图:ELF被加载到内存后,以segment为单位的数据组织形式
PLT Hook是运转中修正内存中的数据,所以咱们主要关怀的是履行视图。
linker依据ELF文件履行视图中的信息,用mmap将ELF加载到内存中,履行relocation将外部引证的肯定地址填入GOT表和DATA中。
PLT Hook的履行机遇,是在linker将ELF加载到内存之后。Hook的原理,是解析内存中的ELF数据,修正relocation结果。
装载、动态链接、重定位
1. 装载
使用System.loadLibrary的方法,加载方针同享库,内部其实也是调用linker中的dlopen、dlsym、dlclose函数对方针同享库进行装载。
2. 动态链接
动态链接的基本思想是把程序依照模块拆分成各个相对独立部分,在程序运转时才将它们链接在一起。当同享库被装载的时分,动态链接器linkder会将同享库装载到进程的地址空间,并且将程序中的符号绑定到动态链接库中,进行重定位作业。
3. 重定位
同享库需求重定位的主要原因是导入符号的存在。动态链接下,一旦依赖于其他同享目标,就会有导入符号。这些导入符号在编译的时分是不知道的,只有在运转的时分才确认,所以需求就这些导入符号的引入进行修正,即进行重定位。
PLT Hook的原理,便是改动导入符号重定位的结果。
linker
linkder在加载ELF时的最主要作业是relocation,这个进程的目的是为当前ELF的每个“导入符号”找到对应的外部符号(函数或数据)的肯定地址。
这些地址会写在以下几个当地:
- .got.plt: GOT表,保存外部函数的肯定地址
- .data, .data.rel.ro:保存外部数据(包括函数指针)的肯定地址
要完结 relocation 进程,需求依赖于 ELF 中的以下信息:
- .rel.plt,.rela.plt:用于关联 .dynsym 和 .got.plt。这便是咱们常常会听到的 “PLT 表”。
- .rel.dyn,.rela.dyn,.rel.dyn.aps2,.rela.dyn.aps2:用于关联 .dynsym 和 .data,.data.rel.ro。
relocation完结后的函数调用关系如下:
PLT和GOT表
- PLT表:程序链接表(Procdure Link Table),外部调用的跳板,.plt
- GOT表:大局偏移表 (Global Offset Table),记录外部调用的进口地址,.got
由上面的剖析可知,当咱们调用某个函数的时分,并不是直接调用函数的地址,而是经过PLT表,跳转到GOT表,获取方针函数的大局偏移。这个时分就可以经过基址+偏移的方法。定位到真实的函数地址。
PLT Hook基本原理
PLT Hook便是改动了本来的relocation后的地址。主要流程:
- 经过符号名,在hash table中找到对应的符号信息
- 再找到对应的PLT信息
- 最后找到GOT表中的肯定地址的值
- 修正这个肯定地址的值,为咱们的“署理函数”的地址