1、系统调用初始化
在系统启动时,会在sched_initvoid)函数中调用set_system_gate0x80,&system_call),设置中断向量号0x80的中断描述符:
#define set_system_gaten,addr) _set_gate&idt[n],15,3,addr)
其中15表示此中断号对应的是陷阱门,注意,这个中断向量不是中断门描述符。比如硬盘中断(hd_interrupt)或定时器中断(timer_interrupt)等硬件类的中断才设置为中断门描述符。陷阱门是可被中断的。关于陷阱门与中断门的区别,及陷阱门中DPL为0或3原因,请参考书本《linux 0.12》的14.19的解释,还有第四章部分内容,这些已经解释的很清楚了。
Int 0x80的输入输出参数说明:
输入参数:eax=功能号(比如2为fork系统调用)
用功能对应sys_call_table[]的下标,比如sys_call_table[2]表示fork系统调用函数。
fn_ptr sys_call_table[] = { sys_setup, sys_exit, sys_fork, sys_read,
返回值:EAX=sys_fork函数的返回值
2、system_call的实现
当调用_system_call函数时,系统就从用户态进入了内核态。注意,特权变化了!对于x86系统,因为所有的寄存器都只有一个物理寄存器(ARM就不一要样了),因为内核态与用户态共享所有寄存器(段、通用、栈寄存器),比如SS、ESP、eflags、CS、EIP这五个寄存器。为了能够从内核态返回到调用处继续执行,当前现场,即相关寄存器的内容都需要被保存起来。
那么,这些现场信息保存到那里呢?为什么不能保存到用户态堆栈,如果保存了用户态堆栈,那么,这些栈内存区域,用户程序就可以必改定,那么,程序就很容易被攻击了,直接修改CS:EIP对应的栈内存,那么,你懂的^_^。
现场信息是保存在当前进程的内核态堆栈中,由于已经进入了内核态,在_system_call函数中执行push操作,此时被push的数据是存储也就在内核栈中。SS、ESP、eflags、CS、EIP这五个寄存器的内容是怎么进入内核栈的呢?是程序从用户态进入了内核态时,即在执行_system_call函数中的指令之前,硬件已经自动把SS、ESP、eflags、CS、EIP五个寄存器压入了内核栈,然后,根据函数的需要,再保存相关通用、段之类寄存器。当从内核返回用户态时,这五个寄存器会自动从内核栈中恢复。
_system_call部分代码分析:
push %ds
push %es
push %fs
pushl %eax # save the orig_eax
pushl %edx
pushl %ecx # push %ebx,%ecx,%edx asparameters
pushl %ebx # to the system call
movl $0x10,%edx // ds、es此时指向当前进程的内核态数据段
mov %dx,%ds
mov %dx,%es
movl $0x17,%edx //即使没这二行也行吧,fs本来就指向当前进程的用户态数据段
mov %dx,%fs //因为在fork进程时,fs已经在copy_process函数中设置了。
call_sys_call_table,%eax,4) //根据EAX传入的功能号,即可调用相关系统函数
pushl %eax //系统调用函数的返回值入栈
关于进程状态的变化,参考书上的说明,这部分,理解的还不够,后续再分析???
当在中断处理函数(陷阱门)中执行时,是可被中断(中断门)的,因为eflags标志中的TF被设置为允许中断的。因而有可能在时钟中断函数(do_timer)中,本进程的时间片可能被修改为0。所以,当从系统调用相关功能号对应函数返回时,需要检查当前进程是否还在就绪态,或时间片是否用完,并确认是否需要重新执行调度程序。
2: movl _current,%eax
cmpl $0,state%eax) # state
jne reschedule
cmpl $0,counter%eax) # counter
je reschedule
//系统调用返回时,会处理当前任务的信号,进程的信号识别与信号处理,仅在系统调用或时钟中断(每10ms)返回时。就能处理信号,优先级还是蛮高的,至少在进程执行流中,到少每10m就能处理信号。
ret_from_sys_call:
movl _current,%eax
cmpl _task,%eax # task[0] cannot havesignals
je 3f
cmpw $0x0f,CS%esp) # was old code segment supervisor?
jne 3f
cmpw $0x17,OLDSS%esp) # was stack segment = 0x17 ?
jne 3f
movl signal%eax),%ebx
movlblocked%eax),%ecx
notl %ecx
andl %ebx,%ecx
bsfl %ecx,%ecx
je 3f
btrl %ecx,%ebx
movl %ebx,signal%eax)
incl %ecx
pushl %ecx
call _do_signal //调用信号处理函数处理当前进程信号
popl %ecx
testl %eax, %eax
jne 2b # see if we need toswitchtasks, or do more signals
3: popl %eax
popl %ebx
popl %ecx
popl %edx
addl $4, %esp # skip orig_eax
pop %fs
pop %es
pop %ds
iret //此指令会将内核栈中的数据弹出到这5个寄存器SS、ESP、eflags、CS、EIP。
from:http://www.voidcn.com/blog/maowenl/article/p-1845345.html