首页 | 新闻 | 新品 | 文库 | 方案 | 视频 | 下载 | 商城 | 开发板 | 数据中心 | 座谈新版 | 培训 | 工具 | 博客 | 论坛 | 百科 | GEC | 活动 | 主题月 | 电子展
返回列表 回复 发帖

uClinux移植与分析(3)

uClinux移植与分析(3)

进程切换部分代码实现


    移植linux,修改的主要就是和平台相关的那部分代码.linux里面和平台相关的代码
包括很多方面,比如boot过程,系统调用,中断处理,设备驱动,还有部分信号(软中断)处理
等,进程切换也有很小一部分平台相关代码.相对其它部分,我觉得这部分平台相关代码还
是相对简单的.


    schedule()是uClinux中实现进程调度的函数.通过一定算法,进行调度.假设有2各进
程a,b,a运行时,调用了schedule(),那么os就要从进程就绪队列中挑选一个合适的进程,
如果没有合适进程,则后面继续运行a,假设找到了合适进程b,则就要从当前进程a切换到b.
这个切换过程是在switch_to()中进行的.


    switch_to()出现在schedule()函数里面。调用形式switch_to(prev, next, last);
prev,next都是进程控制块task_struct的指针.prev指向当前运行的进程,next指向要切
换的进程.


    讲一下我移植的代码.由于代码是汇编程序,首先介绍一下cpu结构。我用的cpu采用
16位指令,32位的地址和数据。有16个通用寄存器,记作r0-r15。r0作为堆栈指针寄存器
sp,r1用途不固定,r2-r6作为参数传递寄存器,函数调用如果有不超过5个的参数,则参
数从左至右依次放在r2-r6中。同时,r2还作为函数返回值寄存器,函数的返回值都放在
r2里面。r7-r14是局部变量寄存器。r15是函数返回地址寄存器,也叫link register,
存放的是function call地返回地址。


    #define switch_to(prev,next,last) {                 \
  (1)  register void *_prev __asm__ ("r2") = (prev);    \
  (2)  register void *_next __asm__ ("r3") = (next);    \
  (3)  register void *_last;                            \
  (4)           __asm__ __volatile__(                   \
  (5)           "jbsr " SYMBOL_NAME_STR(resume) "\t"  \
  (6)           "mfcr %0, ss4"                          \
  (7)              : "=r" (_last)                       \
  (8)              : "r" (_prev),                       \
  (9)                "r" (_next)                        \
  (10)             : "r2", "r2", "r3");                 \
  (11)  (last) = _last;                                 \
   }
换的进程.


    讲一下我移植的代码.由于代码是汇编程序,首先介绍一下cpu结构。我用的cpu采用
16位指令,32位的地址和数据。有16个通用寄存器,记作r0-r15。r0作为堆栈指针寄存器
sp,r1用途不固定,r2-r6作为参数传递寄存器,函数调用如果有不超过5个的参数,则参
数从左至右依次放在r2-r6中。同时,r2还作为函数返回值寄存器,函数的返回值都放在
r2里面。r7-r14是局部变量寄存器。r15是函数返回地址寄存器,也叫link register,
存放的是function call地返回地址。


    #define switch_to(prev,next,last) {                 \
  (1)  register void *_prev __asm__ ("r2") = (prev);    \
  (2)  register void *_next __asm__ ("r3") = (next);    \
  (3)  register void *_last;                            \
  (4)           __asm__ __volatile__(                   \
  (5)           "jbsr " SYMBOL_NAME_STR(resume) "\n\t"  \
  (6)           "mfcr %0, ss4"                          \
  (7)              : "=r" (_last)                       \
  (8)              : "r" (_prev),                       \
  (9)                "r" (_next)                        \
  (10)             : "r2", "r2", "r3");                 \
  (11)  (last) = _last;                                 \
   }

51 c8051f(f020,f040) msp430 arm(2410,2510) fpga(xc3s4000) dsp(5116 dm642) keilc vc++ matlab linux protel Ten_layerPCB mpegx h.26x Rscode Turbocode ofdm VideoBroadcasting ldpc_code(now!)
switch_to()所做的工作其实相当于为调用resume做一些准备。(1)-(2)的意思是将变
量_prev,_next分别放在寄存器r2,r3里面,他们的值分别等于prev和next,就是两个
task_struct的指针。这么做是为调用resume准备好参数。第三行是声明一个寄存器临时变
量_last。

第(5)行是调用resume函数实现进程切换。jbsr是一条跳转指令,字面意思是跳入到子
程序(jump to subroutine),这条指令做的工作是将现将当前pc+2保存到r15中(因为是16
位指令,所以+2),相当于保存函数的返回值,然后再将pc设置成汇编指令参数中给出的
地址(就是跳转,这里就是resume的地址)。

第(6)行是将控制寄存器ss4内容放到_last对应的寄存器中。这一行指令有一些
trick,先讲指令所做的操作,再讲为什么这样做。mfcr是从控制寄存器移动到通用寄
存器的指令。cpu除了有16个通用寄存器,还有16各控制寄存器。所有涉及控制寄存器
的操作都要在cpu的超级用户模式下进行。cpu模式切换通过设置第0号控制寄存器来完
成。16个控制寄存器分别为cr0-cr15,其中cr0也叫psr是程序状态寄存器。cr6-cr10
也叫ss0-ss4是用于保存状态的寄存器。第(6)代码就是将ss4内容放入到变量_last
所对应的寄存器中。

(7)-(10)行的意义请参考AT&T汇编。

(11)行是一个赋值,last=_last。

switch_to()所做的工作其实相当于为调用resume做一些准备。(1)-(2)的意思是将变
量_prev,_next分别放在寄存器r2,r3里面,他们的值分别等于prev和next,就是两个
task_struct的指针。这么做是为调用resume准备好参数。第三行是声明一个寄存器临时变
量_last。

第(5)行是调用resume函数实现进程切换。jbsr是一条跳转指令,字面意思是跳入到子
程序(jump to subroutine),这条指令做的工作是将现将当前pc+2保存到r15中(因为是16
位指令,所以+2),相当于保存函数的返回值,然后再将pc设置成汇编指令参数中给出的
地址(就是跳转,这里就是resume的地址)。

第(6)行是将控制寄存器ss4内容放到_last对应的寄存器中。这一行指令有一些
trick,先讲指令所做的操作,再讲为什么这样做。mfcr是从控制寄存器移动到通用寄
存器的指令。cpu除了有16个通用寄存器,还有16各控制寄存器。所有涉及控制寄存器
的操作都要在cpu的超级用户模式下进行。cpu模式切换通过设置第0号控制寄存器来完
成。16个控制寄存器分别为cr0-cr15,其中cr0也叫psr是程序状态寄存器。cr6-cr10
也叫ss0-ss4是用于保存状态的寄存器。第(6)代码就是将ss4内容放入到变量_last
所对应的寄存器中。

(7)-(10)行的意义请参考AT&T汇编。

(11)行是一个赋值,last=_last。

其实,上面并不是一个非常优化的做法。完全可以省掉_last变量,不过当初我做时
,看到m68k版本用了_last变量,而又不很清楚他的作用,为防止出错,照办了过来。其
实经过后面分析,可知这个变量其实是冗余的。

那么,为什么要有(6)和(11)行的代码呢?回头可以看一下schedule()的代码,在
switch_to()调用过后,schedule()中调用了schedule_tail(prev)函数。显然prev作为
参数,应该放到r2里面,所以就有了switch_to()代码的第(11)行。那么为什么prev是来
自ss4呢?

在调用resume之前,prev存放在r2中。r2中的内容属于进程的上下文,在做进程切
换时,要存放在栈中。同时切换到另一个进程时,还要将另一个进程的上下文装入到寄
存器中。在装入新进程时,r2的值就会被冲掉。举个例子,比如你通过fork系统调用创
建了一个新进程。我们知道,fork地返回值如果是0就表示子进程,大于0就是父进程。
对于子进程,这个栈里r2就是0(前面说过,r2用作放函数返回值),如果此时schedule
选了一个经fork后的子进程开始执行,则切换到该子进程后,其r2显然为0,当然就不
是prev了。所以,我的实现是在进程切换时,将r2值存放在ss4中,切换完毕后,再进
行区别对待。如果是两个已经运行过的进程切换,则返回就返回到原来switch_to的地
方。如果是新的fork出来的进程,则第一次调用,在resume返回时,返回的是
ret_from_fork,这是另外处理的。

(11)行是一个赋值,last=_last。
51 c8051f(f020,f040) msp430 arm(2410,2510) fpga(xc3s4000) dsp(5116 dm642) keilc vc++ matlab linux protel Ten_layerPCB mpegx h.26x Rscode Turbocode ofdm VideoBroadcasting ldpc_code(now!)
其实,上面并不是一个非常优化的做法。完全可以省掉_last变量,不过当初我做时
,看到m68k版本用了_last变量,而又不很清楚他的作用,为防止出错,照办了过来。其
实经过后面分析,可知这个变量其实是冗余的。

那么,为什么要有(6)和(11)行的代码呢?回头可以看一下schedule()的代码,在
switch_to()调用过后,schedule()中调用了schedule_tail(prev)函数。显然prev作为
参数,应该放到r2里面,所以就有了switch_to()代码的第(11)行。那么为什么prev是来
自ss4呢?

在调用resume之前,prev存放在r2中。r2中的内容属于进程的上下文,在做进程切
换时,要存放在栈中。同时切换到另一个进程时,还要将另一个进程的上下文装入到寄
存器中。在装入新进程时,r2的值就会被冲掉。举个例子,比如你通过fork系统调用创
建了一个新进程。我们知道,fork地返回值如果是0就表示子进程,大于0就是父进程。
对于子进程,这个栈里r2就是0(前面说过,r2用作放函数返回值),如果此时schedule
选了一个经fork后的子进程开始执行,则切换到该子进程后,其r2显然为0,当然就不
是prev了。所以,我的实现是在进程切换时,将r2值存放在ss4中,切换完毕后,再进
行区别对待。如果是两个已经运行过的进程切换,则返回就返回到原来switch_to的地
方。如果是新的fork出来的进程,则第一次调用,在resume返回时,返回的是
ret_from_fork,这是另外处理的。

上面说了这么多,可能读者还是糊里糊涂的,我也觉得自己没说清楚,所以这里的
这点实现有那么一点点trick,需要对cpu的ABI和linux的内核代码非常熟悉才行。
(11)ldw r7, (r0) /* restore r7 */
(12)ldw r8, (r0, 4) /* restore r8 */
(13)addi r0, 8
(14)SAVE_SWITCH_STACK
(15)lrw r8, TASK_THREAD /* the position of thread in task_struct */
(16)addu r8, r2
(17)mfcr r6, ss1 /* Get current usp */
(18)stw r6, (r8, THREAD_USP) /* Save usp in task struct */
(19)stw r0, (r8, THREAD_KSP) /* Save ksp in task struct */

(20)lrw r8, TASK_THREAD
(21)lrw r7, SYMBOL_NAME(_current_task)
(22)stw r3, (r7) /* Set new task */
(23)addu r8, r3 /* Pointer to thread in task_struct */

/* Set up next process to run */
(24)ldw r0, (r8, THREAD_KSP) /* Set next ksp */
(25)ldw r6, (r8, THREAD_USP) /* Set next usp */
(26)mtcr r6, ss1
(27)ldw r7, (r8, THREAD_SR) /* Set next PSR */
(28)mtcr r7, psr
(29)RESTORE_SWITCH_STACK
----------------
| r11 |
----------------
| r10 |
----------------
| r9 |
----------------
| r8 |
----------------
| r7 |
----------------
| r6 |
----------------
| r5 |
----------------
| r4 |
----------------
| r3 |
----------------
| r2 |
----------------
0x1effC4 | r1 |
----------------
0x1f0000和0x1effc4分别是执行过(14)前后r0的值。这是个contex save的操作。

注:lrw是立即数装入操作,addu是无符号加法,mfcr和mtcr是控制寄存器移动
操作,bclri是位清除操作,ldw是load word操作,addi是立即数加法操作。
51 c8051f(f020,f040) msp430 arm(2410,2510) fpga(xc3s4000) dsp(5116 dm642) keilc vc++ matlab linux protel Ten_layerPCB mpegx h.26x Rscode Turbocode ofdm VideoBroadcasting ldpc_code(now!)
(15)-(19)是做的栈指针保存操作。将当前进程用户栈和内核栈保存到进程
控制块相应的数据结构中。linux下除了内核线程(只有内核栈)每个进程都有
2个栈,一个在用户空间一个在内核空间。如果是内核线程,则不用关心它的用
户堆栈,反正不会用到,是什么值都可以。如果用户进程,则在用户进程执行
系统调用或者在用户进程执行时发生中断时,都需要从用户空间进入内核空间,
在进入时,原先的用户空间栈指针就会暂时存放到ss1中。所以(17)-(18)两行
就是从ss1中取出用户空间栈指针,存入task_struct中。(15)-(19)的操作可
以总结为:
prev->thread.usp = ss1 保存用户栈指针
prev->thread.ksp = r0 保存内核栈指针

那么有人可能会问,ss1能够保证就是正确的当前用户栈指针么?当然可以。
因为内核线程没有用户栈,所以这个值是什么无所谓。而对于用户进程,进入
resume的唯一入口就是schedule,而这又都是操作系统内核代码。用户进程进
入内核手段就有系统调用和中断,而在系统调用和中断处理一进来就保存了用
户堆栈到ss1,所以在运行时,只要在内核里用的都是内核栈,用户栈指针不会
变。

(20)-(23)执行的操作相当于_current_task = next。不再详细解释。

(24)-(28)执行的是装入新进程上下文的准备工作,也就是准备装入next了。
(24)-(25)是装入next进程的内核和用户栈。因为进程的上下文都保存在该进程
的内核栈里面,所以第一步就是装入该进程的栈指针。(27)-(28)是装入next进
程在切换前的状态信息。(26)就是更新ss1,现在要装入新进程了,当然就要设置
新的用户栈。

(29)是装入next进程的上下文。next进程在栈里有一个和上图一样的上下文,
现在就要装入。

(30)是函数调用返回。如果这个进程是刚fork出来的子进程,则上下文里面
r15=ref_from_fork(可以参看copy_thread函数),否则就是返回到switch_to里
面第(6)句位置。

上面就是进程切换的部分。这部分是和平台相关的。以上是我实现的代码,
感觉效率并不是非常高,但功能是正确的。可能有些地方我没有讲得很清楚,有
什么问题欢迎提出。
--

新的用户栈。

(29)是装入next进程的上下文。next进程在栈里有一个和上图一样的上下文,
现在就要装入。

(30)是函数调用返回。如果这个进程是刚fork出来的子进程,则上下文里面
r15=ref_from_fork(可以参看copy_thread函数),否则就是返回到switch_to里
面第(6)句位置。

上面就是进程切换的部分。这部分是和平台相关的。以上是我实现的代码,
感觉效率并不是非常高,但功能是正确的。可能有些地方我没有讲得很清楚,有
什么问题欢迎提出。
51 c8051f(f020,f040) msp430 arm(2410,2510) fpga(xc3s4000) dsp(5116 dm642) keilc vc++ matlab linux protel Ten_layerPCB mpegx h.26x Rscode Turbocode ofdm VideoBroadcasting ldpc_code(now!)
返回列表