Appearance
proc.c
#include "types.h"
#include "param.h"
#include "memlayout.h"
#include "riscv.h"
#include "spinlock.h"
#include "proc.h"
#include "defs.h"
struct cpu cpus[NCPU];
struct proc proc[NPROC];
struct proc *initproc;
int nextpid = 1;
struct spinlock pid_lock;
extern void forkret(void);
static void freeproc(struct proc *p);
extern char trampoline[];
TIP
帮助确保对 wait() 中父进程的唤醒不会丢失。 在使用 p->parent 时,有助于遵守内存模型。 必须在获取任何 p->lock 之前获取此锁。
struct spinlock wait_lock;
TIP
为每个进程的内核栈分配一个页面。 将其映射到高地址内存,后面跟着一个无效的保护页。
void
proc_mapstacks(pagetable_t kpgtbl)
{
struct proc *p;
for(p = proc; p < &proc[NPROC]; p++) {
char *pa = kalloc();
if(pa == 0)
panic("kalloc");
uint64 va = KSTACK((int) (p - proc));
kvmmap(kpgtbl, va, (uint64)pa, PGSIZE, PTE_R | PTE_W);
}
}
TIP
初始化进程表和相关锁。 在系统启动时由 main 调用。
void
procinit(void)
{
struct proc *p;
initlock(&pid_lock, "nextpid");
initlock(&wait_lock, "wait_lock");
for(p = proc; p < &proc[NPROC]; p++) {
initlock(&p->lock, "proc");
p->state = UNUSED;
p->kstack = KSTACK((int) (p - proc));
}
}
TIP
返回当前 CPU 的 ID (hartid)。 调用时必须禁用中断,以避免调度器将进程移到其他 CPU。 r_tp() 读取 RISC-V 的 tp 寄存器,该寄存器在启动时被设置为 CPU ID。
int
cpuid()
{
int id = r_tp();
return id;
}
TIP
返回当前 CPU 的 struct cpu 指针。 调用时必须禁用中断。
struct cpu*
mycpu(void)
{
int id = cpuid();
struct cpu *c = &cpus[id];
return c;
}
TIP
返回当前 CPU 上正在运行的进程的 struct proc 指针。 如果没有进程在运行,则返回零。 push_off/pop_off 用于禁用/启用中断,以确保读取 c->proc 的原子性。
struct proc*
myproc(void)
{
push_off();
struct cpu *c = mycpu();
struct proc *p = c->proc;
pop_off();
return p;
}
TIP
分配一个唯一的进程 ID (PID)。 使用自旋锁 pid_lock 来保护 nextpid 的原子性,防止多个进程同时分配到相同的 PID。
int
allocpid()
{
int pid;
acquire(&pid_lock);
pid = nextpid;
nextpid = nextpid + 1;
release(&pid_lock);
return pid;
}
TIP
在进程表中查找一个状态为 UNUSED 的进程槽位。 如果找到,则初始化其内核状态,并持有 p->lock 返回。 如果没有可用的进程槽位或内存分配失败,则返回 0。
static struct proc*
allocproc(void)
{
struct proc *p;
for(p = proc; p < &proc[NPROC]; p++) {
acquire(&p->lock);
if(p->state == UNUSED) {
goto found;
} else {
release(&p->lock);
}
}
return 0;
found:
p->pid = allocpid();
p->state = USED;
TIP
分配一个陷阱帧页面。
if((p->trapframe = (struct trapframe *)kalloc()) == 0){
freeproc(p);
release(&p->lock);
return 0;
}
TIP
创建一个空的用户页表。
p->pagetable = proc_pagetable(p);
if(p->pagetable == 0){
freeproc(p);
release(&p->lock);
return 0;
}
TIP
设置新的上下文,使其在内核栈上开始执行 forkret。 forkret 最终会返回到用户空间。
memset(&p->context, 0, sizeof(p->context));
p->context.ra = (uint64)forkret;
p->context.sp = p->kstack + PGSIZE;
return p;
}
TIP
释放一个进程结构体及其相关的资源(如用户内存、陷阱帧)。 调用时必须持有 p->lock。
static void
freeproc(struct proc *p)
{
if(p->trapframe)
kfree((void*)p->trapframe);
p->trapframe = 0;
if(p->pagetable)
proc_freepagetable(p->pagetable, p->sz);
p->pagetable = 0;
p->sz = 0;
p->pid = 0;
p->parent = 0;
p->name[0] = 0;
p->chan = 0;
p->killed = 0;
p->xstate = 0;
p->state = UNUSED;
}
TIP
为给定进程创建一个用户页表。 该页表初始时只包含 trampoline 和 trapframe 的映射,没有用户内存。
pagetable_t
proc_pagetable(struct proc *p)
{
pagetable_t pagetable;
TIP
创建一个空的页表。
pagetable = uvmcreate();
if(pagetable == 0)
return 0;
TIP
将 trampoline 代码映射到用户虚拟地址空间的顶部。 TRAMPOLINE 是一个固定的虚拟地址。 trampoline 是链接器脚本中定义的物理地址。 PTE_R | PTE_X 表示页面可读、可执行,但不可写。 没有设置 PTE_U,因为这部分内存只在 supervisor 模式下访问。
if(mappages(pagetable, TRAMPOLINE, PGSIZE,
(uint64)trampoline, PTE_R | PTE_X) < 0){
uvmfree(pagetable, 0);
return 0;
}
TIP
将陷阱帧页面映射到 trampoline 下方。 TRAPFRAME 是一个固定的虚拟地址。 p->trapframe 是刚分配的物理页。 PTE_R | PTE_W 表示页面可读、可写。
if(mappages(pagetable, TRAPFRAME, PGSIZE,
(uint64)(p->trapframe), PTE_R | PTE_W) < 0){
uvmunmap(pagetable, TRAMPOLINE, 1, 0);
uvmfree(pagetable, 0);
return 0;
}
return pagetable;
}
TIP
释放一个进程的页表以及它引用的所有物理内存。
void
proc_freepagetable(pagetable_t pagetable, uint64 sz)
{
uvmunmap(pagetable, TRAMPOLINE, 1, 0);
uvmunmap(pagetable, TRAPFRAME, 1, 0);
uvmfree(pagetable, sz);
}
TIP
initcode 是一个小的用户程序,它执行 exec("/init")。 这是第一个在用户空间运行的程序。 它的二进制代码是硬编码的,从 ../user/initcode.S 汇编而来。
uchar initcode[] = {
0x17, 0x05, 0x00, 0x00, 0x13, 0x05, 0x45, 0x02,
0x97, 0x05, 0x00, 0x00, 0x93, 0x85, 0x35, 0x02,
0x93, 0x08, 0x70, 0x00, 0x73, 0x00, 0x00, 0x00,
0x93, 0x08, 0x20, 0x00, 0x73, 0x00, 0x00, 0x00,
0xef, 0xf0, 0x9f, 0xff, 0x2f, 0x69, 0x6e, 0x69,
0x74, 0x00, 0x00, 0x24, 0x00, 0x00, 0x00, 0x00,
0x00, 0x00, 0x00, 0x00
};
TIP
设置第一个用户进程 (init)。
void
userinit(void)
{
struct proc *p;
p = allocproc();
initproc = p;
TIP
分配一页用户内存,并将 initcode 复制进去。
uvmfirst(p->pagetable, initcode, sizeof(initcode));
p->sz = PGSIZE;
TIP
准备从内核态到用户态的第一次“返回”。
p->trapframe->epc = 0;
p->trapframe->sp = PGSIZE;
safestrcpy(p->name, "initcode", sizeof(p->name));
p->cwd = namei("/");
p->state = RUNNABLE;
release(&p->lock);
}
TIP
增加或减少当前进程的用户内存 n 字节。 n > 0 表示增加,n < 0 表示减少。 成功返回 0,失败返回 -1。
int
growproc(int n)
{
uint64 sz;
struct proc *p = myproc();
sz = p->sz;
if(n > 0){
if((sz = uvmalloc(p->pagetable, sz, sz + n, PTE_W)) == 0) {
return -1;
}
} else if(n < 0){
sz = uvmdealloc(p->pagetable, sz, sz + n);
}
p->sz = sz;
return 0;
}
TIP
创建一个新进程,作为当前进程的副本(子进程)。 子进程的内核栈被设置为,当它第一次被调度时,会返回到 forkret, 并且看起来就像是从 fork() 系统调用返回一样。
int
fork(void)
{
int i, pid;
struct proc *np;
struct proc *p = myproc();
TIP
分配一个新的进程结构体。
if((np = allocproc()) == 0){
return -1;
}
TIP
从父进程向子进程复制用户内存。
if(uvmcopy(p->pagetable, np->pagetable, p->sz) < 0){
freeproc(np);
release(&np->lock);
return -1;
}
np->sz = p->sz;
TIP
复制父进程保存的陷阱帧(包含了用户寄存器)。
*(np->trapframe) = *(p->trapframe);
TIP
对于子进程,fork 系统调用应该返回 0。 a0 寄存器用于存放函数返回值。
np->trapframe->a0 = 0;
TIP
复制打开的文件描述符。
for(i = 0; i < NOFILE; i++)
if(p->ofile[i])
np->ofile[i] = filedup(p->ofile[i]);
np->cwd = idup(p->cwd);
safestrcpy(np->name, p->name, sizeof(p->name));
pid = np->pid;
release(&np->lock);
TIP
将子进程的父进程指针指向当前进程。
acquire(&wait_lock);
np->parent = p;
release(&wait_lock);
TIP
将子进程的状态设置为可运行。
acquire(&np->lock);
np->state = RUNNABLE;
release(&np->lock);
return pid;
}
TIP
将一个已退出进程 (p) 的所有子进程过继给 init 进程。 调用者必须持有 wait_lock。
void
reparent(struct proc *p)
{
struct proc *pp;
for(pp = proc; pp < &proc[NPROC]; pp++){
if(pp->parent == p){TIP
这是一个子进程,将其父进程设置为 initproc。
pp->parent = initproc;TIP
唤醒 init 进程,以防它正在 wait() 中等待子进程退出。
wakeup(initproc);
}
}
}
TIP
退出当前进程。此函数不会返回。 退出的进程会进入 ZOMBIE 状态,直到其父进程调用 wait() 来收集它。
void
exit(int status)
{
struct proc *p = myproc();
if(p == initproc)
panic("init exiting");
TIP
关闭所有打开的文件。
for(int fd = 0; fd < NOFILE; fd++){
if(p->ofile[fd]){
struct file *f = p->ofile[fd];
fileclose(f);
p->ofile[fd] = 0;
}
}
begin_op();
iput(p->cwd);
end_op();
p->cwd = 0;
acquire(&wait_lock);
TIP
将所有子进程过继给 init 进程。
reparent(p);
TIP
唤醒父进程,如果它正在 wait() 中等待。
wakeup(p->parent);
acquire(&p->lock);
p->xstate = status;
p->state = ZOMBIE;
release(&wait_lock);
TIP
跳转到调度器,永不返回。
sched();
panic("zombie exit");
}
TIP
等待一个子进程退出,并返回其 PID。 如果该进程没有子进程,或者被杀死,则返回 -1。 如果 addr 非零,则将子进程的退出状态复制到 addr 指向的用户地址。
int
wait(uint64 addr)
{
struct proc *pp;
int havekids, pid;
struct proc *p = myproc();
acquire(&wait_lock);
for(;;){TIP
扫描进程表,查找已退出的子进程。
havekids = 0;
for(pp = proc; pp < &proc[NPROC]; pp++){
if(pp->parent == p){TIP
这是一个子进程。 获取子进程的锁,以确保它不会在此时被 freeproc 释放。
acquire(&pp->lock);
havekids = 1;
if(pp->state == ZOMBIE){TIP
找到了一个僵尸子进程,可以收集它。
pid = pp->pid;
if(addr != 0 && copyout(p->pagetable, addr, (char *)&pp->xstate,
sizeof(pp->xstate)) < 0) {TIP
复制退出状态失败。
release(&pp->lock);
release(&wait_lock);
return -1;
}
freeproc(pp);
release(&pp->lock);
release(&wait_lock);
return pid;
}
release(&pp->lock);
}
}
TIP
如果没有子进程,或者当前进程被杀死,那么等待就没有意义了。
if(!havekids || killed(p)){
release(&wait_lock);
return -1;
}
TIP
等待一个子进程退出。 sleep 会原子地释放 wait_lock 并使当前进程休眠。
sleep(p, &wait_lock);
}
}
TIP
每个 CPU 的进程调度器。 在系统启动时,每个 CPU 核心都会调用此函数。 调度器永不返回,它在一个无限循环中: - 查找一个可运行的进程 (RUNNABLE)。 - 使用 swtch 切换到该进程的上下文。 - 当进程让出 CPU 时,它会通过 swtch 切换回调度器。
void
scheduler(void)
{
struct proc *p;
struct cpu *c = mycpu();
c->proc = 0;
for(;;){TIP
启用中断,防止在所有进程都休眠时死锁。
intr_on();
int found = 0;
for(p = proc; p < &proc[NPROC]; p++) {
acquire(&p->lock);
if(p->state == RUNNABLE) {TIP
找到了一个可运行的进程,切换到它。
p->state = RUNNING;
c->proc = p;
swtch(&c->context, &p->context);
TIP
进程运行完毕,返回到这里。 它应该已经改变了自己的状态(例如,变为 SLEEPING 或 RUNNABLE)。
c->proc = 0;
found = 1;
}
release(&p->lock);
}
if(found == 0) {TIP
没有可运行的进程,CPU 进入低功耗状态,等待中断。
intr_on();
asm volatile("wfi");
}
}
}
TIP
切换回调度器。 调用此函数时,必须持有当前进程的锁 p->lock, 并且进程状态不能是 RUNNING。 它保存当前的中断使能状态,并通过 swtch 切换到调度器的上下文。
void
sched(void)
{
int intena;
struct proc *p = myproc();
if(!holding(&p->lock))
panic("sched p->lock");
if(mycpu()->noff != 1)
panic("sched locks");
if(p->state == RUNNING)
panic("sched running");
if(intr_get())
panic("sched interruptible");
intena = mycpu()->intena;
swtch(&p->context, &mycpu()->context);
mycpu()->intena = intena;
}
TIP
主动让出 CPU,给其他进程一个运行的机会。
void
yield(void)
{
struct proc *p = myproc();
acquire(&p->lock);
p->state = RUNNABLE;
sched();
release(&p->lock);
}
TIP
当一个 fork 产生的子进程第一次被调度器选中时, 它会通过 swtch 进入 forkret 函数。
void
forkret(void)
{
static int first = 1;
TIP
此时仍然持有从 scheduler() 获得的 p->lock。
release(&myproc()->lock);
if (first) {TIP
第一次执行时,初始化文件系统。 文件系统初始化需要在一个常规进程的上下文中运行(因为它可能会调用 sleep), 所以不能在 main() 中直接调用。
fsinit(ROOTDEV);
first = 0;TIP
内存屏障,确保 first=0 的写入对其他核心可见。
__sync_synchronize();
}
TIP
返回到用户空间。
usertrapret();
}
TIP
在 chan 上原子地休眠,并释放锁 lk。 当被 wakeup 唤醒时,会重新获取锁 lk。
void
sleep(void *chan, struct spinlock *lk)
{
struct proc *p = myproc();
TIP
必须获取 p->lock 来修改 p->state 并调用 sched()。 一旦持有 p->lock,就不会错过任何 wakeup(因为 wakeup 也会锁定 p->lock), 所以此时释放 lk 是安全的。
acquire(&p->lock);
release(lk);
TIP
进入休眠状态。
p->chan = chan;
p->state = SLEEPING;
sched();
TIP
被唤醒后,从这里继续执行。 清理休眠通道。
p->chan = 0;
TIP
重新获取原来的锁。
release(&p->lock);
acquire(lk);
}
TIP
唤醒所有在 chan 上休眠的进程。 调用时不能持有任何进程的锁。
void
wakeup(void *chan)
{
struct proc *p;
for(p = proc; p < &proc[NPROC]; p++) {
if(p != myproc()){
acquire(&p->lock);
if(p->state == SLEEPING && p->chan == chan) {TIP
找到一个在指定通道上休眠的进程,将其唤醒。
p->state = RUNNABLE;
}
release(&p->lock);
}
}
}
TIP
杀死指定 PID 的进程。 被杀死的进程不会立即退出,而是在下一次从内核态返回用户态时 (在 trap.c 的 usertrap() 中) 检查 killed 标志并退出。
int
kill(int pid)
{
struct proc *p;
for(p = proc; p < &proc[NPROC]; p++){
acquire(&p->lock);
if(p->pid == pid){
p->killed = 1;
if(p->state == SLEEPING){TIP
如果进程正在休眠,则唤醒它,以便它能检查 killed 标志。
p->state = RUNNABLE;
}
release(&p->lock);
return 0;
}
release(&p->lock);
}
return -1;
}
TIP
设置进程的 killed 标志。
void
setkilled(struct proc *p)
{
acquire(&p->lock);
p->killed = 1;
release(&p->lock);
}
TIP
检查进程是否被杀死。
int
killed(struct proc *p)
{
int k;
acquire(&p->lock);
k = p->killed;
release(&p->lock);
return k;
}
TIP
根据 user_dst 的值,将数据从内核空间 (src) 复制到 用户地址空间 (dst) 或内核地址空间 (dst)。 user_dst 为 1 表示目标在用户空间。 成功返回 0,失败返回 -1。
int
either_copyout(int user_dst, uint64 dst, void *src, uint64 len)
{
struct proc *p = myproc();
if(user_dst){
return copyout(p->pagetable, dst, src, len);
} else {
memmove((char *)dst, src, len);
return 0;
}
}
TIP
根据 user_src 的值,将数据从用户地址空间 (src) 或 内核地址空间 (src) 复制到内核空间 (dst)。 user_src 为 1 表示源在用户空间。 成功返回 0,失败返回 -1。
int
either_copyin(void *dst, int user_src, uint64 src, uint64 len)
{
struct proc *p = myproc();
if(user_src){
return copyin(p->pagetable, dst, src, len);
} else {
memmove(dst, (char*)src, len);
return 0;
}
}
TIP
向控制台打印进程列表,用于调试。 当用户在控制台按下 Ctrl+P 时调用。 此函数不获取任何锁,以避免在系统卡住时加剧问题。
void
procdump(void)
{
static char *states[] = {
[UNUSED] "unused",
[USED] "used",
[SLEEPING] "sleep ",
[RUNNABLE] "runble",
[RUNNING] "run ",
[ZOMBIE] "zombie"
};
struct proc *p;
char *state;
printf("\n");
for(p = proc; p < &proc[NPROC]; p++){
if(p->state == UNUSED)
continue;
if(p->state >= 0 && p->state < NELEM(states) && states[p->state])
state = states[p->state];
else
state = "???";
printf("%d %s %s", p->pid, state, p->name);
printf("\n");
}
}