Linux内核是如何创建进程？

进程复制文件调用 860 来源： 2025-05-15

Linux内核创建进程的过程是一个涉及多模块协作的复杂机制，主要分为fork()系统调用和exec()系列调用两个阶段。以下是详细的技术流程分析：

系统调用入口
```
SYSCALL_DEFINE0(fork)
→ _do_fork()
```
核心操作流程：
- 复制进程描述符
  c copy_process( CLONE_VM | // 是否共享地址空间 CLONE_FS | // 共享文件系统信息 SIGCHLD, // 子进程终止信号 stack_start, // 用户态栈指针 regs, // 寄存器集合 0, // 无标志 NULL, // 无父进程tidptr NULL); // 无子进程tidptr

关键复制操作：
- cred结构体：复制/共享凭证（COW优化）
- files_struct：复制文件描述符表（默认共享打开文件）
- mm_struct：
  c dup_mm() → mm_init() → dup_mmap() // 写时复制(COW)机制
- 线程栈：为子进程分配新的内核栈（alloc_thread_stack_node()）

系统调用入口

execve() → do_execve() → do_execveat_common()

关键加载流程：
- 文件系统检查
  c open_exec(filename) // 打开可执行文件
- 解析二进制格式
  通过struct linux_binfmt链表匹配处理程序（ELF/a.out/脚本等） c search_binary_handler()
- ELF文件加载（以常见格式为例）：
  - 读取ELF头检查魔数（0x7F 0x45 0x4C 0x46）
  - 加载程序头表（PT_LOAD段映射到内存）
  - 设置入口地址（e_entry）
地址空间重建：
- 销毁旧地址空间：exec_mmap() → mmput()
- 创建新页表：init_new_context()
- 建立新的VMA区域（代码段/数据段/堆栈等）
寄存器重置
在start_thread()中设置用户态EIP/ESP指向新程序入口

写时复制（COW）
- 父子进程共享物理页，仅在写入时触发缺页异常复制新页
- 通过页表项_PAGE_BIT_DIRTY控制
线程实现
- clone()系统调用通过不同flags组合实现： c CLONE_VM | CLONE_FILES | CLONE_SIGHAND // 共享地址空间和资源
vfork()优化
- 完全共享父进程地址空间，阻塞父进程直到子进程exec/exit
- 避免不必要的页表复制

常见错误及内核应对： 1. 资源不足
- 返回-ENOMEM并触发OOM killer（若启用） 2. 权限问题
- -EACCES（二进制文件不可执行） 3. 内存泄漏防护
copy_process()失败时会调用free_task_struct()

可通过/proc/<pid>/status查看：

voluntary_ctxt_switches: 123  # 自愿上下文切换
nonvoluntary_ctxt_switches: 45 # 非自愿切换

该机制充分体现了Linux内核的几大设计哲学： 1. 惰性分配：COW机制延迟实际资源分配 2. 分离策略：将进程创建与程序加载解耦 3. 层次化设计：通过命名空间支持容器虚拟化

理解这个过程对调试进程创建失败、优化启动性能（如preforking技术）有重要意义。

推荐文章