在Linux中主要提供了fork、vfork、clone三個進程創建方法。 在linux源碼中這三個調用的執行過程是執行fork(),vfork(),clone()時,通過一個系統調用表映射到sys_fork(),sys_vfork(),sys_clone(),再在這三個函數中去調用do_fork()去做具體的創建進程工作。
forkfork創建一個進程時,子進程隻是完全複制父進程的資源,複制出來的子進程有自己的task_struct結構和pid,但卻複制父進程其它所有的資源。
例如,要是父進程打開了五個文件,那麼子進程也有五個打開的文件,而且這些文件的當前讀寫指針也停在相同的地方。所以,這一步所做的是複制。
這樣得到的子進程獨立于父進程, 具有良好的并發性,但是二者之間的通訊需要通過專門的通訊機制,如:pipe,共享内存等機制, 另外通過fork創建的進程,需要将上面描述的每種資源都複制一個副本。這樣看來,fork是一個開銷十分大的系統調用,這些開銷并不是所有的情況下都是必須的,比如某進程fork出一個子進程後,其子進程僅僅是為了調用exec執行另一個可執行文件,那麼在fork過程中對于虛存空間的複制将是一個多餘的過程。
但由于現在Linux中是采取了copy-on-write(COW寫時複制)技術,為了降低開銷,fork最初并不會真的産生兩個不同的拷貝,因為在那個時候,大量的數據其實完全是一樣的。
寫時複制是在推遲真正的數據拷貝。若後來确實發生了寫入,那意味着parent和child的數據不一緻了,于是産生複制動作,每個進程拿到屬于自己的那一份,這樣就可以降低系統調用的開銷。所以有了寫時複制後呢,vfork其實現意義就不大了。 fork()調用執行一次返回兩個值,對于父進程,fork函數返回子程序的進程号,而對于子程序,fork函數則返回零,這就是一個函數返回兩次的本質。 在fork之後,子進程和父進程都會繼續執行fork調用之後的指令。子進程是父進程的副本。它将獲得父進程的數據空間,堆和棧的副本,這些都是副本,父子進程并不共享這部分的内存。也就是說,子進程對父進程中的同名變量進行修改并不會影響其在父進程中的值。但是父子進程又共享一些東西,簡單說來就是程序的正文段。正文段存放着由cpu執行的機器指令,通常是read-only的。
更多Linux内核視頻教程文檔資料麻煩領取後台私信【内核】自行獲取。
下面是一個驗證的例子:
//例1:fork.c
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
#include<errno.h>
int main()
{
int a = 5;
int b = 2;
pid_t pid;
pid = fork();
if(PID == 0) {
a = a-4;
printf("I'm a child process with PID [%d],the value of a: %d,the value of b:%d.\n",pid,a,b);
}else if(pid < 0) {
perror("fork");
}else {
printf("I'm a parent process, with PID [%d], the value of a: %d, the value of b:%d.\n", pid, a, b);
}
return 0;
}
#gcc –o fork fork.c
#./fork
//運行結果:
I’m a child process with PID[0],the value of a:1,the value of b:2.
I’m a parent process with PID[19824],the value of a:5,the value of b:2.
可見,子進程中将變量a的值改為1,而父進程中則保持不變。
vforkvfork系統調用不同于fork,用vfork創建的子進程與父進程共享地址空間,也就是說子進程完全運行在父進程的地址空間上,如果這時子進程修改了某個變量,這将影響到父進程。
因此,上面的例子如果改用vfork()的話,那麼兩次打印a,b的值是相同的,所在地址也是相同的。
但此處有一點要注意的是用vfork()創建的子進程必須先調用exit()來結束,否則子進程将不能結束,而fork()則不存在這個情況。
Vfork也是在父進程中返回子進程的進程号,在子進程中返回0。 用 vfork創建子進程後,父進程會被阻塞直到子進程調用exec(exec,将一個新的可執行文件載入到地址空間并執行之。)或exit。vfork的好處是在子進程被創建後往往僅僅是為了調用exec執行另一個程序,因為它就不會對父進程的地址空間有任何引用,所以對地址空間的複制是多餘的 ,因此通過vfork共享内存可以減少不必要的開銷。下面這個例子可以驗證子進程調用exec時父進程是否真的已經結束阻塞:
例2:execl.c
#include<stdlib.h>
#include<sys/types.h>
#include<sys/wait.h>
#include<unistd.h>
#include<stdio.h>
#include<errno.h>
#include<string.h>
int main()
{
int a = 1;
int b = 2;
pid_t pid;
int status;
pid = vfork();
if(pid == -1) {
perror("Fork failed to creat a process");
exit(1);
}
else if(pid == 0)
{
// sleep(3);
if(execl("/bin/example","example",NULL)<0)
{
perror("Exec failed");
exit(1);
}
exit(0);
// }else // if(pid != wait(&status)) {
// perror("A Signal occured before the child exited"); }
else
printf("parent process,the value of a :%d, b:%d, addr of a: %p,b: %p\n",a,b,&a,&b); exit(0); }
Example.c
#include<stdio.h>
int main()
{
int a = 1;
int b = 2;
sleep(3);
printf("Child process,the value of a is %d,b is %d,the address a %p,b %p\n",a,b,&a,&b);
return 0;
}
#gcc –o execl execl.c #./ execl 運行結果:
Child process ,The value of a is 1,b is 2,the address a 0xbfb73d90,b 0xbfb73d8c
如果将注釋掉的三行加入程序的話,由于父進程wait()而阻塞,因此即使此時子進程阻塞,父進程也得不到運行,因此運行結果如下: The value of a is 1,b is 2,the address a 0xbfb73d90,b 0xbfb73d8c Parent process,the value of a:1,b:2,addr ofa:0xbfaa710c, b:0xbf aa7108 另外還應注意的是在它調用exec後父進程才可能調度運行,因此sleep(3)函數必須放在example程序中才能生效。 clone 系統調用fork()和vfork()是無參數的,而clone()則帶有參數。fork()是全部複制,vfork()是共享内存,而clone() 是則可以将父進程資源有選擇地複制給子進程,而沒有複制的數據結構則通過指針的複制讓子進程共享,具體要複制哪些資源給子進程,由參數列表中的 clone_flags來決定。另外,clone()返回的是子進程的pid。下面來看一個例子:
例3:clone.c
#include <stdio.h>
#include <stdlib.h>
#include <sched.h>
#include <unistd.h>
#include <fcntl.h>
#include <sys/types.h>
#include <sys/stat.h>
int variable,fd;
int do_something() {
variable = 42;
printf("in child process\n");
close(fd);
// _exit(0);
return 0;
}
int main(int argc, char *argv[]) {
void *child_stack;
char tempch;
variable = 9;
fd = open("/test.txt",O_RDONLY);
child_stack = (void *)malloc(16384);
printf("The variable was %d\n",variable);
clone(do_something, child_stack 10000, CLONE_VM |CLONE_FileS,NULL);
sleep(3); /* 延時以便子進程完成關閉文件操作、修改變量 */
printf("The variable is now %d\n",variable);
if(read(fd,&tempch,1) < 1) {
perror("File Read Error");
exit(1);
}
printf("We could read from the file\n");
return 0;
}
#gcc –o clone clone.c
#./clone
運行結果:
the value was 9
in child process
The variable is now 42
File Read Error
從程序的輸出結果可以看出: 子進程将文件關閉并将變量修改(調用clone時用到的CLONE_VM、CLONE_FILES标志将使得變量和文件描述符表被共享),父進程随即就感覺到了,這就是clone的特點。由于此處沒有設置标志CLONE_VFORK,因此子進程在運行時父進程也不會阻塞,兩者同時運行。
總結一、fork 1. 調用方法
#include <sys/types.h>
#include <unistd.h>
pid_t fork(void);
正确返回:在父進程中返回子進程的進程号,在子進程中返回0,錯誤返回:-1
2. fork函數調用的用途 一個進程希望複制自身,從而複制進程能同時執行不同階段的代碼。
二、vfork 1. 調用方法與fork函數完全相同
#include <sys/types.h>
#include <unistd.h>
pid_t vfork(void);
正确返回:在父進程中返回子進程的進程号,在子進程中返回0 ,錯誤返回:-1 2. vfork函數調用的用途 用vfork創建的進程主要目的是用exec函數執行另外的程序。
三、clone 1.調用方法
#include <sched.h>
int clone(int (*fn)(void *), void *child_stack, int flags, void *arg);
正确返回:返回所創建進程的PID,函數中的flags标志用于設置創建子進程時的相關選項,具體含義參看P25,錯誤返回:-1 2.clone()函數調用的用途 用于有選擇地設置父子進程之間需共享的資源
四、fork,vfork,clone的區别 1. fork出來的子進程是父進程的一個拷貝,即,子進程從父進程得到了數據段和堆棧段的拷貝,這些需要分配新的内存;而對于隻讀的代碼段,通常使用共享内存的方式訪問;
而vfork則是子進程與父進程共享内存空間, 子進程對虛拟地址空間任何數據的修改同樣為父進程所見;clone則由用戶通過參clone_flags 的設置來決定哪些資源共享,哪些資源拷貝。 2. fork不對父子進程的執行次序進行任何限制,fork返回後,子進程和父進程都從調用fork函數的下一條語句開始行,但父子進程運行順序是不定的,它取決于内核的調度算法;而在vfork調用中,子進程先運行,父進程挂起,直到子進程調用了exec或exit之後,父子進程的執行次序才不再有限制;clone中由标志CLONE_VFORK來決定子進程在執行時父進程是阻塞還是運行,若沒有設置該标志,則父子進程同時運行,設置了該标志,則父進程挂起,直到子進程結束為止。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!