最近項目遇到一個問題,程序退出的時候資源沒有正常釋放。經過調試發現,原來是網絡線程一直阻塞,導致一些必要的資源沒有被釋放,寫了幾個簡單的測試程序調試了一下才明白,原來在Linux下直接close socket的文件描述符,並不會使程序中調用的一些阻塞式的socket函數比如 read、recvfrom 等)退出阻塞,從而導致無法正常釋放資源。簡化示例如下。
下面是一個簡化的UDP服務程序,首先創建socket對象,然後開啟服務線程,將客戶端發送過來的數據包回發給客戶端。當用戶在shell中敲入兩次回車後,程序退出。我們來觀察一下程序退出後,socket服務線程在怎樣的情況下可以正常退出。
- #include <stdio.h>
- #include <sys/types.h>
- #include <sys/socket.h>
- #include <linux/in.h>
- #include <string.h>
- #include <pthread.h>
- #define SERVER_PORT 8888
- #define BUFFER_LEN 256
- int g_Exit = 0;
- void *service( void* arg )
- {
- char buff[BUFFER_LEN];
- struct sockaddr clientAddr;
- int socklen = sizeof(clientAddr);
- int recvbytes;
- int socketfd = *((int *)arg);
- printf("OK, Enter Service!\n");
- while(!g_Exit)
- {
- recvbytes = recvfrom(socketfd,buff,BUFFER_LEN,0,&clientAddr,&socklen);
- sendto(socketfd,buff,recvbytes,0,&clientAddr,socklen);
- }
- printf("OK, Service Thread Exit!\n");
- pthread_exit(NULL);;
- }
- int main( int argc,char * argv[] )
- {
- int fd;
- void *status;
- struct sockaddr_in serverAddr;
- pthread_t thr;
- pthread_attr_t attr;
- fd = socket(AF_INET,SOCK_DGRAM,0);
- memset(&serverAddr,0,sizeof(serverAddr));
- serverAddr.sin_family = AF_INET;
- serverAddr.sin_addr.s_addr = htonl(INADDR_ANY);
- serverAddr.sin_port = htons(SERVER_PORT);
- bind(fd,(struct sockaddr *)&serverAddr,sizeof(serverAddr));
- // create service thread
- pthread_attr_init(&attr);
- pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_JOINABLE);
- if( pthread_create(&thr,&attr,service,(void *)&fd ) )
- {
- printf("pthread_create fail!\n");
- return -1;
- }
- // Free attribute
- pthread_attr_destroy(&attr);
- // wait user control exit
- getchar();
- getchar();
- g_Exit = 1;
- printf("OK, Waiting For Thread Exit...!\n");
- close(fd);
- // wait for thread exit
- pthread_join(thr, &status);
- printf("OK, Exit Main Process !\n");
- return 0;
- }
上述程序,當用戶敲兩次回車後,顯示結果如下:
可以看到,沒有打出主進程和服務線程的退出信息,無論是主進程還是服務線程都沒有正常退出,由此可見,直接close socket句柄,並不能使 recvfrom 函數退出阻塞。
那麼,如果把 pthread_join 換成 pthread_cancel 呢?結果是一樣的,雖然主進程退出了,但依然無法讓 service 線程正常退出。那麼,該如何才能正常退出 recvfrom 的阻塞呢?
網上搜了一下,可以考慮使用 shutdown 函數。
- //shutdown函數原型為:
- #include <sys/socket.h>
- int shutdown(int s, int how);
- //shutdown() 可以對套接字的關閉進行更細致的控制,它允許對套接字進行單向關閉或全部禁止。
- //參數 s 為待關閉的套接字描述符。
- //參數 how 指定了關閉方式,具體取值如下:
- //SHUT_RD : 將連接上的讀通道關閉,此後進程將不能再接收到任何數據,接收緩沖區中還未被讀取的數據也將被丟棄,但仍然可以在該套接字上發送數據。
- //SHUT_WR : 將連接上的寫通道關閉,此後進程將不能再發送任何數據,發送緩沖區中還未被發送的數據也將被丟棄,但仍然可以在該套接字上接收數據。
- //SHUT_RDWR : 讀、寫通道都將被關閉。
- //執行成功返回 0,出錯則返回 -1,錯誤代碼存入 errno 中。
可以測試一下,我們在上述代碼的pthread_join前面加上一句:shutdown(fd,SHUT_RDWR); 然後再編譯調試,結果如下:
可以看到,Service服務線程已經正常退出了。進一步測試,如果只是shutdown寫通道或者只shutdown讀通道呢?
經過測試可以發現,如果只關閉寫通道 shutdown(fd,SHUT_WR); 服務線程依然無法正常退出,而如果只關閉讀通道 shutdown(fd,SHUT_RD),則服務線程正常退出了。分析如下:因為recvfrom在fd的讀通道等待列表中,因此必須關閉讀通道時才能將recvfrom阻塞喚醒。
那麼,為啥shutdown就可以使得recvfrom退出阻塞,而close卻不能呢?
我的理解如下:shutdown破壞了socket連接的讀寫通道,導致讀寫阻塞的socket函數被喚醒,而close函數只是做了關閉連接釋放socket資源的操作,卻並沒有進行讀寫通道的清理工作,從而無法成功喚醒讀寫函數的阻塞。期待高手給出更深層次的解釋)
進一步,那麼,解決這一問題,還有其他的什麼辦法沒有?
下面我簡單地羅列一下網上搜到的可行的一些方法,以後有時間再深入研究:
1. 設置socket發送/接收超時
2. 使用非阻塞方式,異步socket模型
3. 其他方式,歡迎大家補充。
文章就寫到這裡了,歡迎大家來信進一步交流[email protected]
本文出自 “對影成三人” 博客,請務必保留此出處http://ticktick.blog.51cto.com/823160/845536