'\" t .\" Don't change the first line, it tells man that we need tbl. .\" This man page is Copyright (C) 1999 Andi Kleen . .\" and copyright (c) 1999 Matthew Wilcox. .\" Permission is granted to distribute possibly modified copies .\" of this page provided the header is included verbatim, .\" and in case of nontrivial modification author and date .\" of the modification is added to the header. .TH SOCKET 7 "7 May 1999" "Linux Man Page" "Linux Programmer's Manual" .SH NAME socket \- Linux 套接字 .SH 總覽 .B #include .br .IB mysocket " = socket(int " socket_family ", int " socket_type ", int " protocol ); .SH 描述 本手冊頁介紹了 Linux 套接字的用戶接口. 這個 BSD 兼容套接字是介於用 戶進程與內核網絡協議棧之間的統一接口, 各協議模塊屬於不同的 .I 協議族 ,如 .BR PF_INET ", " PF_IPX ", " PF_PACKET 和 .I 套接字類型 ,如 .B 字節流(SOCK_STREAM) 或 .BR 數據報(SOCK_DGRAM). 關於協議族和套接字類型請參考 .BR socket (2) "." .SH 套接層函數 用戶通過這些套接字函數發送和接收包, 以及其他套接字操作. 詳細說明參看他們各自的手冊頁. .BR socket (2) 創建套接字, .PP .BR connect (2) 與遠程套接字地址建立連接 .PP .BR bind (2) 把套接字和一個本地套接字地址綁定在一起(爲套接字分配一個本地協議地址) .PP .BR listen (2) 通知套接字接受新的連接 .PP .BR accept (2) 爲新的已完成連接獲得新的描述字 .PP .BR socketpair (2) 返回兩個連接的匿名套接字(僅在某些本地族中才有實現,如 .BR PF_UNIX ")" .PP .BR send (2), .PP .BR sendto (2), 和 .BR sendmsg (2) 通過套接字發送數據,而 .BR recv (2), .BR recvfrom (2), .BR recvmsg (2) 從套接字接收數據. .BR poll (2) 和 .PP .BR select (2) 等待數據到來或準備好接收數據. 除此之外, 標準 I/O 操作如 .BR write (2), .BR writev (2), .BR sendfile (2), .BR read (2), 和 .BR readv (2) 也可用來讀入(接收)和寫出(發送)數據. .PP .BR getsockname (2) 用於獲得本地套接字地址 .PP .BR getpeername (2) 用於獲得遠端套接字地址. .BR getsockopt (2) 和 .BR setsockopt (2) 用於設置或取得套接字或協議選項. .BR ioctl (2) 也可以用來設置或讀取一些其他選項. .PP .BR close (2) 關閉套接字. .BR shutdown (2) 關閉全雙工套接字連接的一部分. .PP 套接字不支持搜索,也不支持調用 .BR pread (2) 或 .BR pwrite (2) 進行非 0 位置的操作. 可以用 .BR fcntl (2). 設置 .B O_NONBLOCK 標誌來實現對套接字的非阻塞 I/O 操作 .B O_NONBLOCK 是從 accept 繼承來的,然後原來所有會阻塞的操作會返回 .BR EAGAIN . .BR connect (2) 在此情況下返回 .B EINPROGRESS 錯誤. 用戶可以通過 .BR poll (2) 或者 .BR select (2) 等待各種事件. .PP .TS tab(:) allbox; c s s l l l. I/O 事件 事件:輪詢標誌:發生事件 讀:POLLIN:T{ 新數據到達. T} 讀:POLLIN:T{ (對面向連接的套接字)建立連接成功 T} 讀:POLLHUP:T{ 另一端套接字發出斷開連接請求. T} 讀:POLLHUP:T{ (僅對面向連接協議)套接字寫的時候連接斷開. 同時發送 .B SIGPIPE. T} 寫:POLLOUT:T{ 套接字有充足的發送緩衝區用於寫入新數據. T} 讀/寫:T{ POLLIN| .br POLLOUT T}:T{ 發出的 .BR connect (2) 結束. T} 讀/寫:POLLERR:產生一個異步錯誤. 讀/寫:POLLHUP:對方已經單向關閉連接. 例外:POLLPRI:T{ 緊急數據到達.然後發送 .B SIGURG. T} .\" XXX not true currently .\" It is no I/O event when the connection .\" is broken from the local end using .\" .BR shutdown (2) .\" or .\" .BR close (2) .\" . .TE .PP 另外一個的 poll/select 方法是讓內核用 .B SIGIO 信號來通知應用程序. 要這麼用的話你必須用 .BR fcntl (2) 設置套接字文件描述符的 .B FASYNC 標誌,並用 .BR sigaction (2). 給 .B SIGIO 信號設置一個的有效信號處理句柄.參看下面的 .I SIGNALS 的討論. .SH 套接字選項 套接字選項可以用 .BR setsockopt (2) 來設置,用 .BR getsockopt (2) 讀取所有套接字級別設爲 .B SOL_SOCKET 的套接字的套接字選項: .TP .B SO_KEEPALIVE 允許在面向連接的套接字上發送 keep\-alive 消息的功能.是一個布爾整數. .TP .B SO_OOBINLINE 如果打開這個選項,帶外(Out\-of\-Band)數據可以直接放入接收數據流。 否則,只有接收時打開 .B MSG_OOB 標誌, 才接收帶外數據. .\" don't document it because it can do too much harm. .\".B SO_NO_CHECK .TP .BR SO_RCVLOWAT " 和 " SO_SNDLOWAT 聲明在開始向協議 .RB ( SO_SNDLOWAT ) 或正在接收數據的用戶 .RB ( SO_RCVLOWAT ). 傳遞數據之前緩衝區內的最小字節數. 在 Linux 中這兩個值是不可改變的, 固定爲 1 字節. 可以用 .B getsockopt 用來讀取它們的值; .B setsockopt 總是返回 .BR ENOPROTOOPT . .TP .BR SO_RCVTIMEO " 和 " SO_SNDTIMEO 發送和接收時的超時設定, 並在超時時報錯. 在 Linux 中由 協議指定, 不能被讀寫. 它們的功能可用 .BR alarm (2) 或者 .BR setitimer (2). 來模擬. .TP .B SO_BSDCOMPAT 允許 BSD 的 bug\-to\-bug 兼容. 這一項只能在 UDP 協議模塊中使用而 且今後將要取消. 如果允許的話, UDP 套接字接收到的 ICMP 錯誤將不 會被傳送至用戶程序. Linux 2.0 中對於原始套接字也允許 BSD bug\-to\-bug 兼容(報頭隨機改變,省略廣播標識),但在 Linux 2.2 中取消了這一項. 修改用戶程序的方式比較好. .TP .B SO_PASSCRED 允許或關閉 .B SCM_CREDENTIALS 控制消息的接收. 更多信息參見 .BR unix (7). .TP .B SO_PEERCRED 返回連接至此套接字的外部進程的身份驗證. 只在 .B PF_UNIX 套接字中有用.參見 .BR unix (7). 參數爲 .B ucred 結構.只在 .BR getsockopt . 中有效. .TP .B SO_BINDTODEVICE 將此套接字綁定到一個特定的設備上, 如\(lqeth0\(rq, 做爲指定的接口名字傳遞. 如果名稱是空字符串或此項長度爲 0, 則套接字設備綁定被取消. 過去的選項是一個變長的空零結尾的 接口名稱的字符串, 其最大長度爲 .BR IFNAMSIZ . 如果一個套接字被綁定至一接口, 只有由這個特定接口接收的信息包可以由此套接字處理. .TP .B SO_DEBUG 允許套接字調試.只對有 .B CAP_NET_ADMIN 功能或有效用戶標識爲 0 的進程有效. .TP .B SO_REUSEADDR 表示在一個 .BR bind (2) 調用中對提供給它的地址使用的確認規則應該允許重複使用本地地址. 對於 .B PF_INET 套接字, 這表示該套接字可以綁定, 除非已有一個活躍的偵聽套 接口綁定到此地址上. 如果這個偵聽套接字和一個指定端口綁定爲 .B INADDR_ANY 時, 它就不能再綁定到任何本地地址的此端口. .TP .B SO_TYPE 按整數返回套接字類型(如 .BR SOCK_STREAM ) 只能通過 .BR getsockopt 讀取. .TP .B SO_DONTROUTE 不通過網關發送, 只能發送給直接連接的主機.可以通過在套接字的 .BR send (2) 操作上設置 .B MSG_DONTROUTE 標誌來實現相同的效果. 其值爲布爾型整數的標識. .TP .B SO_BROADCAST 設置或獲取廣播標識. 當選擇此選項時, 數據報套接字接收向 廣播地址發送的數據包, 並且可以向廣播地址發送數據包. 這一 選項對於面向流的套接字無效. .TP .B SO_SNDBUF 設置或得到套接字發送緩衝區的最大字節數. 其默認值由 .B wmem_default sysctl 設置,最大允許值由 .B wmem_max sysctl 設置. .TP .B SO_RCVBUF 設置或得到套接字接收緩衝區的最大字節數。其默認值由 .B rmem_default sysctl設置,最大允許值由 .B rmem_max sysctl 設置. .TP .B SO_LINGER 設置或獲取 .B SO_LINGER 選項的值. 其參數爲 .B linger 結構. .PP .RS .nf .ta 4n 10n 22n struct linger { int l_onoff; /* 延時狀態(打開/關閉) */ int l_linger; /* 延時多長時間 */ }; .ta .fi .RE .IP 如果選擇此選項, .BR close (2) 或 .BR shutdown (2) 將等到所有套接字裏排隊的消息成功發送或到達延遲時間後 纔會返回. 否則, 調用將立即返回. 而 closing 操作將在後臺 進行. 如果套接字是 .BR exit (2), 的一部分關閉時, 它總是在後臺延遲進行的. .TP .B SO_PRIORITY 設置在此套接字發送的所有包的協議定義優先權. Linux 通過這一值來排列網絡隊列: 根據所選設備排隊規則, 具有更高優先權的包可以先被處理.對於 .BR ip (7), 同時也設置了輸出包的 IP 服務類型(TOS)的域. .TP .B SO_ERROR 取得並清除未解決的套接字錯誤. 只有在 .BR getsockopt . 時有效. 是一個整數值. .SH SIGNALS 當向一個已關閉(被本地或遠程終端)的面向聯接的套接字寫入時, 將向該寫入進程發送 .B SIGPIPE 信號,並返回 .B EPIPE . 如果寫入命令聲明瞭 .B MSG_NOSIGNAL 標識時, 不會發出此信號. .PP 如果與 .B FIOCSETOWN fcntl 或 .B SIOCSPGRP ioctl 一起請求,那麼當發生 I/O 事件時發出 .B SIGIO 這樣我們就可以在信號句柄裏使用 .BR poll (2) 或 .BR select (2) 找出發生事件的套接字. 另一種選擇(在 Linux 2.2 中)是用 .B F_SETSIG fcntl 設置一個實時信號: 實時信號的處理程序被調用時還會收到它的 .IR siginfo_t 的 .I si_fd 區域中的文件描述符. 更多信息參見 .BR fcntl (2) .PP 在某些環境中(例如:多個進程訪問單個套接字), 引發 .B SIGIO 的東西在進程對信號作出反應時可能已經消失了. 如果這樣的話, 進程應該再次等待, 因爲 Linux 稍後會重發此信號. .\" .SH輔助消息 .SH SYSCTLS 可以通過目錄 .B /proc/sys/net/core/* 下的文件或者用 .BR sysctl (2) 系統調用來訪問內核套接字的網絡系統控制(sysctl)信息. .TP .B rmem_default 指明套接字接收緩衝區的默認字節數. .TP .B rmem_max 指明套接字接收緩衝區的最大字節數, 用戶可以通過使用 .B SO_RCVBUF 套接字選項來設置此值. .TP .B wmem_default 指明套接字發送緩衝區的默認字節數. .TP .B wmem_max 指明發送緩衝區的最大字節數,用戶可以通過使用套接字的 .B SO_SNDBUF 選項來設置它的值. .TP .BR message_cost " 和 " message_burst 設定記號存儲桶過濾器, 在存儲桶中保存一定數量的外部網絡 事件導致的警告消息. .TP .B netdev_max_backlog 在全局輸入隊列中包的最大數目. .TP .B optmem_max 每個套接字的象 iovecs 這樣的輔助數據和用戶控制數據的最大長度. .\" netdev_fastroute 沒有介紹 .SH IOCTLS 以上的 IO 控制值可以通過 .BR ioctl (2) 來訪問: .RS .nf .IB error " = ioctl(" ip_socket ", " ioctl_type ", " &value_result ");" .fi .RE .TP .B SIOCGSTAMP 返回 .B timeval 類型的結構,其中包括有發送給用戶的最後一個包接收時的時間戳。 被用來測量精確的 RTT (round trip time) 時間. .BR "struct timeval" . 結構說明請參考 .BR setitimer (2) .\" .TP .BR SIOCSPGRP 在異步 IO 操作結束或者接收到緊急數據時,用來設置進程或進程組, 向它(它們)發送 .B SIGIO 或者 .B SIGURG 信號, 參數爲指向 .BR pid_t . 類型的指針。如果參數爲正,則發送信號到相應的進程。如果參數爲 負,則發送信號到此參數絕對值 id 所屬的進程組的所有進程。 如果它沒有 .B CAP_KILL 功能或者它的有效 UID 不是 0, 進程只能選擇它自己或自己的進程組來 接收信號. .TP .B FIOASYNC 改變 .B O_ASYNC 標誌來打開或者關閉套接字的異步 IO 模式。異步IO模式指的是:當 新的 I/O 事件發生時,將發出 .B SIGIO 信號或者用 .B F_SETSIG 設置的信號. .IP 參數爲整形布爾量. .\" .TP .BR SIOCGPGRP 獲得當前接收 .B SIGIO 或者 .B SIGURG 信號的進程或者進程組, 如果兩個信號都沒有設置, 則爲 0. .PP 有效的 fcntl: .TP .BR FIOCGETOWN 與 IO 控制中的 SIOCGPGRP 相同. .TP .BR FIOCSETOWN 與 IO 控制中的 SIOCSPGRP 相同. .SH 注意 Linux 假設有一半的發送/接收緩衝區是用來處理內核結構, 因此, 系統控制的緩衝區是網絡可訪問的緩衝區的兩倍. .SH 缺陷 .B CONFIG_FILTER 沒有介紹 .B SO_ATTACH_FILTER 和 .B SO_DETACH_FILTER 套接字選項. 在 libpcap 庫有此接口的說明 .SH VERSIONS 版本 .B SO_BINDTODEVICE 在 Linux 2.0.30 中引入. .B SO_PASSCRED 是在 Linux 2.2 中引入的新選項. sysctl 是在 Linux 2.2. 中引入的新概念。 .SH 作者 本手冊頁由 Andi Kleen 編寫. .PP .SH 又見 .BR socket (2), .BR ip (7), .BR setsockopt (2), .BR getsockopt (2), .BR packet (7), .BR ddp (7) .SH "[中文版維護人]" .B liguoping .SH "[中文版最新更新]" .BR 2000/11/06 .SH "《中國linux論壇man手冊頁翻譯計劃》:" .BI http://cmpp.linuxforum.net .SH "跋" .br 本頁面中文版由中文 man 手冊頁計劃提供。 .br 中文 man 手冊頁計劃:\fBhttps://github.com/man-pages-zh/manpages-zh\fR