2009年12月16日星期三

什么是 socket?

什么是 socket?
  你经常听到人们谈论着
"socket",或许你还不知道它的确切含义。现在让我告诉你:它是使用 标准Unix
文件描述符 (file descriptor) 和其它程序通讯的方式。
什么?

struct sockaddr.。这个结构 为许多类型的套接字储存套接字地址信息:
struct sockaddr {
   unsigned short sa_family; /* 地址家族, AF_xxx */
   char sa_data[14]; /*14字节协议地址*/
   };
sa_family 能够是各种各样的类型,但是在这篇文章中都是 "AF_INET"。
sa_data包含套接字中的目标地址和端口信息。这好像有点 不明智。
为了处理struct sockaddr,程序员创造了一个并列的结构: struct sockaddr_in
("in" 代表 "Internet"。)
struct sockaddr_in {
   short int sin_family; /* 通信类型 */
   unsigned short int sin_port; /* 端口 */
   struct in_addr sin_addr; /* Internet 地址 */
   unsigned char sin_zero[8]; /* 与sockaddr结构的长度相同*/
   };
用这个数据结构可以轻松处理套接字地址的基本元素。

一个指向 sockaddr_in结构体的指针也可以被指向结构体sockaddr并且代替它。这
样的话即使 socket() 想要的是 struct sockaddr *,你仍然可以使用 struct
sockaddr_in,并且在最后转换。同时,注意 sin_family 和 struct sockaddr 中的
sa_family 一致并能够设置为 "AF_INET"。最后,sin_port和 sin_addr
必须是网络字节顺序 (Network Byte Order)!
htons()--"Host to Network Short"
  htonl()--"Host to Network Long"
  ntohs()--"Network to Host Short"
  ntohl()--"Network to Host Long"
为什么在数据结构 struct sockaddr_in 中, sin_addr 和 sin_port
需要转换为网络字节顺序,而sin_family 需不需要呢? 答案是: sin_addr 和
sin_port 分别封装在包的 IP 和 UDP 层。因此,它们必须要
是网络字节顺序。但是 sin_family 域只是被内核 (kernel) 使用来决定在数
据结构中包含什么类型的地址,所以它必须是本机字节顺序。同时, sin_family
没有发送到网络上,它们可以是本机字节顺序。

IP 地址和如何处理它们
现在我们很幸运,因为我们有很多的函数来方便地操作 IP 地址。没有
必要用手工计算它们,也没有必要用"<<"操作来储存成长整字型。
首先,假设你已经有了一个sockaddr_in结构体ina,你有一个IP地
址"132.241.5.10"要储存在其中,你就要用到函数inet_addr(),将IP地址从
点数格式转换成无符号长整型。使用方法如下:
ina.sin_addr.s_addr = inet_addr("132.241.5.10");
注意,inet_addr()返回的地址已经是网络字节格式,所以你无需再调用
函数htonl()。
我们现在发现上面的代码片断不是十分完整的,因为它没有错误检查。
显而易见,当inet_addr()发生错误时返回-1。记住这些二进制数字?(无符
号数)-1仅仅和IP地址255.255.255.255相符合!这可是广播地址!大错特
错!记住要先进行错误检查。
好了,现在你可以将IP地址转换成长整型了。有没有其相反的方法呢?
它可以将一个in_addr结构体输出成点数格式?这样的话,你就要用到函数
inet_ntoa()("ntoa"的含义是"network to ascii"),就像这样:
printf("%s",inet_ntoa(ina.sin_addr));
它将输出IP地址。需要注意的是inet_ntoa()将结构体in-addr作为一
个参数,不是长整形。同样需要注意的是它返回的是一个指向一个字符的
指针。它是一个由inet_ntoa()控制的静态的固定的指针,所以每次调用
inet_ntoa(),它就将覆盖上次调用时所得的IP地址。

没有评论: