linux网络编程-套接字

套接字

在Linux环境下,socket用于表示进程间网络通信的特殊文件类型本质为内核借助缓冲区形成的伪文件。

既然是文件,那么理所当然的可以使用文件描述符引用套接字。与管道类似,Linux系统将其封装成文件的目的是为了统一接口,使得读写套接字和读写文件的操作一致。区别是管道主要应用于本地进程间通信,而套接字多应用于网络进程间数据的传递。

在TCP/IP协议中,IP地址+TCP或UDP端口号唯一标识网络通讯中的一个进程。IP地址+端口号就对应一个socket。欲建立连接的两个进程各自有一个socket来标识,那么这两个socket组成的socket pair就唯一标识一个连接。因此可以用Socket来描述网络连接的一对一关系。

套接字通信原理如下图所示:

套接字通信原理在网络通信中,套接字一定是成对出现的。 一端的发送缓冲区对应对端的接收缓冲区。使用同一个文件描述符绑定发送缓冲区和接收缓冲区。

一个文件描述符指向一个套接字(该套接字内部由内核借助两个缓冲区实现)。

网络字节序

内存中的多字节数据相对于内存地址有大端和小端之分,磁盘文件中的多字节数据相对于文件中的偏移地址也有大端小端之分。网络数据流同样有大端小端之分,定义网络数据流的地址过程:发送主机通常将发送缓冲区中的数据按内存地址从低到高的顺序发出,接收主机把从网络上接到的字节依次保存在接收缓冲区中,也是按内存地址从低到高的顺序保存,因此,网络数据流的地址规定为:先发出的数据是低地址,后发出的数据是高地址。

  • 小端法: 高位存在高地址, 低位存在低地址(计算机本地采用)

  • 大端法: 高位存在低地址, 低位存在高地址(网络通信采用)

TCP/IP协议规定,网络数据流应采用大端字节序,即低地址高字节。例如,在UDP段格式,地址0-1是16位的源端口号,如果这个端口号是1000(0x3e8),则地址0是0x03,地址1是0xe8,也就是先发0x03,再发0xe8,这16位在发送主机的缓冲区中也应该是低地址存0x03,高地址存0xe8。但是,如果发送主机是小端字节序的,这16位被解释成0xe803,而不是1000。因此,发送主机把1000填到发送缓冲区之前需要做字节序的转换。

为使网络程序具有可移植性,使同样的C代码在大端和小端计算机上编译后都能正常运行,可以调用以下库函数做网络字节序和主机字节序的转换

1
2
3
4
5
6
#include<arpa/inet.h>
//h表示host,n表示network,l表示32位长整数,s表示16位短整数。
uint32_t htonl(uint32_t hostlong); //主要针对IP(host to network)
uint16_t htons(uint16_t hostshort); //主要针对port
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);

如果主机是小端字节序,这些函数将参数做相应的大小端转换然后返回,如果主机是大端字节序,这些函数不做转换,将参数原封不动地返回。

IP地址转换函数

由于如192.168.45.2的IP地址为点分十进制表示, 需要转化为uint32_t型, 有现成的函数(IPv4和IPv6都可以转换,函数接口是void *addrptr):

1
2
3
4
5
6
7
8
9
10
11
int inet_pton(int af,const char* src,void* dst);//p表示点分十进制的ip,n为网络上的二进制ip
//参数 af: AF_INET/AF_INET6
//src:传入参数, 待转换的点分十进制的IP地址
//dst:传出参数, 转换后符合网络字节序的IP地址
//返回值:成功返回1,若参2无效返回0(异常),失败返回-1

const char* inet_ntop(int af,const char* src,char* dst,socklen_t size);
//src:传入参数, 待转换的网络字节序的IP地址
//dst:传出参数, 转换后的点分十进制IP地址, 是一块缓冲区
//size指定了缓冲区的大小
//返回值:成功返回dst指针,失败返回NULL指针, 设置errorno

sockaddr地址结构

Pv4和IPv6的地址格式定义在netinet/in.h中,IPv4地址用sockaddr_in结构体表示,包括16位端口号和32位IP地址,IPv6地址用sockaddr_in6结构体表示,包括16位端口号、128位IP地址和一些控制字段。UNIX Domain Socket的地址格式定义在sys/un.h中,用sock-addr_un结构体表示。

sockaddr地址结构

bind函数原型:

1
2
3
4
5
6
7
#include<sys/types.h>
#include<sys/socket.h>
int bind(int sockfd,const struct sockaddr* addr,socklen_t addrlen);

/*struct sockaddr是早已废弃的数据结构,已不再使用,用新的需要强转*/
struct sockaddr_in addr;
int bind(int sockfd,(struct sockaddr*)&addr,size);

sockaddr_in相关定义:

1
2
3
4
5
6
7
8
9
/*相关结构体定义,在man 7 ip*/
struct sockaddr_in{
sa_family_t sin_family;
in_port_t sin_port;
struct in_addr sin_addr;
};
struct in_addr{
uint32_t s_addr;
};

初始化方法:

1
2
3
4
5
6
7
8
9
addr.sin_family=AF_INET/AF_INET6;
addr.sin_port=htons(9527); //端口号为short类型(16bit)

int dst;
inet_pton(AF_INET,"192.168.10.2",(void*)&dst);
addr.sin_addr.s_addr=dst;

/*或者采取下面的方法*/
addr.sin_addr.s_addr=htonl(INADDR_ANY) //取出系统中任意有效的IP地址