Socket 【网络通信,socket网络通信


一、简述

关于网络通信,我们目前接触到的 iOS 网络编程层次接口由浅及深可以分为以下三层:

Cocoa 层:最顶层也是最高级的,基于 OC 的 API,比如 URL 访问,NSStream,Bonjour,GameKit等,这是大多数情况下我们常用的  API。Cocoa 层是基于 Core Foundation 实现的。封装性极强,开发效率高,执行效率偏低。(但在现如今设备的 CPU、内存 已经十分强大的基础下,使用 Cocoa 层的接口进行网络编程,也并非会牺牲太多的执行时间,效率也是非常可观的。)

Core Foundation 层:基于 C 的 CFNetwork 和 CFNetServices。因为直接使用 socket 需要更多的编程工作,所以苹果对 OS 层的 Socket 进行简单的封装以简化编程任务。该层提供了 CFNetwork 和 CFNetServices,其中 CFNetwork 又是基于 CFStream 和 CFSocket。

OS 层:基于 C 的 BSD Socket。BSD Socket 也就是我们通常说的“伯克利套接字”,最底层的 BSD Socket 提供了对网络编程最大程度的控制,但是编程工作也是最多的。因此,苹果建议我们使用 Core Foundation 及以上层的 API 进行编程。


本文主要是来从最底层 Socket 去分析网络通信的。


如果不够清晰,那么看下面的解释:


上图是 OSI 网络七层协议。每层都建立在低一层的基础之上。首先我们要先来了解一下 TCP/IP 协议。

我们知道网络层的 IP 地址可以唯一标示主机,而传输层协议和端口号可以唯一标示主机的一个进程,这样我们可以利用 IP 地址+协议+端口号 唯一标示网络中的一个进程。那么接下来我们就要用到 Socket 进行网路通信了。

Socket 其实可以看做是传输层和应用层之间的一个抽象层。他将复杂的 TCP/IP 协议转化成几个简单的接口供应用层调用已实现进程在网络中的通信。也就是说 Socket 并不是一个协议,实际上是对 TCP/IP 协议的封装,Socket 就是一个调用接口(API)而已。通过 Socket 我们才能使用 TCP/IP 协议。有一句比较容易理解的话:“TCP/IP只是一个协议栈,就像操作系统的运行机制一样,必须要具体实现,同时还要提供对外的操作接口。”


二、Socket 编程 API (参考 Linux Socket 编程)

(1)socket 函数

int socket(int domain, int type, int protocol);

socket函数对应于普通文件的打开操作。普通文件的打开操作返回一个文件描述字,而socket()用于创建一个socket描述符(socket descriptor),它唯一标识一个socket。这个socket描述字跟文件描述字一样,后续的操作都有用到它,把它作为参数,通过它来进行一些读写操作。

正如可以给fopen的传入不同参数值,以打开不同的文件。创建socket的时候,也可以指定不同的参数创建不同的socket描述符,socket函数的三个参数分别为:

  • domain:即协议域,又称为协议族(family)。常用的协议族有,AF_INETAF_INET6AF_LOCAL(或称AF_UNIX,Unix域socket)、AF_ROUTE等等。协议族决定了socket的地址类型,在通信中必须采用对应的地址,如AF_INET决定了要用ipv4地址(32位的)与端口号(16位的)的组合、AF_UNIX决定了要用一个绝对路径名作为地址。
  • type:指定socket类型。常用的socket类型有,SOCK_STREAMSOCK_DGRAMSOCK_RAWSOCK_PACKETSOCK_SEQPACKET等等(socket的类型有哪些?)。
  • protocol:故名思意,就是指定协议。常用的协议有,IPPROTO_TCPIPPTOTO_UDPIPPROTO_SCTPIPPROTO_TIPC等,它们分别对应TCP传输协议、UDP传输协议、STCP传输协议、TIPC传输协议(这个协议我将会单独开篇讨论!)。

注意:并不是上面的type和protocol可以随意组合的,如SOCK_STREAM不可以跟IPPROTO_UDP组合。当protocol为0时,会自动选择type类型对应的默认协议。

当我们调用socket创建一个socket时,返回的socket描述字它存在于协议族(address family,AF_XXX)空间中,但没有一个具体的地址。如果想要给它赋值一个地址,就必须调用bind()函数,否则就当调用connect()listen()时系统会自动随机分配一个端口。

(2)bind 函数

正如上面所说 bind() 函数把一个地址族中的特定地址赋给socket。例如对应AF_INETAF_INET6就是把一个ipv4或ipv6地址和端口号组合赋给socket。

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

函数的三个参数分别为:

  • sockfd:即socket描述字,它是通过socket()函数创建了,唯一标识一个socket。bind()函数就是将给这个描述字绑定一个名字。
  • addr:一个const struct sockaddr *指针,指向要绑定给sockfd的协议地址。这个地址结构根据地址创建socket时的地址协议族的不同而不同,如ipv4对应的是: 
    struct sockaddr_in {
        sa_family_t    sin_family; /* address family: AF_INET */
        in_port_t      sin_port;   /* port in network byte order */
        struct in_addr sin_addr;   /* internet address */
    };
    
    /* Internet address. */
    struct in_addr {
        uint32_t       s_addr;     /* address in network byte order */
    };
    ipv6对应的是: 
    struct sockaddr_in6 { 
        sa_family_t     sin6_family;   /* AF_INET6 */ 
        in_port_t       sin6_port;     /* port number */ 
        uint32_t        sin6_flowinfo; /* IPv6 flow information */ 
        struct in6_addr sin6_addr;     /* IPv6 address */ 
        uint32_t        sin6_scope_id; /* Scope ID (new in 2.4) */ 
    };
    
    struct in6_addr { 
        unsigned char   s6_addr[16];   /* IPv6 address */ 
    };
    Unix域对应的是: 
    #define UNIX_PATH_MAX    108
    
    struct sockaddr_un { 
        sa_family_t sun_family;               /* AF_UNIX */ 
        char        sun_path[UNIX_PATH_MAX];  /* pathname */ 
    };
  • addrlen:对应的是地址的长度。

通常服务器在启动的时候都会绑定一个众所周知的地址(如ip地址+端口号),用于提供服务,客户就可以通过它来接连服务器;而客户端就不用指定,有系统自动分配一个端口号和自身的ip地址组合。这就是为什么通常服务器端在listen之前会调用bind(),而客户端就不会调用,而是在connect()时由系统随机生成一个。

网络字节序与主机字节序

主机字节序就是我们平常说的大端和小端模式:不同的CPU有不同的字节序类型,这些字节序是指整数在内存中保存的顺序,这个叫做主机序。引用标准的Big-Endian和Little-Endian的定义如下:

  a) Little-Endian就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。

  b) Big-Endian就是高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。

网络字节序:4个字节的32 bit值以下面的次序传输:首先是0~7bit,其次8~15bit,然后16~23bit,最后是24~31bit。这种传输次序称作大端字节序。由于TCP/IP首部中所有的二进制整数在网络中传输时都要求以这种次序,因此它又称作网络字节序。字节序,顾名思义字节的顺序,就是大于一个字节类型的数据在内存中的存放顺序,一个字节的数据没有顺序的问题了。

所以:在将一个地址绑定到socket的时候,请先将主机字节序转换成为网络字节序,而不要假定主机字节序跟网络字节序一样使用的是Big-Endian。由于这个问题曾引发过血案!公司项目代码中由于存在这个问题,导致了很多莫名其妙的问题,所以请谨记对主机字节序不要做任何假定,务必将其转化为网络字节序再赋给socket。


(3)listen、connect 函数

如果作为一个服务器,在调用socket()bind()之后就会调用listen()来监听这个socket,如果客户端这时调用connect()发出连接请求,服务器端就会接收到这个请求。

int listen(int sockfd, int backlog);
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

listen函数的第一个参数即为要监听的socket描述字,第二个参数为相应socket可以排队的最大连接个数。socket()函数创建的socket默认是一个主动类型的,listen函数将socket变为被动类型的,等待客户的连接请求。

connect函数的第一个参数即为客户端的socket描述字,第二参数为服务器的socket地址,第三个参数为socket地址的长度。客户端通过调用connect函数来建立与TCP服务器的连接。

(4)accept 函数

TCP服务器端依次调用socket()bind()listen()之后,就会监听指定的socket地址了。TCP客户端依次调用socket()connect()之后就想TCP服务器发送了一个连接请求。TCP服务器监听到这个请求之后,就会调用accept()函数取接收请求,这样连接就建立好了。之后就可以开始网络I/O操作了,即类同于普通文件的读写I/O操作。

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

accept函数的第一个参数为服务器的socket描述字,第二个参数为指向struct sockaddr *的指针,用于返回客户端的协议地址,第三个参数为协议地址的长度。如果accpet成功,那么其返回值是由内核自动生成的一个全新的描述字,代表与返回客户的TCP连接。

注意:accept的第一个参数为服务器的socket描述字,是服务器开始调用socket()函数生成的,称为监听socket描述字;而accept函数返回的是已连接的socket描述字。一个服务器通常通常仅仅只创建一个监听socket描述字,它在该服务器的生命周期内一直存在。内核为每个由服务器进程接受的客户连接创建了一个已连接socket描述字,当服务器完成了对某个客户的服务,相应的已连接socket描述字就被关闭。

(5)read、write 函数

万事具备只欠东风,至此服务器与客户已经建立好连接了。可以调用网络I/O进行读写操作了,即实现了网咯中不同进程之间的通信!网络I/O操作有下面几组:

  • read()/write()
  • recv()/send()
  • readv()/writev()
  • recvmsg()/sendmsg()
  • recvfrom()/sendto()

我推荐使用recvmsg()/sendmsg()函数,这两个函数是最通用的I/O函数,实际上可以把上面的其它函数都替换成这两个函数。它们的声明如下:

       #include <unistd.h>

       ssize_t read(int fd, void *buf, size_t count);
       ssize_t write(int fd, const void *buf, size_t count);

       #include <sys/types.h>
       #include <sys/socket.h>

       ssize_t send(int sockfd, const void *buf, size_t len, int flags);
       ssize_t recv(int sockfd, void *buf, size_t len, int flags);

       ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,
                      const struct sockaddr *dest_addr, socklen_t addrlen);
       ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,
                        struct sockaddr *src_addr, socklen_t *addrlen);

       ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags);
       ssize_t recvmsg(int sockfd, struct msghdr *msg, int flags);

read函数是负责从fd中读取内容.当读成功时,read返回实际所读的字节数,如果返回的值是0表示已经读到文件的结束了,小于0表示出现了错误。如果错误为EINTR说明读是由中断引起的,如果是ECONNREST表示网络连接出了问题。

write函数将buf中的nbytes字节内容写入文件描述符fd.成功时返回写的字节数。失败时返回-1,并设置errno变量。 在网络程序中,当我们向套接字文件描述符写时有俩种可能。     

    01 - write的返回值大于0,表示写了部分或者是全部的数据。

    02 - 返回的值小于0,此时出现了错误。我们要根据错误类型来处理。如果错误为EINTR表示在写的时候出现了中断错误。如果为EPIPE表示网络连接出现了问题(对方已经关闭了连接)。

其它的我就不一一介绍这几对I/O函数了,具体参见man文档或者baidu、Google,下面的例子中将使用到send/recv。

(6)close 函数

在服务器与客户端建立连接之后,会进行一些读写操作,完成了读写操作就要关闭相应的socket描述字,好比操作完打开的文件要调用fclose关闭打开的文件。

#include <unistd.h>
int close(int fd);

close一个TCP socket的缺省行为时把该socket标记为以关闭,然后立即返回到调用进程。该描述字不能再由调用进程使用,也就是说不能再作为read或write的第一个参数。

注意:close操作只是使相应socket描述字的引用计数-1,只有当引用计数为0的时候,才会触发TCP客户端向服务器发送终止连接请求。


三、示例参考

     ViewController.m  
//  Socket  
//  
//  Created by CoderZYWang on 2017/3/1.  
//  Copyright © 2017年 CoderZYWang_mac. All rights reserved.  
//  
  
/** 
 客户端 socket 网络请求流程 
 (1)客户端调用 socket(...) 创建socket; 
 (2)客户端调用 connect(...) 向服务器发起连接请求以建立连接; 
 (3)客户端与服务器建立连接之后,就可以通过 send(...)/receive(...) 向客户端发送或从客户端接收数据; 
 (4)客户端调用 close 关闭 socket; 
 */  
  
#import "ViewController.h"  
  
#import <arpa/inet.h> // 提供IP地址转换函数  
#import <netdb.h> // 提供设置及获取域名的函数  
  
@interface ViewController ()  
  
@end  
  
@implementation ViewController  
  
- (void)viewDidLoad {  
    [super viewDidLoad];  
    // Do any additional setup after loading the view, typically from a nib.  
      
    // 创建线程  
    [self createThread];  
}  
  
/** 创建线程 */  
- (void)createThread {  
    // connect/recv/send 等接口都是阻塞式的,因此我们需要将这些操作放在非 UI 线程中进行  
    dispatch_async(dispatch_get_global_queue(0, 0), ^{  
        [self loadDataWithUrl:[NSURL URLWithString:@"域名"]];  
        // 默认端口号 http 80  http 443  
    });  
}  
  
/** 请求数据 */  
- (void)loadDataWithUrl:(NSURL *)url {  
    NSString *host = [url host]; // 获取 url 主机地址  
    NSNumber *port = [url port]; // 获取 url 端口号  
      
//    int socket = socket(AF_INET6, SOCK_STREAM, 0); 不可以用 socket 命名,关键字会报错  
    // socket 的创建与初始化,返回该 socket 文件的描述符,如果为 -1 则表示该 socket 创建失败  
    int socketFileDescriptor = socket(AF_INET, SOCK_STREAM, 0); // 该函数基于 #import <arpa/inet.h>  
      
    if (socketFileDescriptor == -1) {  
        NSLog(@"socket 创建失败");  
        return;  
    }  
      
    // 从主机获取 IP 地址相关信息  
    struct hostent *remoteHostEnt = gethostbyname([host UTF8String]);  
      
    if (remoteHostEnt == NULL) {  
        close(socketFileDescriptor);  
        NSLog(@"无法解析仓库服务器的主机名");  
        return;  
    }  
      
    // 从主机地址结构体中获取服务器地址列表(h_addr_list 是 hostent 结构体中的参数)  
    struct in_addr *remoteInAddr = (struct in_addr *)remoteHostEnt -> h_addr_list[0];  
      
    // 设置套接字参数  
    struct sockaddr_in socketParameters;  
    socketParameters.sin_family = AF_INET; // sin_family指代协议族  
    socketParameters.sin_addr = *remoteInAddr; // h_addr_list[0] 属于二级指针。sin_addr 存储IP地址,使用in_addr这个数据结构  
    socketParameters.sin_port = htons([port intValue]); //  sin_port 存储端口号(使用网络字节顺序)  
      
    // 客户端向特定网络地址的服务器发送连接请求,连接成功返回 0,失败返回 -1。  
    // 当服务器建立好之后,客户端通过调用该接口向服务器发起建立连接请求。  
    // 对于 UDP 来说,该接口是可选的,如果调用了该接口,表明设置了该 UDP socket 默认的网络地址。  
    // 对 TCP socket来说这就是传说中三次握手建立连接发生的地方。  
    // 注意:该接口调用会阻塞当前线程,直到服务器返回  
    // connect(<#int#> 未连接的 socket, <#const struct sockaddr *#> socket 参数指针, <#socklen_t#> socket 参数长度)  
    int ret = connect(socketFileDescriptor, (struct sockaddr *)&socketParameters, sizeof(socketParameters));  
    if (ret == -1) {  
        close(socketFileDescriptor);  
        NSLog(@"socket 连接失败");  
        return;  
    }  
      
    // 如果程序走到这里,说明 socket 已经成功连接到服务器  
      
    // 持续从服务器获取数据,直到数据的结尾  
    NSMutableData *dataM = [NSMutableData data];  
      
    int maxCount = 6; // 遍历次数 (test)  
    int i = 0;  
    BOOL isNeedWaitReading = YES; // 是否需要继续读取数据  
    while (isNeedWaitReading && i < maxCount) {  
        const charchar *buffer[1024];  
        int length = sizeof(buffer);  
          
        // recv(<#int#> 接收端套接字描述符 其实就是 socket, <#void *#> 用来存放recv函数接收到的数据的缓冲区, <#size_t#> 指明buff的长度, <#int#> 一般为0)  
        // 注意 recv 函数仅仅是 copy 数据,真正的接收数据是协议来完成的  
          
        // 从套接字读取缓冲区的数据量,返回读取的字节数  
        long result = recv(socketFileDescriptor, &buffer, length, 0);  
          
        if (result > 0) {  
            [dataM appendBytes:buffer length:result];  
        } else { // 如果没有获得任何数据,就停止遍历  
            isNeedWaitReading = NO;  
        }  
        ++ i;  
    }  
      
//    const char * buffer[1024];  
//    int length = sizeof(buffer);  
//    long result = recv(socketFileDescriptor, &buffer, length, 0);  
//    [dataM appendBytes:buffer length:result];  
  
    close(socketFileDescriptor);  
      
    [self showData:dataM];  
}  
  
- (void)showData:(NSData *)data {  
    // 主线程拿到数据进行展示  
    dispatch_async(dispatch_get_main_queue(), ^{  
        NSLog(@"data --- %@", data);  
          
        NSString *dataStr = [[NSString alloc] initWithData:data encoding:NSUTF8StringEncoding];  
//        NSString *dataStr = [NSString stringdata];  
        NSLog(@"dataStr --- %@", dataStr);  
    });  
}  
  
- (void)didReceiveMemoryWarning {  
    [super didReceiveMemoryWarning];  
    // Dispose of any resources that can be recreated.  
}  
  
@end  


相关内容